MySQL之索引结构解读

 更新时间:2023年04月28日 10:01:26   作者:knowwait  
这篇文章主要介绍了MySQL之索引结构解读,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

MySQL索引是什么

MySQL索引就是帮助MySQL高效获取数据的数据结构。

这个数据结构也就是我们常说的二叉树、红黑树、Hash表等索引数据结构,借助这样的数据结构,相较于之前的全局遍历查询,能够更高效的进行查询。

简单复习一下一些常见的索引数据结构:

二叉树

上图是一个二叉树,他根据我们存放数据的顺序依次填充这个树结构,比根节点小的数放到左边,比根节点大的放在右边,这样我们去查找的时候不需要遍历所有数据,只需要依次与根节点以及下面的子节点对比就可以查找到我们要找的元素。

查找流程示例图:

根据这个动态图左上角的比对信息,可以很清楚的看到二叉树的查询逻辑,感兴趣的可以去这个网址实际模拟下:Data Structure Visualization

但是上述查询逻辑是在数据无大小规律存储的情况下进行查询的,如果我们的数据按照大小顺序存储会出现以下情况:这其实虽然叫二叉树但实际上已经是链表结构了,假如我们要查询较为底层的数据,还是要遍历全局。 

MySQL底层不是使用的二叉树结构。

红黑树

相较于上述的二叉树,红黑树做了相应的优化,他会根据存储的数据动态调整根节点保证树左右两边的平衡,红黑树也是一种平衡树。

下面来动态的看下他是如何存储数据的:

 可以明显的看到他动态调整树的结构,其实也就是减少了树的深度,相较于上面变为链式的二叉树,他的效率还是较高的,但是这仅仅适用于数据量不是很大的情况,如果数据量百万甚至千万,这个树的深度一样很深,查询起来效率依旧不高。所以MySQL底层也不是使用的红黑树结构。

那MySQL使用的那种数据结构来存储索引数据的呢?

B+Tree

MySQL底层其实是使用的B+Tree的数据结构存储的

这个结构相对于上述两种结构都有点复杂了,用更详细一点的图来表达可以这么看,他实际上还是树,但是一个树节点上不只有一个索引数据,只有最底层的叶子节点上才有数据(这个数据就是我们mysql表中的一列数据或者是mysql数据对应的磁盘地址),而其他节点只存储索引,也叫作冗余索引。

这样的索引结构有什么好处呢?

在我们创建数据库索引的时候,他会自动帮我们建立这样的B+Tree数据结构,上图假如我们要查询30那条数据(select * from table where column = 30),这个column就是我们创建索引的那一列,这样他会把根节点加载到内存中,根据二分法或者其他方式查找到30对应的区间地址,因为在内存中的查找运算要比查询磁盘要快的多

然后相应的再往下找到30所在的区间位置,遍历最后一个叶子节点就可以获取到30那条数据

那如果数据量过大,百万千万,树还会不会变得很深

我们说树的查询效率取决于树的深度,那这个在千万级数据量下会不会还有二叉树和红黑树一样的问题呢?

其实没有了,B+Tree是可以设置树的最大深度的,我们假设深度设置为3,看看能进行多少量级的数据查询。

因为在前面的两层节点中只存储了索引数据和子节点的磁盘位置,大大节省了存储空间,每个节点的存储大小是由mysql设置的分页参数决定的:一般是16kb

ps:页是InnoDB访问的最小单位,默认16KB。缓冲池是以页为管理单位,每次读取或刷新一页数据。参数: innodb_page_size,可以将页大小设置为4K,8K.

SHOW GLOBAL STATUS LIKE 'Innodb_page_size';

 而一个索引数据假设我们用的bigInt占用8个字节,两个索引元素之间的空间是下个节点的磁盘空间地址,占用6个字节,也就是一个索引+节点地址占用14b,那么16kb的空间可以存储数据量是1170个索引,同理第二个层级的每个节点是也是可以存储1170个索引,最后一层也就是第三层的节点因为存储的是实际每一列的数据,假设每列数据占用1kb,那每个节点占存储16个索引数据。

整个树的数据存储量为1170*1170*16=21,902,400,是个两千万量级的数据量。完全满足大数据量的需求。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • MySQL数据库命名规范及约定

    MySQL数据库命名规范及约定

    这篇文章主要介绍了MySQL数据库的操作规范及、表名约定、列名约定,需要的朋友可以参考下
    2014-03-03
  • 详解MySQL中如何定位阻塞语句

    详解MySQL中如何定位阻塞语句

    MySQL 阻塞是指在并发访问 MySQL 数据库时,某个事务占用了资源并且长时间不释放,导致其他事务无法执行或执行缓慢的情况,那如何排查和定位阻塞语句呢,下面来分析下吧
    2023-07-07
  • MySQL slow_log表无法修改成innodb引擎详解

    MySQL slow_log表无法修改成innodb引擎详解

    这篇文章主要给大家介绍了关于MySQL slow_log表无法修改成innodb引擎的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用MySQL具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-04-04
  • mysql中插入emoji表情失败的原因与解决

    mysql中插入emoji表情失败的原因与解决

    这篇文章主要给大家介绍了关于mysql中插入emoji表情失败的原因与解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-12-12
  • Mysql更换MyISAM存储引擎为Innodb的操作记录总结

    Mysql更换MyISAM存储引擎为Innodb的操作记录总结

    下面小编就为大家带来一篇Mysql更换MyISAM存储引擎为Innodb的操作记录总结。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-03-03
  • Mysql的SELECT语句与显示表结构详解

    Mysql的SELECT语句与显示表结构详解

    这篇文章主要介绍了Mysql的SELECT语句与显示表结构详解的相关资料,需要的朋友可以参考下
    2023-01-01
  • MySQL如何保证备份数据的一致性详解

    MySQL如何保证备份数据的一致性详解

    在高并发的场景下,大量的请求直接访问Mysql很容易造成性能问题,下面这篇文章主要给大家介绍了关于MySQL如何保证备份数据一致性的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2022-05-05
  • MySQL索引失效的几种情况图文详解

    MySQL索引失效的几种情况图文详解

    索引并不是时时都会生效的,在一起情况下将导致索引失效,这篇文章主要给大家介绍了关于MySQL索引失效的几种情况,文章通过图文介绍的非常详细,需要的朋友可以参考下
    2023-06-06
  • MySQL中数据库优化的常见sql语句总结

    MySQL中数据库优化的常见sql语句总结

    这篇文章主要为大家总结了一些MySQL中数据库优化的常见sql语句,文中的示例代码讲解详细,对我们学习MySQL有一定帮助,需要的可以参考一下
    2022-08-08
  • 数据库崩溃,利用备份和日志进行灾难恢复

    数据库崩溃,利用备份和日志进行灾难恢复

    我相信数据库崩溃都不是大家所愿意看到的,但是这种情况发生时我们要采取补救措施,本文就是介绍了如何利用备份和日志进行灾难恢复,需要的朋友可以参考下
    2015-07-07

最新评论