关于B+树的使用及说明

 更新时间:2025年06月30日 09:40:36   作者:找不到、了  
这篇文章主要介绍了关于B+树的使用及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

B+树是一种优化的B树结构,适用于数据库索引。它保证所有数据都在叶子节点,且叶子节点间有链接,便于数据检索。

数据结构如下所示:

1、B+树和N叉树

1.1、B+树的基本定义

B+树是一种平衡的多叉搜索树,广泛应用于数据库和文件系统的索引结构(如MySQL的InnoDB存储引擎)。

核心特点

  • 每个节点可以包含多个子节点(即N叉树)。
  • 所有叶子节点通过指针连接,形成一个有序链表。
  • 内部节点仅存储键值,数据(记录指针)仅存在于叶子节点。

1.2、B+树与N叉树的关系

1、N叉树

N叉树是指每个节点最多有NN个子节点的树结构。

  • 二叉树:每个节点最多有 2 个子节点(N=2)。
  • 三叉树:每个节点最多有 3 个子节点(N=3)。
  • B+树:每个节点最多有mm个子节点(N=m,其中mm是 B+树的阶数)。

2、B+树的节点结构

B+树的节点分为内部节点叶子节点。

1、内部节点(非叶子节点):

存储键值(Key)和子节点指针。每个节点最多有mm个子节点(N=m)。

2、叶子节点

存储键值数据指针(或实际数据)。所有叶子节点通过指针双向连接,形成有序链表。

1.3、B+树的N叉特性

1、阶数决定N的值

阶数m是 B+树的核心参数,表示:

  • 每个节点最多有m个子节点。
  • 每个节点最多存储m−1个键值。

示例

对于阶数m=5的 B+树:每个节点最多有 5 个子节点(N=5)。每个节点最多存储 4 个键值。

2、B+树的N叉特性

每个节点的子节点数量可变

  • 内部节点的子节点数在⌈m/2⌉到m之间(保持树的平衡)。
  • 叶子节点的子节点数为 0(无子节点)。

3、B+树被称为N叉树原因

直接原因:B+树的每个节点最多有mm个子节点(N=m),符合N叉树的定义。

根本原因

  • 多路平衡:B+树通过多路分支(N叉)减少树的高度,提高磁盘IO效率。
  • 阶数mm:B+树的性能与mm直接相关,mm越大,树越矮,查找路径越短。

示例:阶数m=3 的 B+树

        [10, 20]              // 内部节点(2个键值,3个子节点)
       /     |     \
[5, 8]      [15]      [25, 30] // 叶子节点(存储数据)
  • 内部节点:存储键值10、20,指向 3 个子节点。
  • 叶子节点:存储数据(如记录指针),并通过指针连接。

4、阶数和性能的影响

1.4、B+树与B树的区别

如下所示:

注意:

  • B+树是N叉树的一种,其阶数mm决定了每个节点的最大子节点数(N=m)。
  • 这种多叉结构是B+树在数据库和文件系统中广泛应用的核心原因。

2、B+树的查找元素

B+树中的所有数据均保存在叶子结点,且根结点和内部结点均只是充当控制查找记录的媒介,并不代表数据本身,所有的内部结点元素都同时存在于子结点中,是子节点元素中是最大(或最小)元素。

如下图所示:

例如B+树中查找55这个关键字,步骤如下:

1、在根节点中对比55和根节点中的元素[60, 85],发现55<60,因此应该在第一个结点中继续寻找;

2、比较55和第一个节点中的元素[10, 20, 50, 60],发现50<55<60,因此55应该存在于第四个结点当中;

3、继续对比55和第四个结点中的元素[55, 60],找到55,查找成功。当然,也有查找失败的情况,即要查找的元素并不在B+树中。

3、B+树的插入元素

其插入规则如下:

1、插入的操作全部都在叶子结点上进行,且不能破坏关键字自小而大的顺序;

2、当插入关键字后结点的关键字个数大于m,需要进行“分裂”。

B+树的插入有四种情况:

1、若被插入关键字所在的结点,其含有关键字数目小于m,则直接插入;

2、若被插入关键字所在的结点,其含有关键字数目等于m,则需要将这个结点分为左右两部分,中间的结点放到父节点中。假设其双亲结点中包含的关键字个数小于 m,则插入操作完成。

3、在第 2 种情况中,如果上移操作导致其双亲结点中关键字个数大于 M,则应继续分裂其双亲结点。

4、若插入的关键字比当前结点中的最大值还大,破坏了B+树中从根结点到当前结点的所有索引值,此时需要及时根节点、字节点,再做叶子节点插入操作。

举例:

1、插入关键字12,此时第一个叶子节点部分[10, 15]关键字的个数<m,可以直接插入:(紫色代表插入的元素)

2、插入95,需要插入到最后一个叶子节点部分[85, 91, 97]:

此时该节点的关键字个数大于m,需要进行分裂操作,并且父节点需要插入一个新的关键字:

3、插入40,需要插入到第二个叶子节点部分[21, 37, 44]:

此时该节点的关键字个数大于m,需要进行分裂操作,并且父节点需要插入一个新的关键字:

父节点插入新的关键字之后,根结点关键字的个数大于m,也需要进行分裂:

4、插入100,由于其值比最大值 97 还大,插入之后,从根结点到该结点经过的所有结点中的所有值都要由 97 改为 100。(橙色为修改之后的)

修改完最大值之后,在最后一个节点处插入100:

4、实际应用

4.1、Innodb引擎

MySQL数据表以文件方式存放在磁盘中,默认使用共享表空间(0)存储。

mysql使用共享表空间存储,所有表的数据和索引会存储在一个共享的 ibdata 文件中。表结构以.frm文件的形式存储在与表对应的文件夹中。

如果使用了独立表空间,InnoDB 会将每个表的结构和数据存储在独立的 .ibd 文件中。每当表的数据或索引被更新时,文件也会随之变化。表的结构仍然以.frm文件存储。

更多知识详细可参考:谈谈mysql的日志的用途

每个页节点段、非页节点段可参考如下:

注意:阶数由页大小(Page Size)决定(通常为 16KB)。

阶数计算示例

每个关键字(如主键)为 8 字节,指针为 6 字节。当磁盘块Page页大小为 16KB:

实际阶数约为 1170,树高度为 3 时可存储1170^3≈1.6亿条记录。

存储的计算公式:

4.2、文件系统

Linux 的 Ext4 文件系统

  • 使用 B+树管理目录项。
  • 阶数由块大小(4KB)和目录项大小决定。

总结

在数据库中通常不只是查询(select)一条记录,如果是多条记录的话,B树要做中序遍历,可能要跨层访问,而B+树由于所有的数据都在叶子节点,不用跨层,同时由于有链表结构只要找到首尾,就能通过链表把数据都读出来。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • mysql unix准换时间格式查找指定日期数据代码

    mysql unix准换时间格式查找指定日期数据代码

    这篇文章主要介绍了mysql unix准换时间格式查找指定日期数据,需要的朋友可以参考下
    2014-03-03
  • Mysql导入导出工具Mysqldump和Source命令用法详解

    Mysql导入导出工具Mysqldump和Source命令用法详解

    Mysql本身提供了命令行导出工具Mysqldump和Mysql Source导入命令进行SQL数据导入导出工作,通过Mysql命令行导出工具Mysqldump命令能够将Mysql数据导出为文本格式(txt)的SQL文件,通过Mysql Source命令能够将SQL文件导入Mysql数据库中,下面通过Mysql导入导出SQL实例详解Mysqldump和Source命令的用法
    2012-09-09
  • mysql中show指令使用方法详细介绍

    mysql中show指令使用方法详细介绍

    mysql中show指令使用过程中会经常遇到,在本文将为大家详细介绍下其具体的使用,需要的朋友不要错过
    2014-11-11
  • MySql多表链接查询详细教程

    MySql多表链接查询详细教程

    这篇文章主要介绍了MySql多表链接查询详细教程的相关资料,需要的朋友可以参考下
    2022-10-10
  • MySQL数据库INNODB表损坏修复处理过程分享

    MySQL数据库INNODB表损坏修复处理过程分享

    突然收到MySQL报警,从库的数据库挂了,一直在不停的重启,打开错误日志,发现有张表坏了。innodb表损坏不能通过repair table 等修复myisam的命令操作。现在记录下解决过程
    2013-08-08
  • 深入理解MySQL中MVCC与BufferPool缓存机制

    深入理解MySQL中MVCC与BufferPool缓存机制

    这篇文章主要介绍了深入理解MySQL中MVCC与BufferPool缓存机制,MySQL默认RR隔离级别就是通过该机制来保证的MVCC,更多主题相关内容,需要的可以参考下面文章内容介绍
    2022-05-05
  • MySQL数据库8——数据库中函数的应用详解

    MySQL数据库8——数据库中函数的应用详解

    这篇文章主要介绍了MySQL数据库8——数据库中函数的应用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-03-03
  • 本机连接虚拟机MYSQL的操作指南

    本机连接虚拟机MYSQL的操作指南

    要让本机(主机)连接到虚拟机上的 MySQL 数据库,你需要确保虚拟机和主机之间的网络连接正常,并且 MySQL 配置允许外部连接,本文给大家介绍了本机连接虚拟机MYSQL的操作指南,需要的朋友可以参考下
    2024-12-12
  • 数据库索引的知识点整理小结,你所需要了解的都在这儿了

    数据库索引的知识点整理小结,你所需要了解的都在这儿了

    这篇文章主要介绍了数据库索引的知识点整理小结,你所需要了解的都在这儿了,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-07-07
  • 解析mysql与Oracle update的区别

    解析mysql与Oracle update的区别

    本篇文章是对mysql与Oracle update的区别进行了详细的分析介绍,需要的朋友参考下
    2013-07-07

最新评论