B+树是一种树数据结构。B+树索引是B+树在数据库中的一种实现,是最常见也是数据库中使用最为频繁的一种索引。
先来了解一下什么是索引?
一、索引
数据都是存储在硬盘上的,查询数据不可避免的需要进行IO操作。
索引是一种数据结构,又称之为“键(key)”,是存储引擎用于快速找到记录的一种数据结构。类似于书的目录,在查询数据的时候先找目录再找数据,而不是一页一页的翻。索引的存在提升来查询速度,降低来IO操作。
在一张表中可以有多个索引,但索引也不是越多越好。索引虽然可以帮助提升查询速度,但也是有缺点的:
1:当表中有大量数据存在的前提下,创建索引的速度会很慢
2:在索引创建完毕后,对表的查询性能会大幅度提升,但写的性能也会大幅度降低
因此索引不能随便的创建。
二、B+树
如图所示,这就是一个B+树,在非叶子结点上,存储的是一定范围内索引id对应的磁盘地址,叶子结点上存储的是具体的数据。
B+树之所以这么做的意义在于:树一个节点就是一个页,而数据库中页的大小是固定的,所以在页大小固定的前提下,能往一个页中放入更多的节点,相应的树的阶数(节点的子节点树)就会更大,那么树的高度就更矮,如此一来我们查找数据进行磁盘的IO次数有会再次减少,数据查询的效率也会更快。
B+树中各个页之间是通过双向链表连接的,叶子节点中的数据是通过单向链表连接的。
B+树叶子节点的关键字从小到大有序排列,左边节点的结尾数据都会保存右边节点的开始数据的指针,就构成了一个有序链表,在查询大小区间的数据时候更方便,速度更快。