文章目录
- 学习资料
- 索引的数据结构
- B+树
- 常见索引概念
- 聚簇索引
- 特点
- 优点
- 缺点
- 限制
- 二级索引(辅助索引、非聚簇索引)
- 回表
- 联合索引
- Innodb的B+树索引注意事项
- 1、根页面位置万年不动
- 2、内节点中目录项记录的唯一性
- 3、一个页面最少存储2条记录
- 索引的代价
学习资料
【MySQL数据库教程天花板,mysql安装到mysql高级,强!硬!-哔哩哔哩】
【阿里巴巴Java开发手册】https://www.w3cschool.cn/alibaba_java
索引的数据结构
B+树
这个数据结构,它的名称是B+树
。
默认数据页大小为
16kb
常见索引概念
索引按照物理实现方式,索引可以分为2中:聚簇(聚集)和非聚簇(非聚集)索引。我们也把聚簇索引称为二级索引和辅助索引。
聚簇索引
聚簇索引
并不是一种单独的索引类型,而是一种数据存储方式
(所有的用户记录都存储在了叶子节点),也就是所谓的索引及数据,数据及索引
。
术语“聚簇”表示数据和相邻的键值聚簇的存储在一起。
特点
1、使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:
页内
的记录是按照主键的大小顺序排成一个单向链表
。
各个存放用户记录的页
也是根据页中用户记录的主键大小顺序排成一个双向链表
。
存放目录项记录的页
分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个双向链表
。
2、B+树的
叶子节点
存储的是完整的用户记录。
所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。
我们把具有这两种特性的B+树称为聚簇索引
,所有完整的用户记录都存放在这个聚簇索引
的叶子节点处。这种聚簇索引并不需要我们在MySQL语句中显式的使用INDEX
语句去创建,InnoDB
存储引擎会自动
为我们创建聚簇索引。
优点
数据访问更快
,因为聚簇索引将索引和数据保存在同一个B+树种,因此聚簇索引中获取数据比非聚簇索引更快。
聚簇索引对于主键的排序查找
和范围查找
速度非常快。
按照聚簇索引排列的顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以节省了大量的io操作
。
缺点
插入速度严重依赖插入顺序
,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义为一个自增的ID列为主键
。
更新主键的代价很高
,因为将会导致被动更新的行移动。因此,对于InnoDB表,我们一般定义主键为不可更新。
二级索引访问需要两次索引查找
,第一次找到主键值,第二次根据主键值找到行数据。
限制
对于MySQL数据库目前只有InnoDB数据引擎支持聚簇索引,而MyISAM并不支持聚簇索引。
由于物理存储排序方式只能有一种,所以每个MySQL的表只能有一个聚簇索引
。一般情况下就是该表的主键。
如果没有定义主键,Innodb会选择非空的唯一索引代替,如果没有这样的索引,Innodb会隐式的定义一个主键来作为聚簇索引。
为了充分利用聚簇索引和聚簇的特性,所以Innodb表的主键尽量选用有序的顺序id
,而不建议无序的id,比如UUID、MD5、HASH、字符串列作为主键无法保证数据的顺序增长。
二级索引(辅助索引、非聚簇索引)
回表
聚簇索引与非聚簇索引原理不同,在使用上也有一些区别:
1、聚簇索引的叶子结点
存储的就是我们的数据记录
,非聚簇索引的叶子节点上存储的是数据位置
。非聚簇索引不会影响数据表的物理存储顺序。
2、一个表只能有一个聚簇索引
,因为只能有一种排序存储方式,但可以有多个非聚簇索引
,也就是多个索引目录提供数据检索。
3、使用聚簇索引的时候,数据的查询效率高,但如果对数据进行插入、删除、更新的操作,效率会比非聚簇索引低。
联合索引
Innodb的B+树索引注意事项
1、根页面位置万年不动
2、内节点中目录项记录的唯一性
3、一个页面最少存储2条记录
MySQL会自动给每个页里加两条记录,由于这两条记录不是我们自己插入的,所以有时候也称
伪记录
和虚拟记录
。这两个伪记录一个代表最小记录
,一个代表最大记录
。