学习资料

【MySQL数据库教程天花板，mysql安装到mysql高级，强！硬！-哔哩哔哩】
【阿里巴巴Java开发手册】https://www.w3cschool.cn/alibaba_java

索引的数据结构

B+树

在这里插入图片描述

在这里插入图片描述
这个数据结构，它的名称是B+树。

默认数据页大小为16kb

在这里插入图片描述

常见索引概念

索引按照物理实现方式，索引可以分为2中：聚簇（聚集）和非聚簇（非聚集）索引。我们也把聚簇索引称为二级索引和辅助索引。

聚簇索引

聚簇索引并不是一种单独的索引类型，而是一种数据存储方式（所有的用户记录都存储在了叶子节点），也就是所谓的索引及数据，数据及索引。

术语“聚簇”表示数据和相邻的键值聚簇的存储在一起。

特点

1、使用记录主键值的大小进行记录和页的排序，这包括三个方面的含义：
页内的记录是按照主键的大小顺序排成一个单向链表。
各个存放用户记录的页也是根据页中用户记录的主键大小顺序排成一个双向链表。
存放目录项记录的页分为不同的层次，在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个双向链表。

2、B+树的叶子节点存储的是完整的用户记录。
所谓完整的用户记录，就是指这个记录中存储了所有列的值（包括隐藏列）。
我们把具有这两种特性的B+树称为聚簇索引，所有完整的用户记录都存放在这个聚簇索引的叶子节点处。这种聚簇索引并不需要我们在MySQL语句中显式的使用INDEX语句去创建，InnoDB存储引擎会自动为我们创建聚簇索引。

优点

数据访问更快，因为聚簇索引将索引和数据保存在同一个B+树种，因此聚簇索引中获取数据比非聚簇索引更快。
聚簇索引对于主键的排序查找和范围查找速度非常快。
按照聚簇索引排列的顺序，查询显示一定范围数据的时候，由于数据都是紧密相连，数据库不用从多个数据块中提取数据，所以节省了大量的io操作。

缺点

插入速度严重依赖插入顺序，按照主键的顺序插入是最快的方式，否则将会出现页分裂，严重影响性能。因此，对于InnoDB表，我们一般都会定义为一个自增的ID列为主键。
更新主键的代价很高，因为将会导致被动更新的行移动。因此，对于InnoDB表，我们一般定义主键为不可更新。
二级索引访问需要两次索引查找，第一次找到主键值，第二次根据主键值找到行数据。

限制

对于MySQL数据库目前只有InnoDB数据引擎支持聚簇索引，而MyISAM并不支持聚簇索引。
由于物理存储排序方式只能有一种，所以每个MySQL的表只能有一个聚簇索引。一般情况下就是该表的主键。
如果没有定义主键，Innodb会选择非空的唯一索引代替，如果没有这样的索引，Innodb会隐式的定义一个主键来作为聚簇索引。
为了充分利用聚簇索引和聚簇的特性，所以Innodb表的主键尽量选用有序的顺序id，而不建议无序的id，比如UUID、MD5、HASH、字符串列作为主键无法保证数据的顺序增长。

二级索引（辅助索引、非聚簇索引）

在这里插入图片描述

回表

在这里插入图片描述

聚簇索引与非聚簇索引原理不同，在使用上也有一些区别：
1、聚簇索引的叶子结点存储的就是我们的数据记录，非聚簇索引的叶子节点上存储的是数据位置。非聚簇索引不会影响数据表的物理存储顺序。
2、一个表只能有一个聚簇索引，因为只能有一种排序存储方式，但可以有多个非聚簇索引，也就是多个索引目录提供数据检索。
3、使用聚簇索引的时候，数据的查询效率高，但如果对数据进行插入、删除、更新的操作，效率会比非聚簇索引低。