MySQL 索引篇

news2026/2/12 12:46:28

什么是索引，索引就相当于一本书的目录。通过索引可以快速查找到对应的数据。

索引常见面试题：

1. 索引的分类：

按数据结构分类：

按物理存储分类：一般分为聚簇索引（主键索引），二级索引（辅助索引）

主键索引的B+树的叶子节点上一般存储的是数据，所有完整的用户数据都存放在主键索引的叶子节点上

二级索引的B+树的叶子节点上一般存储的是主键值，而不是实际数据。然后再通过主键值再查找到相应的数据，也就是说二级索引要经过两次查询。

回表：

如果在二级索引的第一次查询中获得相应的数据，就不需要再进行一次查询。这就叫做覆盖索引。如果第一次查询中没有获得相应数据，只获得主键值，那么就需要再进行一次主键检索。这个过程就叫做回表。

按字段特性分类：

主键索引：主键索引就是建立在主键上的索引，一般在建表的时候创建，一张表只能有一个主键索引，并且主键索引的列的值不允许为空值。

唯一索引：唯一索引建立在UNIQUE字段上的索引，一张表可以有多个唯一索引。索引列的值必须唯一，允许有空值。

普通索引：建立在普通字段上的索引，既不要求字段为主键索引，也不要求字段为唯一索引。

前缀索引：前缀索引是建立在字符型字段的前几个字符建立的索引。使用前缀索引的目的是减少索引占用的内存空间。提升查询效率。

按字段个数分类：

单列索引：建立在单列字段上的索引

联合索引：建立在多列字段上的索引（采用最左匹配原则）。

2. 什么时候需要创建索引 / 什么时候不需要创建索引

索引的好处和缺点：

索引最大的好处就是提高查询速度。

索引的缺点：需要占用物理空间，数量越大，占用空间越大。

创建索引和维护索引需要耗费时间，这种时间随着数据量的增大而增大。索引就是典型的以空间换时间

会降低表的增删改查的效率，每次增删改查，B+数为了维护索引有序性，都要进行动态维护。

什么时候需要创建索引：

字段有唯一性限制，就像商品编码

经常用于where 语句查询语句的字段，这样能够提高整个表的查询效率。如果查询字段不是一个，可以进行联合查询。

语句中含有ORDER BY和GROUP BY的字段，这样在进行查询时就不用去做一次排序。因为建立好索引之后，B+树上的数据都是有序的。

什么时候不需要查询数据：

WHERE 和 ORDER BY 和 GROUP BY 用不到的语句。

字段中出现大量的数据，比如性别字段，每次查询都只会出现一般的数据。

表数据太少的时候不需要创建索引

经常更新的字段，B+树需要维护数据的有序性，频繁的增删改查会影响数据库的性能。

3. 索引优化的方法：

前缀索引优化方法：前缀索引就是使用某个字段的前几个字符作为索引，在一些大的字段作为索引时，使用前缀索引可以减少索引项的大小。

覆盖索引优化：在二级索引的查询中，如果在第一次查询就获得相应的数据，就可以避免回表操作。方法：我们可以建立一个联合查询。即「商品ID、名称、价格」作为一个联合索引。如果索引中存在这些数据，查询将不会再次检索主键索引，从而避免回表。

主键最好是自增的：如果我们将主键设置为自增的，那么每增加一次数据就会按顺序添加到对应的叶子节点上。不需要移动数据。每插入一次新数据，都是追加操作。

索引最好设置成NOT NULL：索引中出现NULL会让优化器在做索引选择时会更加麻烦。

NULL值是一个没意义的数据，但是会在行格式中的NULL值列表增加1KB的空间。

防止索引失效：

当我们使用左或者左右模糊匹配的时候，也就是 like %xx 或者 like %xx%这两种方式都会造成索引失效；
当我们在查询条件中对索引列做了计算、函数、类型转换操作，这些情况下都会造成索引失效；
联合索引要能正确使用需要遵循最左匹配原则，也就是按照最左优先的方式进行索引的匹配，否则就会导致索引失效。
在 WHERE 子句中，如果在 OR 前的条件列是索引列，而在 OR 后的条件列不是索引列，那么索引会失效。