1.如何建立复合索引,一般加在哪些字段?建索引的理论依据或者经验
2.Innodb的行锁到底锁了什么?
结论:
InnoDB的行锁,是通过锁住索引来实现的,如果加锁查询的时候没有使用到索引,会将整个聚簇索引都锁住,相当于锁表了。
命中索引->锁行,没有命中->锁表。
3.什么是回表?
答案:通过辅助索引(二级索引)拿到主键后再回到主键索引查询的过程,就叫做「回表」。
B+树检索原理
由于B+树的非叶子节点只存储键值信息,假设每个磁盘块能存储4个键值及指针信息,则变成B+树后其结构如下图所示:
B+树中,所有数据记录节点都是按照键值大小顺序存放在同一层的叶子节点上,而非叶子节点上只存储key值信息,这样可以大大加大每个节点存储的key值数量,降低B+树的高度。
B+树算法: 通过继承了B树的特征,B+树相比B树,新增叶子节点与非叶子节点关系。
叶子节点中包含了键值和数据,根节点和枝节点中,只是包含键值和子节点引用,不包含数据。
通过非叶子节点查询叶子节点获取对应的数据,所有相邻的叶子节点包含非叶子节点使用链表进行结合,叶子节点是顺序排序并且相邻节点有顺序引用的关系。
总结
回表是指数据库根据索引(非主键)找到了指定的记录所在行后,还需要根据主键再次到数据块里获取数据的操作。这个过程在MySQL中可能涉及两次查询:首先通过索引扫描找到满足条件的记录的主键值,然后再通过主键值去主键索引中查找完整的行记录。
具体来说,在InnoDB存储引擎中,当通过非聚簇索引查询数据时,由于索引中不包含完整的行数据,因此需要根据索引中找到的主键值再去聚簇索引中查找完整的行数据,这个过程就是回表。
然而,回表操作虽然提供了更全面的数据信息,但也带来了一些问题和局限性。首先,回表操作需要访问两次索引,增加了IO开销和CPU消耗,对查询性能有一定的影响。特别是在高并发、大数据量的情况下,回表可能成为性能瓶颈。其次,由于回表操作是基于物理地址来获取数据,如果在回表过程中发生了数据修改(如DELETE、UPDATE),则可能会读取到不一致或错误的数据。
因此,在设计索引时,需要结合具体的业务场景和查询需求,选择合适的索引策略,以尽量减少回表的次数和影响,提高查询效率和性能。例如,可以通过使用覆盖索引来避免回表操作,覆盖索引是指索引包含了查询所需的所有字段的值,因此可以直接通过索引获取查询结果,而无需再去访问数据表。