一、全表遍历
每个数据页一次加载搜索
二、Hash结构
1. Hash简介
2. 两种常见加快查找速度的数据结构
3. 为什么不采用Hash结构
<1> Hash索引仅能满足=,!=和IN查询。如果进行范围查询,哈希型的索引,时间复杂度会退化为o(n);而树型的“有序”特性,依然能够保持O(log2N)的高效率。
<2> Hash索引还有一个缺陷,数据的存储是没有顺序的,在ORDER BY的情况下,使用Hash索引还需要对数据重新排序。
<3> 对于联合索引的情况,Hash值是将联合索引键合并后一起来计算的,无法对单独的一个键或者几个索引键进行查询。
<4> 对于等值查询来说,通常Hash索引的效率更高,不过也存在一种情况,就是索引列的重复值如果很多,效率就会降低。这是因为遇到Hash冲突时,需要遍历桶中的行指针来进行比较,找到查询的关键字,非常耗时,所以Hash索引通常不会用到重复值比较多的列上,比如性别,年龄等。
4. 支持的存储引擎
5. 自适应Hash索引
<1> 概述
采用自适应 Hash 索引目的是方便根据 SQL 的查询条件加速定位到叶子节点,特别是当 B+ 树比较深的时候,通过自适应 Hash索引可以明显提高数据的检索效率。
<2> 查看是否开启
show variables like '%adaptive_hash_index';
三、二叉搜索树
1. 二叉搜索树的特点
2. 查找规则
3. 存在问题
四、AVL树(平衡二叉树)
#五、B-Tree
1. 简介
2. 结构
3. 特性
<1> 根节点的儿子数的范围是 [2,M]。
<2> 每个中间节点包含 k-1 个关键字和 k 个孩子,孩子的数量 = 关键字的数量 +1,k 的取值范围为[ceil(M/2), M]。ceil为向上取整
<3> 叶子节点包括 k-1 个关键字(叶子节点没有孩子),k 的取值范围为 [ceil(M/2), M]。
<4> 假设中间节点节点的关键字为:Key[1], Key[2], …, Key[k-1],且关键字按照升序排序,即 Key[i]<Key[i+1]。此时 k-1 个关键字相当于划分了 k 个范围,也就是对应着 k 个指针,即为:P[1], P[2], …,P[k],其中 P[1] 指向关键字小于 Key[1] 的子树,P[i] 指向关键字属于 (Key[i-1], Key[i]) 的子树,P[k]指向关键字大于 Key[k-1] 的子树。
<5> 所有叶子节点位于同一层。
<6> 非叶子节点既保存索引,也保存数据记录 。
4. 查找步骤
5. 与AVL树相比
<1> 与AVL树相比
B 树相比于平衡二叉树来说磁盘 I/O 操作要少 , 在数据查询中比平衡二叉树效率要高。所以 只要树的高度足够低,IO次数足够少,就可以提高查询性能 。
<2> 总结
六、B+Tree
1. 简介
2. B+Tree 与B-Tree的不同
<1> 有 k 个孩子的节点就有 k 个关键字。也就是孩子数量 = 关键字数,而 B 树中,孩子数量 = 关键字数+1。
<2> 非叶子节点的关键字也会同时存在在子节点中,并且是在子节点中所有关键字的最大(或最小)。
<3> 非叶子节点仅用于索引,不保存数据记录,跟记录有关的信息都放在叶子节点中。而 B 树中, 非叶子节点既保存索引,也保存数据记录 。
<4> 所有关键字都在叶子节点出现,叶子节点构成一个有序链表,而且叶子节点本身按照关键字的大小从小到大顺序链接。
3. B+Tree 相对B-Tree的改进
4. 思考题