索引的出现是为了提高查询效率,三种常见、也比较简单的数据结构
- 哈希表
- 有序数组
- 搜索树
哈希表
哈希表是一种以键 - 值(key-value)存储数据的结构,我们只要输入待查找的键即 key,就可以找到其对应的值即 Value。哈希的思路很简单,把值放在数组里,用一个哈希函数把 key 换算成一个确定的位置,然后把 value 放在数组的这个位置。不可避免地,多个 key 值经过哈希函数的换算,会出现同一个值的情况。处理这种情况的一种方法是,拉出一个链表。—先哈希定位,若有相同值,遍历链表
优点:新增和等值查询速度快 接近log(1)
确定:因为哈希后的是无序的,所以范围查询只能遍历查询
适用场景:只有等值查询的场景,如memcache以及其他nosql。
有序数组
优点:有序数组在等值查询和范围查询场景中的性能就都非常优秀 —O(log(N))。
缺点:在需要更新数据的时候就麻烦了,你往中间插入一个记录就必须得挪动后面所有的记录,成本太高。
适用场景:只适用于静态存储引擎,比如你要保存的是 2017 年某个城市的所有人口信息,这类不会再修改的数据。
搜索树
优点:插入和删除时间复杂度都是O(1),查询复杂度O(logN)
使用场景:N 叉树由于在读写上的性能优点,以及适配磁盘的访问模式,已经被广泛应用在数据库引擎中了
参考总结来源:深入浅出索引(上)