总结一下近期学习的mysql内容:
这里主要总结一下mysql的底层数据结构
索引的本质是什么?
索引的本质就是排好序的一种数据结构,通过索引我们能干什么呢?,快速的去定位到我们想要查找的数据,就像是你看书,插入一些书签,可以快速的帮你定位到你想要查找的内容,但是随之而来的问题是,你需要频繁的添加书签,索引也是一样的道理,在方便查找的同时,也会带来性能的消耗(维护索引)
索引的数据结构是什么
二叉树
红黑树
Hash表
BTree
B+Tree
B+树特点
非叶子节点不存储数据,只会存储对应的索引(压缩空间,可以使树存储更多的内容)
叶子节点存储所有的数据
叶子结点用指针连接,其实就是双链表格式,方便范围查询
Hash
对索引的key进行hash运算,定位出数据存储的位置
一般来说比B树,B+树效率更高(hash运算速度比树的查找快)
仅能满足满足“=”和in的运算,不支持范围查询
另外就是hash冲突问题,可能导致数组长度很长
MYISAM索引和数据文件是分离开的(非聚集)
Innodb的索引实现方式
表数据和索引数据都由B+树组织形成一个文件
索引+叶子节点构成完整的数据记录结构
为什么建议InnoDB表必须建主键,并且推荐使用整型的自增主键?
innodb存储引擎需要一个主键来组织整张表,这个主键必须是具有唯一不可重复性
才能对比和区别数据(比如树的分裂,节点插入需要一个辨识的点),如果没有,mysql会自动安排ROW_ID作为主键
为啥要自增主键呢,其实是为了避免页分裂,另外一点,自增的主键相邻的数据就在旁边,也方便磁盘扫描
为什么非主键索引结构叶子节点存储的是主键值?
一致性和节省存储空间
联合主键长啥样呢
比较第一个键,如果第一个键相同,那就接着比较后面的键