目录
1.绪论
2.Mysql的数据页组成
2.1 基本组成
2.1 文件头
2.2 页头部(Page Header)
3.3 infimum + supremum
3.4 用户记录 和 空闲空间
3.4.1 用户插入数据步骤
3.4.2 删除数据
3.5 页目录
3.5.1 插入时维护槽的步骤
3.5.2 查询元素的步骤
3.总结
1.绪论
前面讲Mysql的行记录结构的时候,曾经说过,Mysql每次与磁盘的IO操作是以数据页为单位的。每个数据页大小为16kb。而一个数据页存储多条行记录,这里就来介绍一下Mysql的数据页的组成。
2.Mysql的数据页组成
2.1 基本组成
Mysql的数据页由如下几部分组成。即38个字节的文件头,56个字节的数据页头,26个字节的最大和最小两条记录,已经已经使用的用户空间,未使用的空闲空间和8字节的文件尾组成。
2.1 文件头
文件头部主要存储的是当前文件的信息。其组成如下:
字段名称 | 说明 |
FIL_PAGE_SPACE_OR_CHKSUM | 该页文件的校验和 |
FIL_PAGE_OFFSET | 页号,当前页的唯一标识 |
FIL_PAGE_PREV | 上一页的指针 |
FIL_PAGE_NEXT | 下一页的指针 |
FIL_PAGE_LSN | 页面最后被修改的日志的位置 |
FIL_PAGE_TYPE | 表示该页是什么类型,常见的有索引页,undo页,事务页等 |
FIL_PAGE_FILE_FLUSH_LSN | |
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID | 该页属于什么表空间 |
我们主要关注的是FIL_PAGE_PREV和FIL_PAGE_NEXT这两个字段,通过这两个字段,将数据页串成了一个双端链表。如下:
2.2 页头部(Page Header)
页头存储的主要是关于当前数据页的一些信息,比如当前文件有多少个槽,当前页有多少条记录,当前页被删除了多少条记录等。
3.3 infimum + supremum
在数据页中,记录在逻辑上是按照主键id排序,并且通过每条记录里面的next_record字段串成一个单向链表。那这个链表的头部就是infimum,尾部就是supremum。
其中infimum的记录的type为2,并且其固定为13个字节,存储的记录内容就是`infimum`这个字符串。
而supremum的记录type为3,并且其固定位13个字节,存储的记录内容就是`supremum`这个字符串。
3.4 用户记录 和 空闲空间
3.4.1 用户插入数据步骤
1.用户插入数据的时候,首先需要判断空闲空间是否足够存储这条需要插入的数据,如果不够,需要开启新的页来存储。
2.如果足够,用户会直接将数据按照顺序插入,前面说的记录头中的字段heap_no表示的就是当前记录是该记录堆中的第几条记录。
3.插入完成过后,会维护一个按照主键大小排列的顺序链表,其中next_record就是这个链表的指针。
如下:
3.4.2 删除数据
删除数据时,用户会将该记录的delete_mask设置为1,并且将其加入到垃圾链表中,当剩余空间不足时,垃圾链表里面的这些内存可以被复用。
3.5 页目录
Innodb中的记录通过单向链表将记录从小到大链接,总所周知,顺序结构,可以考虑采用二分查找的方式,将查找复杂度降为O(logn)。所以Innodb维护了一个索引数组,每隔2-8个节点分为一组,并便每组的最后一个节点记录在该数组里面。这个数组就是页目录,该数组的每个元素称之为槽。
3.5.1 插入时维护槽的步骤
1.初始插入时,页目录数组中只有两个分组,分别是最小记录所在分组和最大记录所在分组。其中最小记录所在组最多只能有1条记录,最大记录所在分组最多只能有1-8条记录,其他分组最多为4-8条记录。
2.当新的元素进入的时候,会找比自己本记录大,并且差值最小的槽, 并且将起n_owned值加1,表示加入的元素归属于该组。
3.如果该组的元素超过8个值,会将该组分成两个组,一个组4个元素,一个组5个元素,并且会将他们维护在页目录数组中。
3.5.2 查询元素的步骤
1.首先查询到当前页(如何查找,后面讲解);
2.将当前主键id和通过二分查找在页目录数组中找到,当前页是属于哪个分组;
3.在该分组中遍历比较,得到对应元素。
3.总结
综上,结合前一章,Mysql的记录的讲解,我们可以对数据是如何存储在Mysql中的有一个大概认识。即每页大小为16kb,通过文件头的前向指针和后向指针,链接成一个双端链表。链表内部,每条记录物理上顺序插入,在逻辑上回根据记录的next_record属性,串成一个按照主键大小排列的单向链表。为了查询更快,每页会维护一个页目录,将记录组成的单向链表分成不同的组,并且将每组的最大元素的偏移量记录在页目录数组中。