MySQL之盛放记录的大盒子 【InnoDB 数据页结构】

news2024/11/15 8:33:47

前言

本文章收录在MySQL性能优化+原理+实战专栏,点击此处查看更多优质内容。

本文摘录自 ▪ 小孩子4919《MySQL是怎样运行的:从根儿上理解MySQL》

在这里插入图片描述学完了记录结构,我们该学数据页的结构,前边我们简单的提了一下页的概念,它是Innodb管理存储空间的基本单位,页的大小默认16KB,InnoDB为了不同的目的而设计了许多种不同类型的页,比如存放表空间头部信息的页,存放Insert Buffer信息的页,存放INODE信息的页,存放undo日志信息的页等等等等。而我们聚焦的是那些存放我们表中记录的那种类型的页,官方称这种存放记录的页为索引(INDEX)页,鉴于我们还没有了解过索引是个什么东系,而这些表中的记录就是我们日常口中所称的数据,所以目前还是叫这种存放记录的页为数据页吧。

目录

  • 一、数据页的结构预览
  • 二、用户真实记录在数据页中的存储(Free Space)
  • 三、记录头信息引出的数据页“记录”结构
    • 3.1 delete_mask
    • 3.2 min_rec_mask
    • 3.3 n_owned
    • 3.4 heap_no
    • 3.5 record_type
    • 3.7 next_record
  • 四、Page Directory(页目录)
  • 五、Page Header(页面头部)
    • 5.1 PAGE_DIRECTION
    • 5.2 PAGE_N_DIRECTION
  • 六、File Header(文件头部)
    • 6.1 FIL_PAGE_SPACE_OR_CHKSUM
    • 6.2 FIL_PAGE_OFFSET
    • 6.3 FIL_PAGE_TYPE
    • 6.4 FIL_PAGE_PREV和FIL_PAGE_NEXT
  • 七、File Trailer(文件尾部)
  • 总结

一、数据页的结构预览

在这里插入图片描述
从图中可以看出,一个InnoDB数据页的存储空间大致被划分成了7个部分,有的部分占用的字节数是确定的,有的部分占用的字节数是不确定的。下边我们来快速看一下这7个部分都存储了什么:

名称中文名大小(单位:B)描述
File Header文件头部38页的一些通用信息
Page Header页面头部56数据页专有的一些信息
Infimum + Supermum最小记录和最大记录26两个虚拟的行记录
User Records用户真实记录不确定实际存储的行记录内容
Free Space空闲空间不确定页中尚未使用的空间
Page Directory页面目录不确定页中的某些记录的相对位置
File Trailer文件尾部8校验页是否完整

二、用户真实记录在数据页中的存储(Free Space)

在页的7个组成部分中,我们自己存储的记录会按照我们指定的行格式存储到User Records部分。但是在一开始生成页的时候,其实并没有User Records这个部分,每当我们插入一条记录,都会从Free Space部分,也就是尚未使用的存储空间中申请一个记录大小的空间划分到User Records部分,当Free Space部分的空间全部被User Records部分替代掉之后,也就意味着这个页使用完了,如果还有新的记录插入的话,就需要去申请新的页了。这个过程的图示如下:

在这里插入图片描述
为了更好的管理在User Records中的这些记录,InnoDB可费了一番力气呢,在哪费力气了呢?不就是把记录按照指定的行格式一条一条摆在User Records部分么?其实这话还得从记录行格式的记录头信息中说起

三、记录头信息引出的数据页“记录”结构

我们这里先创建一张表

mysql> create table demo5 (c1 int, c2 int, c3 varchar(10000),primary key (c1)) charset=ascii row_format=compact;

Query OK, 0 rows affected (0.04 sec)

这个新建的表有三个列,c1和c2列是用来存储整数的,c3存储的字符串,但是我们指定c1位主键,所以在具体的行格式中,Innodb就没有必要给我们创建row_id隐藏列了。所以表中的行格式示意图如下:

在这里插入图片描述
我们特意把记录头五个字节拿出来
在这里插入图片描述
记录头信息中各个属性的含义再贴一下(目前使用Compact行格式):

名称⼤⼩(单位:bit)描述
预留位11没有使⽤
预留位21没有使⽤
delete_mask1标记该记录是否被删除
min_rec_mask1B+树的每层⾮叶⼦节点中的最⼩记录都会添加该标记
n_owned4表示当前记录拥有的记录数
heap_no13表示当前记录在记录堆的位置信息
record_type3表示当前记录的类型,0表示普通记录,1表示B+树⾮叶⼦节点记录,2表示最⼩记录,3表示最⼤记录
next_record16表示下⼀条记录的相对位置

下边我们插入几条数据

mysql> insert into demo5 values(1,100,'aaaa'),(2,200,'bbbb'),(3,300,'cccc'),(4,400,'dddd');
Query OK, 4 rows affected (0.01 sec)
Records: 4  Duplicates: 0  Warnings: 0

我们查看这4行记录的信息头

在这里插入图片描述
第一行:00 00 10 00 20
第二行:00 00 18 00 20
第三行:00 00 20 00 20
第四行:00 00 28 ff 91

转成二进制如下:

第一行:00000000 00000000 00010000 00000000 00100000
第二行:00000000 00000000 00011000 00000000 00100000
第三行:00000000 00000000 00100000 00000000 00100000
第四行:00000000 00000000 00101000 11111111 10010001

第四行11111111 10010001是负数,补码+1,为-111

为了方便大家分析这些记录在页的User Records部分中是怎么表示的,我把记录中头信息和实际的列数据都用十进制表示出来了所以这些记录的示意图就是

在这里插入图片描述

需要注意的是,各个记录在User Records中存储是没有空隙的,这是方便大家看才把每条记录单独画开的,我们对照这个图来看看记录头信息中各个属性:

3.1 delete_mask

这个属性标记当前记录是否被删除,占用一个二进制位,为0为没有删除,为1被删除

被删除的记录不立即从磁盘上移除,因为移除它们之后把其他的记录在磁盘上重新排列需要性能消耗,所以只是打一个删除标记而已,所有被删除掉的记录都会组成一个所谓的垃圾链表,在这个链表中的记录占用的空间称之为所谓的可重用空间,之后如果有新记录插入到表中的话,可能把这些被删除的记录占用的存储空间覆盖掉。这个delete_mask位设置为1和将被删除的记录加入到垃圾链表中是两个阶段

3.2 min_rec_mask

B+树的每层非叶子节点中的最小记录都会添加该标记。值为1,表示该条记录是B+树的非叶子节点中的最小记录;值为0,意味着该条数据不是B+树的非叶子节点中的最小记录

3.3 n_owned

表示当前记录拥有的记录数,一会我们再详细介绍

3.4 heap_no

这个属性表示当前记录在本页中的位置。MySQL自动给每个页里边儿加了两个记录,由于这两个记录并不是我们自己插入的,所以有时候也称为伪记录或者虚拟记录。这两个伪记录一个代表最小记录,一个代表最大记录。

记录也可以比大小,对于一条完整的记录来说,比较记录的大小就是比较主键的大小。但是不管我们向页中插入了多少自己的记录,InnoDB规定他们定义的两条伪记录分别为最小记录与最大记录。这两条记录的构造十分简单,都是由5字节大小的记录头信息和8字节大小的一个固定的部分组成的。

在这里插入图片描述
在这里插入图片描述
我们现在看文件头,分别是如下:

最大记录:05 00 0b 00 00
最小记录:01 00 02 00 1c

转成二进制如下:

最大记录:00000101 00000000 00011011 00000000 00000000
最小记录:00000001 00000000 00000010 00000000 00011100

由于这两条记录不是我们自己定义的记录,所以它们并不存放在页的User Records部分,他们被单独放在上文提到的Infimum + Supremum的部分

在这里插入图片描述

图中,其他信息没有画出但不代表它们不存在,只是为了大家方便理解,做了简化。最小记录和最大记录的heap_no值分别是0和1,也就是说它们的位置最靠前

3.5 record_type

这个属性表示当前记录的类型,一共有4种类型的记录,0表示普通记录,1表示B+树非叶节点记录,2表示最小记录,3表示最大记录。从图中我们也可以看出来,我们自己插入的记录就是普通记录,它们record_type值都是0,而最小记录和最大记录的record_type值分别为2和3,至于record_type为1的情况,我们之后在说索引的时候会重点强调的。

3.7 next_record

这个信息非常重要,表示从当前记录的真实数据到下一条记录的真实数据的地址偏移量。比方说第一条记录的next_record值为32,意味着从第一条记录的真实数据的地址处向后找32个字节便是下一条记录的真实数据。如果你熟悉数据结构的话,就立即明白了,这其实是个链表,可以通过一条记录找到它的下一条记录。但是需要注意注意再注意的一点是,下一条记录指的并不是按照我们插入顺序的下一条记录,而是按照主键值由小到大的顺序的下一条记录。而且规定Infimum记录(也就是最小记录) 的下一条记录就是本页中主键值最小的用户记录,而本页中主键值最大的用户记录的下一条记录就是Supremum记录(也就是最大记录) ,为了更形象的表示一下这个next_record起到的作用,我们用箭头来替代一下next_record中的地址偏移量:

在这里插入图片描述

从图中可以看出来,我们的记录按照主键从小到大的顺序形成了一个单链表。最大记录的next_record的值为0,这也就是说最大记录是没有下一条记录了,它是这个单链表中的最后一个节点。如果从中删除掉一条记录,这个链表也是会跟着变化的,比如我们把第2条记录删掉:

mysql> delete from demo5 where c1 =2;
Query OK, 1 row affected (0.02 sec)

删掉第2条记录后,我们看一下demo5.ibd文件四行记录和最大最小的记录头信息

在这里插入图片描述

第一行00 00 10 00 40
第二行20 00 18 00 00
第三行:00 00 20 00 20
第四行:00 00 28 ff 91

最大记录04 00 0b 00 00
最小记录:01 00 02 00 1c

我们跟前面对比发现第一行、第二行和最大记录发生了变化,这里就不演示进制的转换了

0x40=64
0x20=0010 0000
0x04=0000 0100

示意图就是:

在这里插入图片描述

从图中可以看出来,删除第2条记录前后主要发生了这些变化:

  • 第2条记录并没有从存储空间中移除,而是把该条记录的delete_mask值设置为1。
  • 第2条记录的next_record值变为了0,意味着该记录没有下一条记录了。
  • 第1条记录的next_record值变为了64,指向了第3条记录。
  • 最大记录的n_owned值从5变成了4,关于这一点的变化我们稍后会详细说明的。

所以,不论我们怎么对页中的记录做增删改操作,InnoDB始终会维护一条记录的单链表,链表中的各个节点是按照主键值由小到大的顺序连接起来的

会不会觉得next_record这个指针有点儿怪,为啥要指向记录头信息和真实数据之间的位置呢?为啥不干脆指向整条记录的开头位置,也就是记录的额外信息开头的位置呢?

因为这个位置刚刚好,向左读取就是记录头信息,向右读取就是真实数据。MySQL之InnoDB记录结构我们还说过变长字段长度列表、NULL值列表中的信息都是逆序存放,这样可以使记录中位置靠前的字段和它们对应的字段长度信息在内存中的距离更近,可能会提高高速缓存的命中率。

再来看一个有意思的事情,因为主键值为2的记录被我们删掉了,但是存储空间却没有回收,如果我们再次把这条记录插入到表中,会发生什么事呢?

mysql> insert into demo5 VALUES(2, 200, 'bbbb');
Query OK, 1 row affected (0.01 sec)

我们直接看数据文件

在这里插入图片描述
是不是和刚开始一模一样,如图

在这里插入图片描述InnoDB并没有因为新记录的插入而为它申请新的存储空间,而是直接复用了原来被删除记录的存储空间

小提示
1、当数据页中存在多条被删除掉的记录时,这些记录的next_record属性将会把这些被删除掉的记录组成一个垃圾链表,以备之后重用这部分存储空间。上面删除了一行记录,又将记录原封不动插回来的情况,原来的存储空间是会被重用的。
2、还有一种情况是不会被重用的:删除原记录后,新插入的记录真实数据所占存储空间大于原先记录存储空间的时候,这时原空间不会被重用且被加入垃圾链表,新插入的记录会从Free Space申请新的空间,和已有的记录组合成新的链表。

四、Page Directory(页目录)

现在我们了解了记录在页中按照主键值由小到大顺序串联成一个单链表,那如果我们想根据主键值查找页中的某条记录该咋办呢?比如说这样的查询语句:

select * from where c1=3;

最笨的办法:从Infimum记录(最小记录)开始,沿着链表一直往后找,总会找到。在找的时候还能投机取巧,因为链表中各个记录的值是按照从小到大顺序排列的,所以当链表的某个节点代表的记录的主键值大于你想要查找的主键值时,你就可以停止查找了,因为该节点后边的节点的主键值依次递增。

但是InnoDB能用这么笨的办法么,当然是要设计一种更快的查找方式,于是乎从书的目录中找到了灵感。

我们平常想从一本书中查找某个内容的时候,一般会先看目录,找到需要查找的内容对应的书的页码,然后到对应的页码查看内容。InnoDB为我们的记录也制作了一个类似的目录,他们的制作过程是这样的:

  • 将所有正常的记录(包括最大和最小记录,不包括标记为已删除的记录)划分为几个组。
  • 每个组的最后一条记录(也就是组内最大的那条记录)的头信息中的n_owned属性表示该记录拥有多少条记录,也就是该组内共有几条记录。
  • 将每个组的最后一条记录的地址偏移量单独提取出来按顺序存储到靠近页的尾部的地方,这个地方就是所谓的Page Directory,也就是页目录。页面目录中的这些地址偏移量被称为槽(英文名:Slot),所以这个页面目录就是由槽组成的。

在这里插入图片描述
从这个图中我们需要注意这么几点:

  • 现在页目录部分中有两个槽,也就意味着我们的记录被分成了两个组,槽1中的值是112,代表最大记录的地址偏移量(就是从页面的0字节开始数,数112个字节);槽0中的值是99,代表最小记录的地址偏移量。

  • 注意最小和最大记录的头信息中的n_owned属性

    • 最小记录的n_owned值为1,这就代表着以最小记录结尾的这个分组中只有1条记录,也就是最小记录本身。

    • 最大记录的n_owned值为5,这就代表着以最大记录结尾的这个分组中只有5条记录,包括最大记录本身还有我们自己插入的4条记录。

99和112这样的地址偏移量很不直观,我们用箭头指向的方式替代数字,这样更易于我们理解,所以修改后的示意图就是这样:

在这里插入图片描述
暂时不管各条记录在存储设备上的排列方式了,单纯从逻辑上看一下这些记录和页目录的关系:

在这里插入图片描述
InnoDB对每个分组中的记录条数是有规定的:对于最小记录所在的分组只能有1条记录,最大记录所在的分组拥有的记录条数只能在1~8条之间,剩下的分组中记录的条数范围只能在是4~8条之间。所以分组是按照下边的步骤进行的:

  • 初始情况下一个数据页里只有最小记录和最大记录两条记录,它们分属于两个分组。

  • 之后每插入一条记录,都会从页目录中找到主键值比本记录的主键值大并且差值最小的槽,然后把该槽对应的记录的n_owned值加1,表示本组内又添加了一条记录,直到该组中的记录数等于8个。

  • 在一个组中的记录数等于8个后再插入一条记录时,会将组中的记录拆分成两个组,一个组中4条记录,另一个5条记录。这个过程会在页目录中新增一个槽来记录这个新增分组中最大的那条记录的偏移量。

由于现在demo5表中的记录太少,无法演示添加了页目录之后加快查找速度的过程,所以再往demo5表中添加一些记录

insert into demo5 values(5, 500, 'eeee');
insert into demo5 values(6, 600, 'ffff');
insert into demo5 values(7, 700, 'gggg');
insert into demo5 values(8, 800, 'hhhh');
insert into demo5 values(9, 900, 'iiii');
insert into demo5 values(10, 1000, 'jjjj');
insert into demo5 values(11, 1100, 'kkkk');
insert into demo5 values(12, 1200, 'llll');
insert into demo5 values(13, 1300, 'mmmm');
insert into demo5 values(14, 1400, 'nnnn');
insert into demo5 values(15, 1500, 'oooo');
insert into demo5 values(16, 1600, 'pppp');

现在页里边就一共有18条记录了(包括最小和最大记录),这些记录被分成了5个组,如图所示:

在这里插入图片描述
因为把16条记录的全部信息都画在一张图里太占地方,让人眼花缭乱的,所以只保留了用户记录头信息中的n_owned和next_record属性,也省略了各个记录之间的箭头,我没画不等于没有啊!现在看怎么从这个页目录中查找记录。因为各个槽代表的记录的主键值都是从小到大排序的,所以我们可以使用所谓的二分法来进行快速查找。5个槽的编号分别是:0、1、2、3、4,所以初始情况下最低的槽就是low=0,最高的槽就是high=4。比方说我们想找主键值为6的记录,过程是这样的:

  • 计算中间槽的位置:(0+4)/2=2,所以查看槽2,对应记录的主键值为8,又因为8 > 6,所以设置high=2,low保持不变。
  • 重新计算中间槽的位置:(0+2)/2=1,所以查看槽1对应的主键值为4,又因为4 < 6,所以设置low=1,high保持不变。
  • 因为high - low的值为1,所以确定主键值为6的记录在槽2对应的组中,此刻我们需要找到槽2中主键值最小的那条记录,然后沿着单向链表遍历槽2中的记录。但是我们前边又说过,每个槽对应的记录都是该组中主键值最大的记录,这里槽2对应的记录是主键值为8的记录,怎么定位一个组中最小的记录呢?别忘了各个槽都是挨着的,我们可以很轻易的拿到槽1对应的记录(主键值为4),该条记录的下一条记录就是槽2中主键值最小的记录,该记录的主键值为5。所以我们可以从这条主键值为5的记录出发,遍历槽2中的各条记录,直到找到主键值为6的那条记录即可。由于一个组中包含的记录条数只能是1~8条,所以遍历一个组中的记录的代价是很小的。

所以在一个数据页中查找指定主键值的记录的过程分为两步:

  • 通过二分法确定该记录所在的槽,并找到该槽所在分组中主键值最小的那条记录。

  • 通过记录的next_record属性遍历该槽所在的组中的各个记录

五、Page Header(页面头部)

InnoDB为了能得到一个数据页中存储的记录的状态信息,比如本页中已经存储了多少条记录,第一条记录的地址是什么,页目录中存储了多少个槽等等,特意在页中定义了一个叫Page Header的部分,它是页结构的第二部分,这个部分占用固定的56个字节,专门存储各种状态信息,具体各个字节的含义看下表:

名称大小(单位:B)描述
PAGE_N_DIR_SLOTS2页目录的插槽数
PAGE_HEAP_TOP2还未使用的空间最小地址,也就是说从该地址之后就是Free Space
PAGE_N_HEAP2本页中的记录的数量(包括最小和最大记录以及标记为删除的记录)
PAGE_FREE2第一个已经标记为删除的记录地址(各个已删除的记录通过next_record也会组成一个单链表,这个单链表中的记录可以被重新利用)
PAGE_GARBAGE2已删除记录占用的字节数
PAGE_LAST_INSERT2最后插入记录的位置
PAGE_DIRECTION2记录插入的方向
PAGE_N_DIRECTION2一个方向连续插入的记录数量
PAGE_N_RECS2该页中记录的数量(不包括最小和最大记录以及被标记为删除的记录)
PAGE_MAX_TRX_ID8修改当前页的最大事务ID,该值仅在二级索引中定义
PAGE_LEVEL2当前页在B+树中所处的层级
PAGE_INDEX_ID8索引ID,表示当前页属于哪个索引
PAGE_BTR_SEG_LEAF10B+树叶子段的头部信息,仅在B+树的Root页定义
PAGE_BTR_SEG_TOP10B+树非叶子段的头部信息,仅在B+树的Root页定义

通过前面文章的介绍,从PAGE_N_DIR_SLOTS到PAGE_LAST_INSERT以及PAGE_N_RECS的意思大家一定是清楚的。不清楚的你回头好好看看吧。剩下的状态信息不要着急。我们先来看一下PAGE_DIRECTION和PAGE_N_DIRECTION的意思:

5.1 PAGE_DIRECTION

假如新插入的一条记录的主键值比上一条记录的主键值大,我们说这条记录的插入方向是右边,反之则是左边。用来表示最后一条记录插入方向的状态就是PAGE_DIRECTION

5.2 PAGE_N_DIRECTION

假设连续几次插入新记录的方向都是一致的,InnoDB会把沿着同一个方向插入记录的条数记下来,这个条数就用PAGE_N_DIRECTION这个状态表示。当然,如果最后一条记录的插入方向改变了的话,这个状态的值会被清零重新统计。

至于我们没提到的那些属性,我没说是因为现在不需要大家知道。不要着急,当我们学完了后边的内容,你再回头看,一切都是那么清晰。

小提示:
说到这个有些东西后边我们学过后回头看就很清晰的事,不禁让我想到了乔布斯在斯坦福大学的演讲: “You can’t connect the dots looking forward; you can only connect them looking backwards. So you have to trust that the dots will somehow connect in your future.You have to trust in something - your gut, destiny, life, karma, whatever. This approach has never let me down, and it has made all the difference in my life.” 上边这段话纯属⼼⾎来潮写的,⼤意是坚持做自己喜欢的事情,你在做的时候可能并不能搞清楚这些事对自己之后的人生有啥影响,但当你一路走来回头看时,一切都是那么清晰,就像是命中注定的一样。

六、File Header(文件头部)

Page Header是专门针对数据页记录的各种状态信息,比方说页里头有多少个记录、有多少个槽。我们现在描述的File Header针对各种类型的页都通用,也就是说不同类型的页都会以File Header作为第一个组成部分,它描述了一些针对各种页都通用的一些信息,比方说这个页的编号是多少,它的上一个页、下一个页是谁…这个部分占用固定的38个字节,是由下边这些内容组成的:

名称大小(单位:B)描述
FIL_PAGE_SPACE_OR_CHKSUM4页的校验和(checksum值)
FIL_PAGE_OFFSET4页号
FIL_PAGE_PREV4上一个页的页号
FIL_PAGE_NEXT4下一个页的页号
FIL_PAGE_LSN8页面被最后修改时对应的日志序列位置(英文名是:Log Sequence Number)
FIL_PAGE_TYPE2该页的类型
FIL_PAGE_FILE_FLUSH_LSN8仅在系统表空间的一个页中定义,代表文件至少被刷新到了对应的LSN值
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID4页属于哪个表空间

对照着这个表格,我们看几个目前比较重要的部分:

6.1 FIL_PAGE_SPACE_OR_CHKSUM

这个代表当前页面的校验和(checksum)。啥是个校验和?就是对于一个很长很长的字节串来说,我们会通过某种算法来计算一个比较短的值来代表这个很长的字节串,这个比较短的值就称为校验和。这样在比较两个很长的字节串之前先比较这两个长字节串的校验和,如果校验和都不一样两个长字节串肯定是不同的,所以省去了直接比较两个比较长的字节串的时间损耗。

6.2 FIL_PAGE_OFFSET

每一个页都有一个单独的页号,就跟你的身份证号码一样,InnoDB通过页号来可以唯一定位一个页。

6.3 FIL_PAGE_TYPE

这个代表当前页的类型,我们前边说过,InnoDB为了不同的目的而把页分为不同的类型,我们上边介绍的其实都是存储记录的数据页,其实还有很多别的类型的页,具体如下表:

类型名称十六进制描述
FIL_PAGE_TYPE_ALLOCATED0x0000最新分配,还没使用
FIL_PAGE_UNDO_LOG0x0002Undo日志页
FIL_PAGE_INODE0x0003段信息节点
FIL_PAGE_IBUF_FREE_LIST0x0004Insert Buffer空闲列表
FIL_PAGE_IBUF_BITMAP0x0005Insert Buffer位图
FIL_PAGE_TYPE_SYS0x0006系统页
FIL_PAGE_TYPE_TRX_SYS0x0007事务系统数据
FIL_PAGE_TYPE_FSP_HDR0x0008表空间头部信息
FIL_PAGE_TYPE_XDES0x0009扩展描述页
FIL_PAGE_TYPE_BLOB0x000A溢出页
FIL_PAGE_INDEX0x45BF索引页,也就是我们所说的数据页

6.4 FIL_PAGE_PREV和FIL_PAGE_NEXT

我们前边强调过,InnoDB都是以页为单位存放数据的,有时候我们存放某种类型的数据占用的空间非常大(比方说一张表中可以有成千上万条记录),InnoDB可能不可以一次性为这么多数据分配一个非常大的存储空间,如果分散到多个不连续的页中存储的话需要把这些页关联系起来来,FIL_PAGE_PREV和FIL_PAGE_NEXT就分别代表本页的上一个和下一个页的页号。这样通过建立一个双向链表把许许多多的页就都串联起来了,而无需这些页在物理上真正连着。需要注意的是,并不是所有类型的页都有上一个和下一个页的属性,不过我们本集中唠叨的数据页(也就是类型为FIL_PAGE_INDEX的页)是有这两个属性的,所以所有的数据页其实是一个双链表,就像这样:

在这里插入图片描述

七、File Trailer(文件尾部)

InnoDB存储引擎会把数据存储到磁盘上,但是磁盘速度太慢,需要以页为单位把数据加载到内存中处理,如果该页中的数据在内存中被修改了,那么在修改后的某个时间需要把数据同步到磁盘中。但是在同步了一半的时候中断电了咋办,这不是莫名尴尬么?为了检测一个页是否完整(也就是在同步的时候有没有发生只同步一半的尴尬情况),InnoDB在每个页的尾部都加了一个File Trailer部分,这个部分由8个字节组成,可以分成2个小部分:

  • 前4个字节代表页的校验和
    这个部分是和File Header中的校验和相对应的。每当一个页面在内存中修改了,在同步之前就要把它的校验和算出来,因为File Header在页面的前边,所以校验和会被首先同步到磁盘,当完全写完时,校验和也会被写到页的尾部,如果完全同步成功,则页的首部和尾部的校验和应该是一致的。如果写了一半儿断电了,那么在File Header中的校验和就代表着已经修改过的页,而在File Trailer中的校验和代表着原先的页,二者不同则意味着同步中间出了错。

  • 后4个字节代表页面被最后修改时对应的日志序列位置(LSN)
    这个部分也是为了校验页的完整性的,只不过我们目前还没说LSN
    是个什么意思,所以大家可以先不用管这个属性。这个File Trailer与File Header类似,都是所有类型的页通用的。

总结

今天的数据页结构理论知识也很多,下面我们来做个总结:

  • InnoDB为了不同的目的而设计了不同类型的页,我们把用于存放记录的页叫做数据页

  • 一个数据页可以被大致划分为7个部分,分别是:
    -在这里插入图片描述

    • File Header,表示页的一些通用信息,占固定的38字节。

    • Page Header,表示数据页专有的一些信息,占固定的56个字节。

    • Infimum + Supremum,两个虚拟的伪记录,分别表示页中的最小和最大记录,占固定的26个字节。

    • User Records:真实存储我们插入的记录的部分,大小不固定。

    • Free Space:页中尚未使用的部分,大小不确定。

    • Page Directory:页中的某些记录相对位置,也就是各个槽在页面中的地址偏移量,大小不固定,插入的记录越多,这个部分占用的空间越多。
      File Trailer:用于检验页是否完整的部分,占用固定的8个字节

  • 每个记录的头信息中都有一个next_record属性,从而使页中的所有记录串联成一个单链表

  • InnoDB会把页中的记录划分为若干个组,每个组的最后一个记录的地址偏移量作为一个槽,存放在Page Directory中,所以在一个页中根据主键查找记录是非常快的,分为两步:

    • 通过二分法确定该记录所在的槽。
    • 通过记录的next_record属性遍历该槽所在的组中的各个记录。
  • 每个数据页的File Header部分都有上一个和下一个页的编号,所以所有的数据页会组成一个双链表。

  • 为保证从内存中同步到磁盘的页的完整性,在页的首部和尾部都会存储页中数据的校验和和页面最后修改时对应的LSN值,如果首部和尾部的校验和和LSN值校验不成功的话,就说明同步过程出现了问题。

便于大家理解,我整理了一张数据页结构图:

在这里插入图片描述
本章较上一章记录结构知识点更多,原书作者画了很多图,看完后,我是一脸懵,虽然这两章内容理论知识偏多,但是为我们后面理解索引原理打下坚实基础,所以大家一定要理解文中重要的知识点。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/506670.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

臻图信息利用数字孪生构建生态环境智慧监测系统

2月27日&#xff0c;中共中央国务院印发《数字中国建设整体布局规划》中指出&#xff0c;要推动生态环境智慧治理&#xff0c;加快构建智慧高效的生态环境信息化体系&#xff0c;建设绿色智慧的数字生态文明。 生态环境监测是生态环境保护的基础&#xff0c;是生态文明建设的重…

企业什么时候需要ERP系统?

对于许多成长中的企业来说&#xff0c;是否需要ERP系统不是问题&#xff0c;而是何时需要的问题。随着企业的发展&#xff0c;其生成的数据量和要跟踪的数据源也在不断增加。在多个平台上管理所有这些信息变得成本昂贵、费时&#xff0c;而且容易出现管理不善的情况。 虽然对于…

性能测试入门实践路线图

我转行做软件测试工作已有六年多了&#xff0c; 从功能到自动化测试&#xff0c;然后负责性能测试团队和质量团队的技术专项治理&#xff0c;再到测试专家角色&#xff0c;负责整个技术项目的产品/运营和质量保障工作。 其中性能测试和线上稳定性保障&#xff0c;算是我最擅长…

物联网|IAR集成开发环境简介|cc254核心板硬件资源|物联网之蓝牙4.0 BLE基础-学习笔记(3)

文章目录 4、IAR集成开发环境简介5、 cc254核心板硬件资源 4、IAR集成开发环境简介 完整稳定的专业嵌入式开发环境&#xff0c;对不同的处理器有统一的用户界面&#xff0c;支持35种以上的MCU&#xff0c;包括8&#xff0c;16&#xff0c;32位&#xff0c; 完全兼容C语言的 高…

女孩子转数据分析难吗?难在哪里?

对于数据分析&#xff0c;很多人乍一听会觉得没啥技术难度&#xff0c;是个适合女孩子的专业。我们面对很多零基础小白也是用通俗的语言来形容这个专业&#xff1a;一般是通过Excel或者power BI工具对数据进行分析&#xff0c;制作成可视化的报表给领导层&#xff0c;为公司业务…

VS2022编译libiconv-1.17

需求概述 获得最新版本的windows下可用的libiconv静态库。 解决方案 概述 使用VS2022编译libiconv-1.17。需要对源码手动进行配置。 本文所述的方法同样适用于动态库&#xff0c;并且理论上适用于VS2010~2022所有版本。 如果你不在乎libiconv的版本&#xff0c;可以参考 …

DevOps死了吗?平台工程能否取代DevOps?

最近&#xff0c; Scott Carey 发表了一篇调查文章&#xff0c;喊出了一些开发者的心声&#xff1a;“扯淡的DevOps&#xff0c;我们开发者根本不想做运维&#xff01;”除此之外&#xff0c;软件工程师兼DevOps评论员Sid Palas也在推特上写道&#xff0c;“DevOps已死&#xf…

C++知识点 -- 特殊类设计

C知识点 – 特殊类设计 文章目录 C知识点 -- 特殊类设计一、不能被拷贝的类二、 只能在堆上创建对象的类三、 只能在栈上创建对象的类四、 不能被继承的类五、 只能创建一个对象的类&#xff08;单例模式&#xff09;1.饿汉模式2.懒汉模式3. 单例对象释放问题&#xff1a; 一、…

【Python入门篇】——Python中判断语句(布尔类型,比较运算符,if语句)

作者简介&#xff1a; 辭七七&#xff0c;目前大一&#xff0c;正在学习C/C&#xff0c;Java&#xff0c;Python等 作者主页&#xff1a; 七七的个人主页 文章收录专栏&#xff1a; Python入门&#xff0c;本专栏主要内容为Python的基础语法&#xff0c;Python中的选择循环语句…

Verilog 编程——奇偶分频(50%占空)

引言 最近准备一些笔试面试&#xff0c;想再把时钟奇偶分频的再整理一下。 我之前写过一个PWM产生的模块&#xff0c;里面有任意频率/占空比的时钟生成。可以参考&#xff1a; 基于FPGA的PWM发生器设计https://blog.csdn.net/qq_43045275/article/details/128365705?ops_re…

Scala学习(一)

1.什么是Scala Scala将面向对象和函数式编程结合成一种简洁的高级语言。Scala的静态类型有助于避免复杂应用程序中的错误。 1.1 为什么要学习Scala&#xff1f; Spark基于内存的大数据计算框架&#xff0c;而Spark就是Scala开发的。所以为了学习好Spark需要掌握Scala语言。 …

learn C++ NO.3 ——类和对象(1)

1.初步理解面向过程和面向对象 C语言是面向过程的高级编程语言&#xff0c;而C是面向对象的高级编程语言。那么两者有什么区别呢&#xff1f;且看下图分析。 面向过程语言就是逐步拆分并解决问题。其特点是过程化和模块化&#xff0c;数据和对数据的操作是分离的。 由于面向过…

《LeetCode》—— 哈希

今天刷题讲解的主要讲的是关于——哈希这个知识点的题目讲解。 目录 &#xff08;一&#xff09;缺失的第一个正整数 &#xff08;二&#xff09;数组中只出现一次的两个数字 1、直接法 2、哈希 &#xff08;三&#xff09;直线上最多的点数 &#xff08;一&#xff09;缺…

力扣题库刷题笔记735-行星碰撞

1、题目如下&#xff1a; 2、个人Python代码实现 个人代码思路&#xff0c;主要是新建一个列表stack&#xff0c;将原列表asteroids中的元素依次加入到stack中。以上代码可能会有两部分比较冗余的部分&#xff0c;一是两个标志位可以不用单独声明&#xff0c;二是当stack列表中…

解析内存中的高性能图结构

在进行各种图处理、图计算、图查询的时候&#xff0c;内存或是硬盘中如何存储图结构是一个影响性能的关键因素。本文主要分析了几种常见的内存图结构&#xff0c;及其时间、空间复杂度&#xff0c;希望对你有所启发。 通常来说&#xff0c;对于图结构的几种常见的基础操作&…

通过SSH隧道安全消费Kafka数据

一.背景 由于我们有个业务在阿里云部署了Kafka&#xff0c;但是想直接在本地IDC机房服务器直接通过公网消费Kafka进行业务处理。这个本来也不是什么难事&#xff0c;阿里云把9092默认端口打开运行访问即可&#xff0c;也不不值得再写这篇博客了。 这个事情让人特别关注的一个主…

【记录】ChatGPT|图片预览魔法咒语魔改,使用 ChatGPT 返回大量可以跳转的链接

很早的时候&#xff0c;我已经留意到 ChatGPT 会以返回图片的 markdown 格式来显示图片&#xff0c;很可能拥有一定的图片上传功能&#xff0c;但是它往往会显示得有些问题。一些代码图片之类的或者风景图什么的都不是很会。 但其实 ChatGPT 是可以直接返回图片类型的回复的&a…

C++初始化列表

1.初始化列表概述 初始化列表&#xff1a;以一个冒号开始&#xff0c;接着是一个以逗号分隔的数据成员列表&#xff0c;每个"成员变量"后面跟一个放在括号中的初始值或表达式。 2.为什么使用初始化列表 在创建对象时&#xff0c;编译器通过调用构造函数&#xff0c…

个人电脑操作系统

UEFI&#xff08;Unified Extensible Firmware Interface&#xff0c;全称统一的可扩展固件接口&#xff09;是一种个人电脑系统规格&#xff0c;用来定义操作系统与系统固件之间的软件界面&#xff0c;作为BIOS的替代方案。其前身是Intel在1998年开始开发的Intel Boot Initiat…

【static_cast、reinterpret_cast、const_cast、dynamic_cast】C++类型转换

C类型转换 引入C语言中的类型转换 C的强制类型转换static_castreinterpret_catconst_castdynamic_cast向下转型的安全问题 explicit4种类型转换的应用场景 RTTI 引入 C语言中的类型转换 C语言和C都是强类型语言&#xff0c;如果赋值运算符左右两侧变量的类型不同&#xff0c;…