5.5 【MySQL】Page Header(页面头部)

news2024/11/23 3:05:15

在页中定义了一个叫Page Header的部分,它是页结构的第二部分,这个部分占用固定的56个字节,专门存储各种状态信息,具体如下:

名称

占用空间大小

描述

PAGE_N_DIR_SLOTS

2 字节

在页目录中的槽数量

PAGE_HEAP_TOP

2 字节

还未使用的空间最小地址,也就是说从该地址之后就是 Free Space

PAGE_N_HEAP

2 字节

本页中的记录的数量(包括最小和最大记录以及标记为删除的记录)

PAGE_FREE

2 字节

第一个已经标记为删除的记录地址(各个已删除的记录通过 next_record 也会组成一个单链表,这个单链表中的记录可以被重新利用)

PAGE_GARBAGE

2 字节

已删除记录占用的字节数

PAGE_LAST_INSERT

2 字节

最后插入记录的位置

PAGE_DIRECTION

2 字节

记录插入的方向

PAGE_N_DIRECTION

2 字节

一个方向连续插入的记录数量

PAGE_N_RECS

2 字节

该页中记录的数量(不包括最小和最大记录以及被标记为删除的记录)

PAGE_MAX_TRX_ID

8 字节

修改当前页的最大事务ID,该值仅在二级索引中定义

PAGE_LEVEL

2 字节

当前页在B+树中所处的层级

PAGE_INDEX_ID

8 字节

索引ID,表示当前页属于哪个索引

PAGE_BTR_SEG_LEAF

10 字节

B+树叶子段的头部信息,仅在B+树的Root页定义

PAGE_BTR_SEG_TOP

10 字节

B+树非叶子段的头部信息,仅在B+树的Root页定义

PAGE_DIRECTION

假如新插入的一条记录的主键值比上一条记录的主键值大,我们说这条记录的插入方向是右边,反之则是左边。用来表示最后一条记录插入方向的状态就是 PAGE_DIRECTION 。

PAGE_N_DIRECTION

假设连续几次插入新记录的方向都是一致的, InnoDB 会把沿着同一个方向插入记录的条数记下来,这个条数就用 PAGE_N_DIRECTION 这个状态表示。当然,如果最后一条记录的插入方向改变了的话,这个状态的值会被清零重新统计。

5.6 File Header(文件头部)

上边说的 Page Header 是专门针对 数据页 记录的各种状态信息,比方说页里头有多少个记录了,有多少个槽。现在描述的 File Header 针对各种类型的页都通用,也就是说不同类型的页都会以 File Header 作为第一个组成部分,它描述了一些针对各种页都通用的一些信息,比方说这个页的编号是多少,它的上一个页、下一个页是谁。这部分占用固定的38个字节,是由下边这些内容组成的:

名称

占用空间大小

描述

FIL_PAGE_SPACE_OR_CHKSUM

4 字节

页的校验和(checksum值)

FIL_PAGE_OFFSET

4 字节

页号

FIL_PAGE_PREV

4 字节

上一个页的页号

FIL_PAGE_NEXT

4 字节

下一个页的页号

FIL_PAGE_LSN

8 字节

页面被最后修改时对应的日志序列位置(英文名是:Log SequenceNumber)

FIL_PAGE_TYPE

2 字节

该页的类型

FIL_PAGE_FILE_FLUSH_LSN

8 字节

仅在系统表空间的一个页中定义,代表文件至少被刷新到了对应的LSN值

FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID

4 字节

页属于哪个表空间

对照着这个表格,我们看几个目前比较重要的部分:

FIL_PAGE_SPACE_OR_CHKSUM

这个代表当前页面的校验和(checksum)。啥是个校验和?就是对于一个很长很长的字节串来说,我们会通过某种算法来计算一个比较短的值来代表这个很长的字节串,这个比较短的值就称为 校验和 。这样在比较两个很长的字节串之前先比较这两个长字节串的校验和,如果校验和都不一样两个长字节串肯定是不同的,所以省去了直接比较两个比较长的字节串的时间损耗。

FIL_PAGE_OFFSET

每一个 页 都有一个单独的页号,就跟你的身份证号码一样, InnoDB 通过页号来可以唯一定位一个 页 。

FIL_PAGE_TYPE

这个代表当前 页 的类型,我们前边说过, InnoDB 为了不同的目的而把页分为不同的类型,我们上边介绍的其实都是存储记录的 数据页 ,其实还有很多别的类型的页,具体如下表: |类型名称|十六进制|描述| |:--:|:--:|:--:| | FIL_PAGE_TYPE_ALLOCATED |0x0000|最新分配,还没使用| | FIL_PAGE_UNDO_LOG |0x0002|Undo日志页|| FIL_PAGE_INODE |0x0003|段信息节点| | FIL_PAGE_IBUF_FREE_LIST |0x0004|Insert Buffer空闲列表|| FIL_PAGE_IBUF_BITMAP |0x0005|Insert Buffer位图| | FIL_PAGE_TYPE_SYS |0x0006|系统页|| FIL_PAGE_TYPE_TRX_SYS |0x0007|事务系统数据| | FIL_PAGE_TYPE_FSP_HDR |0x0008|表空间头部信息|| FIL_PAGE_TYPE_XDES |0x0009|扩展描述页| | FIL_PAGE_TYPE_BLOB |0x000A|BLOB页|| FIL_PAGE_INDEX |0x45BF|索引页,也就是我们所说的 数据页 |

我们存放记录的数据页的类型其实是 FIL_PAGE_INDEX ,也就是所谓的 索引页 。

FIL_PAGE_PREV 和 FIL_PAGE_NEXT

InnoDB 都是以页为单位存放数据的,有时候我们存放某种类型的数据占用的空间非常大(比方说一张表中可以有成千上万条记录), InnoDB 可能不可以一次性为这么多数据分配一个非常大的存储空间,如果分散到多个不连续的页中存储的话需要把这些页关联起来, FIL_PAGE_PREV 和 FIL_PAGE_NEXT就分别代表本页的上一个和下一个页的页号。这样通过建立一个双向链表把许许多多的页就都串联起来了,而无需这些页在物理上真正连着。需要注意的是,并不是所有类型的页都有上一个和下一个页的属性,不过我们本集中唠叨的 数据页 (也就是类型为 FIL_PAGE_INDEX 的页)是有这两个属性的,所以所有的数据页其实是一个双链表,就像这样:

5.7 File Trailer

我们知道 InnoDB 存储引擎会把数据存储到磁盘上,但是磁盘速度太慢,需要以 页 为单位把数据加载到内存中处理,如果该页中的数据在内存中被修改了,那么在修改后的某个时间需要把数据同步到磁盘中。但是在同步了一半的时候中断电了咋办,这不是莫名尴尬么?为了检测一个页是否完整(也就是在同步的时候有没有发生只同步一半的尴尬情况),设计 InnoDB 的大叔们在每个页的尾部都加了一个 File Trailer 部分,这个部分由 8 个字节组成,可以分成2个小部分:

前4个字节代表页的校验和

后4个字节代表页面被最后修改时对应的日志序列位置(LSN)

5.8 总结

1. InnoDB为了不同的目的而设计了不同类型的页,我们把用于存放记录的页叫做 数据页 。

2. 一个数据页可以被大致划分为7个部分,分别是

File Header ,表示页的一些通用信息,占固定的38字节。

Page Header ,表示数据页专有的一些信息,占固定的56个字节。

Infimum + Supremum ,两个虚拟的伪记录,分别表示页中的最小和最大记录,占固定的 26 个字节。

User Records :真实存储我们插入的记录的部分,大小不固定。

Free Space :页中尚未使用的部分,大小不确定。

Page Directory :页中的某些记录相对位置,也就是各个槽在页面中的地址偏移量,大小不固定,插入的记录越多,这个部分占用的空间越多。

File Trailer :用于检验页是否完整的部分,占用固定的8个字节。

3. 每个记录的头信息中都有一个 next_record 属性,从而使页中的所有记录串联成一个 单链表 。

4. InnoDB 会为把页中的记录划分为若干个组,每个组的最后一个记录的地址偏移量作为一个 槽 ,存放在Page Directory 中,所以在一个页中根据主键查找记录是非常快的,分为两步:

通过二分法确定该记录所在的槽。

通过记录的next_record属性遍历该槽所在的组中的各个记录。

5. 每个数据页的 File Header 部分都有上一个和下一个页的编号,所以所有的数据页会组成一个 双链表 。

6. 为保证从内存中同步到磁盘的页的完整性,在页的首部和尾部都会存储页中数据的校验和和页面最后修改时对应的 LSN 值,如果首部和尾部的校验和和 LSN 值校验不成功的话,就说明同步过程出现了问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1002539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL数据库——存储引擎(2)-存储引擎特点(InnoDB、MyISAM、Memory)、存储引擎选择

目录 存储引擎特点 InnoDB 介绍 特点 文件 逻辑存储结构 MyISAM 介绍 特点 文件 Memory 介绍 特点 文件 区别及特点 存储引擎选择 存储引擎特点 上面我们介绍了什么是存储引擎,以及如何在建表时如何指定存储引擎,接下来我们就来介绍比较…

【脑机接口】基于电子皮肤的先进可穿戴健康管理技术

第一作者:Vibhas Chugh 通讯单位:佛罗里达理工大学,印度摩哈利纳米科学与技术研究所. DOI: 10.1016/j.crbiot.2023.100129 背景介绍 人类的皮肤是与外界环境隔离的天然屏障,它具有感知各种感觉、温度变化和触摸压力的能力。皮…

python3在虚拟环境实用vscode调试错误输出ModuleNotFoundError: No module named ‘django‘解决方法

Exception has occurred: ImportError Couldnt import Django. Are you sure its installed and available on your PYTHONPATH environment variable? Did you forget to activate a virtual environment?File "/data/mountain-backend/src/manage.py", line 8, i…

科普|含铊废水的来源及处理工艺介绍

铊(Tl)是一种银白色的金属,由于具有良好的延展性和导电性,被广泛用于电子、军工、航天、化工、冶金等众多领域。但在自然环境中含量很低,常在铅、铁、锌、铜等金属硫化矿中伴生,还以有机物结合形式存在于煤田和石油中。 铊的对于人…

数字化转型背景下企业知识管理能力提升路径

近年来,科技不断进步,颠覆性技术(例如 5G、云计算、物联网、大数据分析和人工智能等)正在重新定义企业如何管理项目和运营效率。知识管理体系亦需要随着科技的进步而改变,以适应新的数字时代环境,并且高效知…

【算法题】1462. 课程表 IV

题目: 你总共需要上 numCourses 门课,课程编号依次为 0 到 numCourses-1 。你会得到一个数组 prerequisite ,其中 prerequisites[i] [ai, bi] 表示如果你想选 bi 课程,你 必须 先选 ai 课程。 有的课会有直接的先修课程&#x…

Python从零到一构建项目

随着互联网的发展,网络上的信息量急剧增长,而获取、整理和分析这些信息对于很多人来说是一项艰巨的任务。而Python作为一种功能强大的编程语言,它的爬虫能力使得我们能够自动化地从网页中获取数据,大大提高了效率。本文将分享如何…

tkinter树形图组件

文章目录 初步回调函数绑定滚动条 初步 Treeview是ttk中的树形表组件,功能十分强大,非常适用于系统路径的表达。为了知道属性图到底是什么,下面先做个最简单的树形图 其代码如下 import tkinter as tk from tkinter import ttkdct {"…

datagridview设置随窗口改变大小

1,只需设置Anchor属性 2,捕捉Enter键 设置AcceptButton属性即可 这样的话,按下Enter键,直接到按钮btnApply

香橙派使用外设驱动库wiringOP 配合定时器来驱动舵机

舵机认识和硬件接线 关于舵机也是使用过很多次了,详见: 使用PWM波控制开发SG90-CSDN博客 同时再次回顾香橙派的物理引脚对应: 所以舵机的VCC接 2,GND接 6,PWM接 7(此处写的是物理引脚编号) Li…

9月11日作业

思维导图 代码 #include <iostream> #include<string.h>using namespace std;class myString { private:char *str; //记录c风格的字符串int size; //记录字符串的实际长度 public://无参构造myString():size(10){str new char[size]; …

JAVAWEB,tomcat,MVC

注意,这里有三大语言来实现动态网页技术 如果用户访问的是静态内容,比如固定html页面,web服务器就够了 其中,中间件帮忙处理很多东西,复杂的东西他来帮忙完成 正常来说,搭建web服务需要web服务器,web容器两个东西,但是tomcat相当于集成了这两个,不过有些项目里不会把tomcat当做…

借助ChatGPT使用Pandas实现Excel数据汇总

一、问题的提出 现在有如下一个Excel表&#xff1a; 上述Excel表中8万多条数据&#xff0c;记录的都是三年以来花菜类的销量&#xff0c;现在要求按月汇总实现统计每个月花菜类的销量总和&#xff0c;如果使用Python的话要给出代码。 二、问题的解决 1.首先可以用透视表的方…

BGA封装检测

1.BGA封装检测 1.1 应用示例目的与思路 (1) 从输入图像中裁剪出包含BGA区域的图像&#xff1b; (2) 对BGA区域进行特征筛选&#xff0c;筛选出尺寸和形状均不正常的球形焊点&#xff1b; (3) 对尺寸和形状不正常的球形焊点分别用圆和交叉线标记出来。 1.2 应用示例相关算子…

【算法挨揍日记】day04——15. 三数之和、18. 四数之和

15. 三数之和 15. 三数之和https://leetcode.cn/problems/3sum/ 题目描述&#xff1a; 给你一个整数数组 nums &#xff0c;判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k &#xff0c;同时还满足 nums[i] nums[j] nums[k] 0 。请你返回所…

零基础报考湖北省叉车N1特种设备作业Z难不难?

零基础报考湖北省叉车N1特种设备作业Z难不难&#xff1f; 零基础报考叉车指的是没有从事叉车行业&#xff0c;没有实际操作经验的这类人员报考湖北特种设备作业人员N1(叉车)难度。叙后尘告诉你其实蛮简单。跟你梳理一下报考相关事项。 湖北叉车报考-在哪里报名 正常来说自己报…

日常练习-4

目录 一、选择题 二、算法题 1、统计回文 2、连续最大和 一、选择题 1、 解析&#xff1a; p1是一个字符数组&#xff0c;存储了"abcd"&#xff0c;p2是一个字符指针&#xff0c;指向了"ABCD"&#xff0c;str是一个字符数组&#xff0c;存储了"xyz&…

手写一个摸鱼神器:使用python手写一个看小说的脚本,在ide中输出小说内容,同事直呼“还得是你”

文章目录 一、准备python环境二、分析小说网的章节目录三、分析小说网的章节内容四、编写python脚本五、验证一下吧 一、准备python环境 windows从0搭建python3开发环境与开发工具 Python爬虫基础&#xff08;一&#xff09;&#xff1a;urllib库的使用详解 Python爬虫基础&a…

PyTorch深度学习实践1——线性回归和Logistic回归

PyTorch的风格 准备数据集使用类设计模型计算损失函数和优化器训练【前向、反向和更新】 线性回归 import torch# 准备数据集 # x,y是矩阵&#xff0c;3行1列 也就是说总共有3个数据&#xff0c;每个数据只有1个特征 x_data torch.tensor([[1.0], [2.0], [3.0]]) y_data to…

关于Java的类加载机制

1、概述 类会在运行期间第一次使用时&#xff0c;被类加载器动态加载至JVM。JVM不会一次性加载所有类。因为如果一次性加载&#xff0c;会占用很多的内存。 2、类的生命周期 类的生命周期包括以下 7 个阶段&#xff1a; 加载&#xff08;Loading&#xff09;验证&#xff08;…