Mysql底层原理六:InnoDB 数据页结构

news2024/10/6 12:28:55

1.行格式

1.1 Compact行格式

1.1.1 示意图

1.1.2 准备一下

1)建表
mysql>	CREATE	TABLE	record_format_demo	(
   	->    	c1	VARCHAR(10),
   	->    	c2	VARCHAR(10)	NOT	NULL,
   	->    	c3	CHAR(10),
   	->    	c4	VARCHAR(10)
   	->	)	CHARSET=ascii	ROW_FORMAT=COMPACT;
Query	OK,	0	rows	affected	(0.03	sec)

2)插入数据
mysql>	INSERT	INTO	record_format_demo(c1,	c2,	c3,	c4)	VALUES('aaaa',	'bbb',	'cc',	'd'),	('eeee',	'fff',	NULL,
NULL);
Query	OK,	2	rows	affected	(0.02	sec)
Records:	2 	Duplicates:	0 	Warnings:	0

4)查看一下
mysql>	SELECT	*	FROM	record_format_demo;
+------+-----+------+------+
|	c1  	|	c2 	|	c3  	|	c4  	|
+------+-----+------+------+
|	aaaa	|	bbb	|	cc  	|	d   	|
|	eeee	|	fff	|	NULL	|	NULL	|
+------+-----+------+------+
2	rows	inset	(0.00	sec)

1.1.3 变长字段长度列表

我们知道Mysql支持一些变长的数据类型,比如VARCHAR(M)、各种TEXT类型,各种BLOG类型,我们也可以把拥有这些数据类型的列称为 变长字段变长字段中存储多少字节的数据是不固定的,所以我们在存储真实数据的时候需要顺便把这些数据占用的字节也存起来。

1)INSERT INTO record_format_demo(c1, c2, c3, c4) VALUES  (‘aaaa’, ‘bbb’, ‘cc’, ‘d’)

由于是ascii字符集,所以每个字符占一个字节,所以变长列(这里不包含cc,因为是char)每个长度为 04 03 01,另外非常重要的一点是:变长字段长度列表是逆序排列的,所以最终的的列表为 01 03 04。

用图来表示就是:

提出问题:当列中出现NULL时怎么存储那?往下看😘

2)INSERT INTO record_format_demo  (c1, c2, c3, c4)  VALUES  (‘eeee’, ‘fff’, NULL,NULL)

1)上面的列都是非NULL的,如果出现NULL怎么存储那?**答案是:值为NULL的列是不存储的。**也就是说对于2)来说,c4列为NULL,所以第二条记录只需要存储c1和c2的列长度即可(c3是char,不是变长列)。

用图来表示就是:

1.1.4 NULL值列表

1)存放规则
  1. 是什么列都会算进去吗?:主键列、被NOT NULL修饰的列都是不可以存储NULL值的,所以在统计的时候不会把这些列算进去。⽐⽅说表record_format_demo的3个列 c1、c3、c4都是允许存储NULL值的,⽽c2列是被NOT NULL修饰,不允许存储NULL值。只统计NOT NULL的列
  2. 按照什么规则来统计 NOT NULL的列那?:1、用位来表示,1表示NULL,0表示NOT NULL; 2、逆序

2)举例说明

像上面的的表record_format_demo有3个值允许为NULL,所以这3个列和二进制的对应关系如下:

4)第一条记录怎么存

INSERT INTO record_format_demo(c1, c2, c3, c4) VALUES  (‘aaaa’, ‘bbb’, ‘cc’, ‘d’),因为这条记录没有null值,所以存储之后长这个样:

5) 第二条记录怎么存

INSERT INTO record_format_demo  (c1, c2, c3, c4)  VALUES  (‘eeee’, ‘fff’, NULL,NULL),由于这条记录中c3和c4都为NULL,所以这3个列对应的二进制的情况如下:

6)有个规则要说明一下

为什么上面两个图都展示的是8个位,因为总共就3个位,如果NOT NULL 超过8个位,那就要用2个字节表示。

7) 两条记录完整展示

1.1.5 记录头信息

1)说明

除了变⻓字段⻓度列表、NULL值列表之外,还有⼀个⽤于描述记录的记录头信息,它是由固定的5个字节组成。5个字节也就是40个⼆进制位。

2)图示

3)拿第一条记录图示说明

这个说明 head_no有值、next_record有值。

1.1.6 记录的真实数据

1)真实数据里还有“假数据”

对于record_format_demo来说,记录的真实数据除了c1、c2、c3、c4这⼏个我们⾃⼰定义的列的数据以外,MySQL会为每个记录默认的添加⼀些列(也称为隐藏列),具体的列如下:

**这里需要提一下InnoDB表对主键的生成策略:优先使用用户自定义的主键作为主键,如果没有就是用Unique键作为主键,如果都没有的话,InnoDB会为表默认生成一个名为row_id的隐藏列作为主键。**其余两个transaction_id、roll_pointer是一定有的,row_id是可选的。

2) 两条记录完整展示

注意以下几点:

  1. 由于record_format_demo没有定义主键,所以会生成row_id
  2. 表record_format_demo使⽤的是ascii字符集,所以0x61616161就表示字符串’aaaa’,0x626262就表示字符串’bbb’,以此类推
  3. **char的填充策略:**注意第1条记录中c3列的值,它是CHAR(10)类型的,它实际存储的字符串是:‘cc’,⽽ascii字符集中的字节表示是’0x6363’,虽然表示这个字符串只占⽤了 2个字节,但整个c3列仍然占⽤了10个字节的空间,除真实数据以外的8个字节的统统都⽤空格字符填充,空格字符在ascii字符集的表示就是0x20
  4. **有了NULL值列表,真实列就不需要存储了:**第2条记录中c3和c4列的值都为NULL,它们被存储在了前边的NULL值列表处,在记录的真实数据处就不再冗余存储,从⽽节省存储空间。

1.2 Redundant行格式

Redundant⾏格式是MySQL5.0之前⽤的⼀种⾏格式,也就是说它已经⾮常⽼ 了,如果想研究可以自己看小册。

1.3 Dynamic和Compressed行格式

下边要介绍另外两个⾏格式,Dynamic和Compressed⾏格式,我现在使⽤的MySQL版本是5.7,它的默认⾏格式就是Dynamic,这俩⾏格式和Compact⾏格式挺像, 只不过在处理⾏溢出数据时有点⼉分歧,它们不会在记录的真实数据处存储字段真实数据的前768个字节,⽽是把所有的字节都存储到其他⻚⾯中,只在记录的真 实数据处存储其他⻚⾯的地址,就像这样(可以理解为引用,768个字节如果换成200多个引用是不是更好拿):😨

2、总结

1)⻚是MySQL中磁盘和内存交互的基本单位,也是MySQL是管理存储空间的基本单位。

2)指定和修改⾏格式的语法如下:

CREATE TABLE 表名 (列的信息) ROW_FORMAT=⾏格式名称

ALTER TABLE 表名 ROW_FORMAT=⾏格式名称

3)InnoDB目前定义了4种行格式:

Compact:

Redundant:

Dynamic和Compressed⾏格式

这两种⾏格式类似于COMPACT⾏格式,只不过在处理⾏溢出数据时有点⼉分歧,它们不会在记录的真实数据处存储字符串的前768个字节,⽽是把所有的 字节都存储到其他⻚⾯中,只在记录的真实数据处存储其他⻚⾯的地址。 另外,Compressed⾏格式会采⽤压缩算法对⻚⾯进⾏压缩。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1583528.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Web前端—属性描述符

属性描述符 假设有一个对象obj var obj {a:1 }观察这个对象,我们如何来描述属性a: 值为1可以重写可以遍历 我们可以通过Object.getOwnPropertyDescriptor得到它的属性描述符 var desc Object.getOwnPropertyDescriptor(obj, a); console.log(desc);我…

AD转换(模数转换)

一、AD的基本概念 AD转换是将时间连续和幅值连续的模拟量转换为时间离散、幅值也离散的数字量。使输出的数字量与输入的模拟量成正比。 AD转换的过程有四个阶段,即采样、保持、量化和编码。 采样是将连续时间信号变成离散时间信号的过程。经过采样,时间…

基于 SSM 医院病历管理系统的设计与实现

摘 要 病历管理系统是医院管理系统的重要组成,在计算机技术快速发展之前,病人或者医生如果想记录并查看自己的健康信息是非常麻烦的,因为在以往病人的健康信息通常只保存在自己的病历卡或者就诊报告中,如果在就诊时想进行查看只能通过观看…

文件处理的神器,一键上传签署,安全又高效!

客户介绍 某技术股份有限公司是一家在高科技领域深耕多年的知名企业,专注于技术创新与产品研发,致力于为客户提供前沿、高效的解决方案。在业务范围方面,该公司涵盖了多个领域,包括智能制造、新能源、信息技术等。公司凭借卓越的…

VBA_NZ系列工具NZ04:VBA网络连接测试使用说明

我的教程一共九套及VBA汉英手册一部,分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的入门,到数据库,到字典,到高级的网抓及类的应用。大家在学习的过程中可能会存在困惑,这么多知识点该如何组织…

Qt Creator 新建项目

🐌博主主页:🐌​倔强的大蜗牛🐌​ 📚专栏分类:QT❤️感谢大家点赞👍收藏⭐评论✍️ 目录 一、使用 Qt Creator 新建项目 1、新建项目 2、选择项目模板 3、选择项目路径 4、选择构建系统 5…

linux大文件IO

在Linux中处理大文件(通常指大小超过2GB的文件)时,需要使用特定的系统调用和标志,以确保程序能够正确地处理大文件的读写。这主要是因为在32位系统上,传统的文件偏移量和文件大小使用off_t类型表示,它通常是…

115.不同的子序列

给你两个字符串 s 和 t ,统计并返回在 s 的 子序列 中 t 出现的个数,结果需要对 109 7 取模。 示例 1: 输入:s "rabbbit", t "rabbit" 输出:3 解释: 如下所示, 有 3 种可以从 s 中…

基于RBF的时间序列预测模型matlab代码

整理了基于RBF的时间序列预测模型matlab代码, 包含数据集。采用了四个评价指标R2、MAE、MBE、MAPE对模型的进行评价。RBF模型在数据集上表现非常好。 训练集数据的R2为:0.99463 测试集数据的R2为:0.96973 训练集数据的MAE为:0.…

本地linux怎样先亚马逊云服务器上传文件

使用亚马逊云服务器的密钥&#xff0c;并通过srp命令&#xff0c; 连接上传&#xff1a; scp -i <密钥文件路径> <本地文件路径> <远程主机用户名><远程主机地址>:<目标路径> scp -i assig2.pem data.txt ubuntuec2-xx-xxx-xx-xx1.compute-x.…

hadoop103: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

分析&#xff1a; 在启动hadoop服务的时候&#xff0c;遇到了这个问题&#xff1a; hadoop103: Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 这个一看就是&#xff0c;密钥问题 于是ssh 主机名就行测试 需要输入密码&#xff0c;就说明这里有问…

Prometheus+grafana监控nacos和spring-boot服务(增加自定义指标)(七)

前面记录了项目中常用的各种中间件的指标采集器的用法及搭建方式 &#xff0c; 由于所有组件写一篇幅过长&#xff0c;所以每个组件分一篇方便查看&#xff0c;前六篇链接如下 Prometheusgrafana环境搭建方法及流程两种方式(docker和源码包)(一)-CSDN博客 Prometheusgrafana…

[lesson16]类的真正形态

类的真正形态 类的关键字 struct在C语言中以及有了自己的含义&#xff0c;必须继续兼容 在C中提供了新的关键字class用于类的定义 class和struct的用法是完全相同的 在用struct定义类时&#xff0c;所有成员的默认访问级别为public 在用class定义类时&#xff0c;所有成员…

奇怪的电梯

题目描述&#xff1a; 思路&#xff1a; 见代码注释 AC代码&#xff1a; #include <bits/stdc.h> using namespace std; int n, A, B; int t[250]; //记录到达每层所用的最短时间 int a[250]; void dfs(int lou, int sum) {//lou是当前的楼层数&#xff0c;sum为当前按…

finalshell连接VM虚拟机报错,java,net.ConnectException: Connection timed out: connect

适用于&#xff0c;所有第三方连接虚拟机报错。 java,net.ConnectException: Connection timed out: connect Xshell啊什么的。 解决方法&#xff1a; 首先&#xff0c;我想确认一下是否已经安装了finalshell软件并且要连接的CentOS 7服务器已经设置好了。连接不上的问题有很…

nodejs实现TCP端口转发并截包的小工具

近期我正致力于开发一个基于 Go-CQHTTP 的 QQ 机器人应用程序项目&#xff0c;该项目现已成功实现了 Go-CQHTTP 的容器化部署&#xff0c;利用 Docker 技术确保其运行环境的一致性与便捷性。随着项目推进&#xff0c;接下来的工作重心转向部署配套的签名服务器&#xff08;qsig…

eNSP-抓包解析TCP三次握手和四次挥手的过程

一、环境搭建 1.设备连接 并 启动所有设备 2.服务器配置 3.客服端配置 二、抓包测试 1.打开抓包软件 2.客户端获取数据 三、抓包结果

【自控笔记】线性系统时域分析法

动态稳态性能 一阶系统 二阶系统 二阶系统单位阶跃 系统稳定性分析

PyQt介绍——QChart饼图图表

在PyQt5中&#xff0c;我们可以使用QChart模块来创建各种类型的图表&#xff0c;包括饼图。饼图是一种常用的数据可视化方式&#xff0c;用于展示不同类别在整体中的比例关系。 安装相关的库&#xff1a; 不包含在PyQt5里面&#xff0c;需要另外安装 pip install PyQtChart …

前端工程化理解 (2024 面试题)

最好介绍远古世界最好随性一点&#xff0c;不要太刻板 &#xff0c;不然像背书 什么是前端工程化&#xff1f; - 知乎 前端工程化的历史 互联网初期&#xff0c;09 年以前&#xff0c;页面只需要展示一些列表、表格、文章内容以及简单图片即可&#xff0c;其目的是为了传送信…