mysql InnoDB行记录格式

news2025/1/12 17:49:15

在介绍索引的文章已经知道。InnoDB的表数据被拆分成不同的数据页上,默认一个数据页大小是16kb,分布在聚簇索引的叶子节点上。被挂在B+树上。一条行记录除了要保存每列具体数据值还会有一些标识位信息。另外对于超长数据存储也有特殊处理。

那么具体到一行数据多个列数据是怎么组织的呢?InnoDB存储引擎提供4种行格式: REDUNDANT, COMPACT, DYNAMIC和COMPRESSED。

下图是4种行格式的对比:

Row Format紧凑存储加强可变长度存储长索引key支持是否支持压缩支持表空间类型
REDUNDANTNoNoNoNosystem, file-per-table, general
COMPACTYesNoNoNosystem, file-per-table, general
DYNAMICYesYesYesNosystem, file-per-table, general
COMPRESSEDYesYesYesYesfile-per-table, general

这4种行格式其实后面的三种在数据格式上是一样的,只有REDUNDANT与其它三种格式不同。REDUNDANT是5.0之前的数据格式,已经过时了。从5.7之后版本默认行记录格式是DYNAMIC。

行数据的基本格式

行数据基本格式大致如下:

在这里插入图片描述

其中蓝色部分是行真正存储的数据区,是所有的列数据byte按顺序紧密连接在一起。黄色区域是非数据区,都是一些标识位信息。这一块几种行格式会有两种表现形式。

ROW_ID

如果没有主键,会有一个6字节长度的ROW_ID用来标识该列。

TRX_ID和ROLL_POINTER

每一行还有一个6字节的事务ID和7字节长度的回滚指针,这都是用来事务操作的。

头信息

头信息REDUNDANT 占用6个字节,其它占用5个字节。头信息中会有一些标识为,比如会存储下一行记录的地址信息。行是否被删除等等。

NULL列标识位

null列标识位REDUNDANT 格式是没有的,只有其它三种有。这个就是使用一个bit向量来标识每一列(这里的每一列是指的在表定义时候该列没有非空约束)是否为空,如果为NULL,则对应bit位为1。这部分字节长度由表中可空列的数量来决定,如小于8列则用一个字节长度就可以标识,如9~16长度则需要两个字节,依次类推这个也很好理解。

对于NULL的列,REDUNDANT 格式下如果列是可变长度不会在数据区进行存储,如果是定长列则会在蓝色数据区也占用相同的定长空间。而其它三种数据格式NULL值在数据区不占空间。

变长字段长度标识列表

这一部分是用来干什么的呢?想想前面的蓝色数据区是紧凑的字节连接在一起的,对于变长列数据长度又不是固定的,在数据查询抽取的时候怎么拆分每列数据呢?这里这部分就是用来标识每个变长列的字节长度的。只不过REDUNDANT和其它三种这里存储变长长度值格式又些不同。

REDUNDANT采用长度偏移量来表示。如果所有列长度小于127则每列长度使用一个字节来表示,否则使用两个字节。这里说的字节长度是每一列的长度偏移量都使用这么长的字节数。举个例子有三个列数据长度为10、20、30字节。长度总和为60则,每列长度偏移量使用1个字节就可以了。具体存储偏移量(0,10,30)。在header头部分有标识位标识使用1个字节还是2个字节。

其它三种,对于所有的非空可变长度列。如果列定义最大字节数不超过255字节(注意这里是列定义,也就是varchar(n)这样),则使用1个字节表示就可以了,因为一个字节整数最大值255。如果列定义允许最大长度超过255,这就需要分两种情况了,1、如果实际数据长度小于127字节,则用1个字节来表示其长度,2、若大于127字节则采用2字节来表示。这都是为了能省一个字节就省一个字节,要不然定义超过255直接两个字节长度就可以了。也没有必要过多去追究太细。

超长数据处理

InnoDB默认一个数据页大小是16kb,一个页上至少要存储2条记录。如果一行数据小于一个数据页的一半,则整行数据会存储在页内,如果超过了页的一半,可变长度列会被依次摘出存储在额外的空间(off-page)直到剩下行数据大小小于页的一般。这些单独分配的磁盘页称为溢出页(overflow pages)。这样的列称为页外列(off-page columns)。off-page columns的值存储在overflow pages的单链表中,每个这样的列都有自己的一个或多个overflow pages列表。对这4种行格式对于超长数据处理有一些不同

REDUNDANT和COMPACT 模式对于超长可变数据列,如果实际数据大小大于768字节,则在行数据上只会保留前768字节和对应溢出页的指针,超过的部分存储在溢出页。另外对于定长超过768同样按照这种方式处理。

DYNAMIC和COMPRESSED 模式对于实际数据大小超过768字节,则整个超长列数据都会存储在溢出页上,行记录上只保存一个到溢出页的指针。

长索引KEY

DYNAMIC和COMPRESSED两种模式还支持长索引key。也就是在一些超长字段上设置索引。索引key前缀最大长度只3072 字节。

配置行格式

默认行记录格式使用innodb_default_row_format变量来控制,如果在创建一个表的时候没有指定row_format,则默认使用ROW_FORMAT=DEFAULT来指定行记录格式。

查看当前默认行记录格式

SELECT @@innodb_default_row_format;

设置默认行记录格式

mysql> SET GLOBAL innodb_default_row_format=DYNAMIC;

可选值包括DYNAMIC、COMPACT和REDUNDANT。这里COMPRESSED不能被设置为默认行记录格式,因为COMPRESSED 模式不能使用在系统表空间上。

除了使用默认行记录格式,当然可以在创建表的时候显示的指定行记录格式

CREATE TABLE t1 (c1 INT) ROW_FORMAT=DYNAMIC;

查看当前表使用的行记录格式可以使用show table status like ‘表名’。

mysql> show table status like 'test'\G;
*************************** 1. row ***************************
           Name: test
         Engine: InnoDB
        Version: 10
     Row_format: Compact
           ...

或者可以从INFORMATION_SCHEMA.INNODB_TABLES表中查看。

实例分析

准备表

CREATE TABLE test (
	id INT(11) NOT NULL AUTO_INCREMENT,
	a VARCHAR(10) NOT NULL ,
	b VARCHAR(30) NULL DEFAULT NULL ,
	c TEXT NULL DEFAULT NULL ,
	PRIMARY KEY (id) USING BTREE
)ENGINE=InnoDB

先插入一条记录

INSERT INTO test (a, b, c) VALUES ('a', 'b', null);
INSERT INTO test (a, b, c) VALUES ('a', 'bb', null);

找到表对应的数据文件test.ibd,使用editplus十六进制格式查看,查找62,因为’a’的ascii码也就是16进制格式是62。

80 00 00 02 00 00 00 00  93 EA B0 00 00 01 24 01
10 61 62 02 01 02 00 00  20 FF B5 80 00 00 02 00
00 00 00 93 EF 33 00 00  01 D1 02 41 61 62 62 00

这里很明显能看到 61 62 这些是实际数据ab,那从他这里往后应该就是第二行数据了。然后61 62 62这个是第二行的实际数据,那么这种中间的就是第二行的标识位信息。

结合第二行数据:2|a|bb|null

1、可变长度列表(逆序):02 01 (代表两个有值可变长度列长度第一个是1,第二个长度是2)

2、NULL标识位:02 。这里表最后两列是可空字段,然后一列有值一列没有值。02二进制格式是00000010。这里看到也是逆序标识的。

3、5字节的header头:00 00 20 FF B5

4、4字节的rowID(主键):80 00 00 02。这里主键设置int自增占4字节,实际值是2,不知道第一字节80代表什么。

5、剩下两部分TRX_ID和roll_pointer:00 00 00 00 93 EF 33 00 00 01 D1 02 41。

一个6字节一个7字节长度,共13字节

6、数据部分:61 62 62 (abb的ascii码)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1403873.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第2章-OSI参考模型与TCP/IP模型

目录 1. 引入 2. OSI参考模型 2.1. 物理层 2.2. 数据链路层 2.3. 网络层 2.4. 传输层 2.5. 会话层 2.6. 表示层 2.7. 应用层 3. 数据的封装与解封装 4. TCP/IP模型 4.1. 背景引入 4.2. TCP/IP模型(4层) 4.3. 拓展 1. 引入 1)产…

Mac使用adb调试安卓手机

0x00 背景 最近windows电脑休息,用mac办公比较多,手机用时间长了,不太灵光,准备修理一番。于是要用mac调试下android手机。配置略显麻烦,网上的步骤多参差不齐。估计是入门步骤,大佬们也懒得写的太细。于是…

2024/1/18 DFS BFS

目录 奇怪的电梯 马的遍历 PERKET(个人认为很抽象) 奇怪的电梯 P1135 奇怪的电梯 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 思路,还是用的bfs,建立一个结构体类型的队列,一个存当前的电梯层数,一…

数据库-分库分表初探

文章目录 分库策略垂直切分垂直分库(专库专用)垂直分表(拆表)优点缺点 水平(Sharding)切分水平分表库内分表分库分表优点缺点 分表策略hash取模方案range范围区间取值方案映射表方案 分库分表问题事务一致性问题跨节点关联查询跨节…

React16源码: React中的completeUnitOfWork的源码实现

completeUnitOfWork 1 )概述 各种不同类型组件的一个更新过程对应的是在执行 performUnitOfWork 里面的 beginWork 阶段它是去向下遍历一棵 fiber 树的一侧的子节点,然后遍历到叶子节点为止,以及 return 自己 child 的这种方式在 performUni…

php no input file specified

一、修改 .user.ini 文件 内容 open_basedir/wab/led-sht.com/:/tmp/ led-sportslight.com是项目根目录位置 改好后保存并清空缓存硬刷新网站就行了 二、mkdir(): Permission denied /core/library/think/cache/driver/File.php 第 84 行左右 mkdir(): Permission denied 这个…

如何用 500 行 SQL 实现 GPT2学习

目录 理论背景实现过程GenerationTokenizerEmbeddingsAttention为什么我们需要有因果掩码?为什么矩阵是 Q,K 和 V? BlocksTokens为什么要使用 softmax 转换概率?Inference 俄罗斯有个大佬每年都会用 SQL 来实现一个挑战庆祝新年&a…

JOSEF约瑟 JGL-15静态带时限过流继电器 柜内安装,板前接线

系列型号 JGL-11反时限过流继电器;JGL-12反时限过流继电器; JGL-13反时限过流继电器;JGL-14反时限过流继电器; JGL-15反时限过流继电器;JGL-16反时限过流继电器; 用途: JGL-15 反时限过流继电器…

(十)Head first design patterns组合模式(c++)

组合模式 组合模式在参考链接中已经讲得很好了,这里只简单讲讲就好。 组合模式的意图是表达部分-整体层次结构。 当你需要管理一个组合对象,又要管理这个组合对象的单个对象。这个时候就可以让这个组合对象和单个对象继承同一个基类,以便用…

Android14实战:调整A2DP音量曲线(五十三)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只…

【YOLO系列】 YOLOv4之SAT自对抗训练

一、简介 自对抗训练(Self-Adversarial Training,简称SAT)是一种新型的数据增强技术,旨在通过神经网络自身进行的对抗式攻击来提高模型的鲁棒性和泛化能力。其主要分为两个阶段: 第一阶段,神经网络会对其原…

C# wpf利用Clip属性实现截屏框

wpf截屏系列 第一章 使用GDI实现截屏 第二章 制作截屏框(本章) ______第一节 使用DockPanel制作截屏框 ______第二节 利用Clip属性实现截屏框(本节) 第三章 实现截屏框热键截屏 第四章 实现截屏框实时截屏 第五章 使用ffmpeg命令行实现录屏 文章目录 wp…

JVM系列-1.初识JVM

👏作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家📕系列专栏:Spring原理、JUC原理、Kafka原理、分布式技术原理、数据库技术、JVM原理🔥如果感觉博主的文…

Netty篇章(1)—— 核心原理介绍

终于进入到Netty框架的环节了,前面介绍了大量的Java-NIO的内容,核心的内容Selector、Channel、Buffer、Reactor掌握了,那么学起来Netty也是水到渠成的事情。如果没有掌握前面的内容那么学Netty会非常吃力,下面讲解Netty核心原理与…

界面控件DevExpress ASP.NET Data Grid组件 - 可快速处理各类型数据!(一)

由DevExpress开发的快速且功能完整的ASP.NET Web Forms的Data Grid组件,从全面的数据塑造和数据过滤选项到十多个集成数据编辑器,该套件提供了帮助用户构建极佳数据所需的一些,没有限制! P.S:DevExpress ASP.NET Web …

探索设计模式的魅力:一次设计,多次利用,深入理解原型模式的设计艺术

原型模式是一种设计模式,属于创建型模式的一种,它用于创建重复的对象,同时又能保持性能。在原型模式中,通过复制现有对象的原型来创建新对象,而不是通过实例化类来创建对象。这样做可以避免耗费过多的资源开销&#xf…

关于缓存 db redis local 取舍之道

文章目录 前言一、影响因素二、db or redis or local1.db2.redis3. local 三、redisson 和 CaffeineCache 封装3.1 redisson3.1.1 maven3.1.2 封装3.1.3 使用 3.2 CaffeineCache3.1.1 maven3.1.2 封装3.1.3 使用 总结 前言 让我们来聊一下数据缓存,它是如何为我们带…

01 Redis的特性

1.1 NoSQL NoSQL(“non-relational”, “Not Only SQL”),泛指非关系型的数据库。 键值存储数据库 : 就像 Map 一样的 key-value 对。如Redis文档数据库 : NoSQL 与关系型数据的结合,最像关系…

Linux的一些快捷键(hot keyboard)

Ctrl Alt t:打开bash(就是命令框窗口) Ctrl Alt F3~F6:打开tty终端(纯命令行终端,每个Linux发行版不相同,我的是Ubuntu20版) Alt F4:关闭当前窗口(Windo…

扫地机器人(二分算法+贪心算法)

1. if(robot[i]-len<sweep)这个代码的意思是——如果机器人向左移动len个长度后&#xff0c;比现在sweep的位置&#xff08;现在已经覆盖的范围&#xff09;还要靠左&#xff0c;就是覆盖连续不起来&#xff0c;呢么这个len就是有问题的&#xff0c;退出函数&#xff0c;再…