浅析MySQL-基础02

news2024/12/31 5:38:35

目录

MySQL一行记录是怎么存储的?

MySQL的数据存放在哪?

表空间文件的结构是怎么样的?

InnoDB行格式有哪些?

Compact行格式是啥样的?

记录的额外信息

1、变长字段长度列表

2、NULL值列表

3、记录头信息

记录的真实数据

vachar(n)中n最大取值是多少?

单字段的情况

多字段的情况 


MySQL一行记录是怎么存储的?

MySQL的数据存放在哪?

MySQL数据肯定存放在电脑的硬盘上,那么具体是在哪呢?

存储的行为是由存储引擎实现的,MySQL支持多种存储引擎,不同的存储引擎保存的文件的方式肯定也不一样。

下面以InnoDB存储引擎,数据库test 展开来说。

数据库的数据文件存放在哪个目录呢?

 运行cd /opt/homebrew/var/mysql目录查看文件列表

 可以看到上面共有四个文件,分别对应数据库test库中的四张表。

ibd文件保存表结构和表数据。表数据既可以存在共享表空间,也可以存放在独占表空间文件中。这个是由参数innodb_file_per_table控制的,若设置了此参数为1,则会将存储的数据、索引等信息单独存储在一个独占表空间,5.7版本之后其默认值就是1,因此每一张表的数据都存放在一个独立的.idb文件。

表空间文件的结构是怎么样的?

针对InnoDB引擎,表空间由 段(segment) 、区(extent)、页(page)、行(row)构成。大概结构如下图:

大概说明下:

        行: 表中的记录都是按行进行存放的,每行记录也有不同的行格式,对应不同的存储结构。

        页:记录是按照行来存储的,但是数据库的读取并不是以「行」为单位,否则一次读取(也就是一次IO操作)只能处理一行数据,效率非常低。在InnoDB中的数据是按「页」为单位来读写的,也就是说,当需要读取一条记录的时候,并不是将这一行记录从磁盘读出来,而是以页为单位,将其整体读入内存。默认每页16K,页是InnoDB存储引擎磁盘管理的最小单元,数据库每次读写都是以16kb为单位的,一次最少从磁盘中读取16K的内容到内存中,一次最少把内存中的16K内容刷新到磁盘中。 

        区: 一个区包含多个页,默认64个,总大小 1M。 InnoDB会预先分配一个区(通常64个连续页)给一个表的聚集索引(即主键索引)这样,当有插入操作发生时,InnoDB可以直接在这个预先分配的空间中添加新的页,而不必每次插入都去寻找空闲页。

        段:表空间是由各个段组成的,段是由多个区组成。段一般分为数据段、索引段、回滚段等。索引段: 存放b+树的非叶子节点的区的集合;数据段:存放b+树的叶子节点的区的集合;混滚段:存放回滚数据的区的集合;

InnoDB行格式有哪些?

Innodb中行格式有Redundant、Compact、Dynamic、Compressed。Mysql8.0默认的行格式为 Dymatic。

Compact行格式是啥样的?

一条记录的结构,如下图:

一条完成的记录包含「记录的额外信息」和「记录的真实数据」两个部分

记录的额外信息

包含3个部分:变长字段长度列表、NULL值列表、记录头信息

1、变长字段长度列表

varchar(n)和char(n)区别是什么?

char是定长的,varchar是变长的。变长字段实际存储的数据的长度不固定,所以存储数据的时候,也要把数据占用的大小存起来,存到「变长字段长度列表」里面,读取数据的时候才能根据这个去读取对应长度的数据。其他的Text、blob等变长字段也是这么实现的。 

以下面的表举例说明:(ascii字符集下每一个字段占1个字节)

CREATE TABLE `tbl_score` (
  `id` int(11) NOT NULL,
  `name` VARCHAR(20) DEFAULT NULL,
  `category` VARCHAR(20) DEFAULT NULL,
  `score` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB DEFAULT CHARACTER SET = ascii ROW_FORMAT = COMPACT;

表中的值:

我们看看上面三条记录的行格式中的「变长字段长度列表」是怎么存储的。

ID=1的记录:

  •  name列的值为xiaoming,真实数据占用的8字节(实际上会转成16进制,这里就忽略)
  •  category列的值为yuwen,真实数据占用的5字节(实际上会转成16进制,这里就忽略)
  •  id和score列不是变长字段,因此这里不用管

 这些变长字段的真实数据占用的字节数会按照列的顺序逆序存放,所以「变长字段长度列表」里的内容是「 05 08」,而不是 「08 05」

        

ID=3的记录:

  •  name列的值为wanger,真实数据占用的06字节(实际上会转成16进制,这里就忽略)
  •  category列的值为null,null是不会存放在行格式中记录的真实数据部分里的,所以在「变长字段长度列表」里不需要保存值为NULL的变长字段的长度
  •  id和score列不是变长字段,因此这里不用管

 

 为什么「变长字段长度列表」的信息要按照逆序存放?

因为「记录头信息」中指向下一条记录的指针,指向的是下一条记录的「记录头信息」和「真实数据」之间的位置,这样的好处是向左读就是记录头信息,向右读就是真实数据,很方便。

  每一个数据库表的行格式都有「变长字段长度列表」吗?

不是必须的。「变长字段长度列表」只出现在数据表中有变长字段的时候。

当数据表字段中没有变长字段的时候,比如全都是int类型或者char类型的字段 ,这个时候表对应的行格式就不会有。

2、NULL值列表

表中的某些字段可能会存储NULL值,如果这些null值存在记录的真实数据会比较浪费空间,所以会把这些null的列存储在NULL值列表中。

如果存在允许 NULL 值的列,则每个列对应一个二进制位(bit),二进制位按照列的顺序进行逆序排列。

  • 二进制位的值为1时,代表该列的值为NULL。
  • 二进制位的值为0时,代表该列的值不为NULL。

NULL 值列表必须用整数个字节的位表示(1字节8位),如果使用的二进制位个数不足整数个字节,则在字节的高位补 0

还是用上面的数据来说明:

id=1的记录

      该记录所有列都有值,不存在NULL值,InnoDB是用整数字节的二进制位来表示NULL值列表,现在不足8位,所以在高位补充0,十六进制表示0x04 

完整结构:

id=2的记录:

        该记录score是NULL值,所以对于这条数据,用十六进制表示是0x04

id=3 的记录:

      该记录score和categroy是NULL值,所以对于这条数据,用十六进制表示是0x06

每个数据库表的行格式都有「NULL值列表」吗?

不是必须的。当数据表的字段都定义成NOT NULL的时候,表里的行格式就不会有「NULL值列表了」

在设计表结构的时候,通常建议将字段设置为NOT NULL,这样就可以节省1字节的空间(NULL值列表至少占用1字节空间)

「NULL值列表」 是固定1字节吗?如果是这样,一个记录有9个字段都是NULL,这个时候怎么办呢?

不是固定1字节的,当一条记录有9个字段值都是NULL,那么就会创建2字节的空间的「NULL值库列表」,依次类推 。

3、记录头信息

记录头信息中包含的内容主要有:

delete_mask标识此条记录是否被删除执行delete删除记录,并不会真正的删除记录,只是将delete_mask标识为1
next_record下一条记录的位置记录与记录之间是通过链表组织的。这个指向的是下一条记录的「记录头信息」和「真实数据」之前的位置,这样的好处是向左读就是记录头信息,向右读就是真实数据
record_type

记录的类型

 0是表示普通记录 1是b+树非叶子节点记录

2是最小记录 3是最大记录等

记录的真实数据

记录真实数据出了我们自定义的表字段,还有三个隐藏字段,分别是row_id、trx_id、roll_pointer,下面具体描述:

  • row_id: 如果我们建表指定了主键或者唯一约束列,那么就没有row_id这个隐藏字段了。如果没有指定主键,有没有唯一约束列,那么就会为记录添加row_id隐藏字段。row_id不是必需的,占用6个字节。
  • trx_id: 事务id,对应记录是由哪个事务操作的。trx_id是必需的,占用6个字节。
  • roll_pointer: 记录上一个版本的指针。roll_pointer是必需的,占用7个字节。

vachar(n)中n最大取值是多少?

MySQL规定除了text、blob等类型除外,其他所有列(不包含隐藏列和记录头信息)占用的字节长度加起来不能超过65535个字节。

意思是一行记录中除去text、blob类型的列,限制最大为65535字节,注意是一行的总长度,不是一列。

varchar(n)中的n代表的是最多存储的字符数量,并不是字节大小。计算它最大允许存储的字节数,还要看数据库表对应的字符集。

单字段的情况
CREATE TABLE tbl_3 ( 
`name` VARCHAR(65535)  NULL
) ENGINE = InnoDB DEFAULT CHARACTER SET = ascii ROW_FORMAT = COMPACT;

执行SQL后,会出现下面的截图错误

从报错信息就可以知道一行数据的最大字节数是 65535(不包含 TEXT、BLOBs 这种大对象类型),其中包含了 storage overhead

这里面的storage overhead是什么呢? 其实就是「变长字段长度列表」和「NULL值列表」,也就是说一行数据的最大字节数是65535,其实是包含了「变长字段长度列表」和「NULL值列表」所占用的字节数的

本例中,「NULL值列表」所占用了字节数是多少?

因为name字段是可以为NULL,所以会用1字节来表示「NULL值列表」

本例中,「变长字段长度列表」所占用的字节数是多少

「变长字段长度列表」所占用的字节数 = 所有「变长字段长度」占用的字节数之和

要先知道每个变长字段的「变长字段长度」需要用多少个字节表示,分为两种情况:

  • 如果变长字段允许存储的最大字节数小于等于255字节,就会用1字节表示「变长字段长度」
  • 如果变长字段允许存储的最大字节数大于255字节,就会用2字节表示「变长字段长度」

上面的例子是只有 1 个变长字段,所以「变长字段长度列表」= 1 个「变长字段长度」占用的字节数,也就是 2 字节。 

因此上面的n最大值为 65535 -  2 - 1 = 65532 。

如果字符集是utf8的话,在 UTF-8 字符集下,一个字符最多需要三个字节,varchar(n) 的 n 最大取值就是 65532/3 = 21844。

// 执行失败
CREATE TABLE tbl_a ( 
`name` VARCHAR(21845)  NULL
) ENGINE = InnoDB DEFAULT CHARACTER SET = utf8 ROW_FORMAT = COMPACT;

// 执行成功
CREATE TABLE tbl_a ( 
`name` VARCHAR(21844)  NULL
) ENGINE = InnoDB DEFAULT CHARACTER SET = utf8 ROW_FORMAT = COMPACT;
多字段的情况 

  有多个字段的话,要保证所有字段的长度 + 变长字段长度列表所占用的字节数 + NULL值列表所占用的字节数 <= 65535

// 执行失败
CREATE TABLE aax ( 
`id` VARCHAR(255) not null,
`name` VARCHAR(21589) NULL
) ENGINE = InnoDB DEFAULT CHARACTER SET = utf8 ROW_FORMAT = COMPACT;

765(id字段所占字节) + 2(变长字段长度所占字节) + 64767(name字段所占字节) + 2(变长字段长度所占字节) + 1(NULL值列表)  > 65535


// 执行成功
CREATE TABLE aax ( 
`id` VARCHAR(255) not null,
`name` VARCHAR(21588) NULL
) ENGINE = InnoDB DEFAULT CHARACTER SET = utf8 ROW_FORMAT = COMPACT;

765(id字段所占字节) + 2(变长字段长度所占字节) + 64764(name字段所占字节) + 2(变长字段长度所占字节) + 1(NULL值列表)  < 65535

行溢出后,是怎么处理的?

MySQL中磁盘和内存交互是以页为基本单位。一个页一般是16k,也就是16384字节,而一个varchar(n)最大长度是65535字节,另外text类型可能存储更多数据,这个时候一个页就存不了一条记录数据。这就会触发行溢出,多的数据就会存到另外的「溢出页」中。

如果一个数据页存不了一条记录,InnoDB 存储引擎会自动将溢出的数据存放到「溢出页」中。在一般情况下,InnoDB 的数据都是存放在 「数据页」中。但是当发生行溢出时,溢出的数据会存放到「溢出页」中。

当发生行溢出时,在记录的真实数据处只会保存该列的一部分数据,而把剩余的数据放在「溢出页」中,然后真实数据处用 20 字节存储指向溢出页的地址,从而可以找到剩余数据所在的页。

Compact 行格式针对行溢出的处理是这样的:当发生行溢出时,在记录的真实数据处只会保存该列的一部分数据,而把剩余的数据放在「溢出页」中,然后真实数据处用 20 字节存储指向溢出页的地址,从而可以找到剩余数据所在的页。

Compressed 和 Dynamic 这两种格式采用完全的行溢出方式,记录的真实数据处不会存储该列的一部分数据,只存储 20 个字节的指针来指向溢出页。而实际的数据都存储在溢出页中

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1847105.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode题练习与总结:克隆图--133

一、题目描述 给你无向 连通 图中一个节点的引用&#xff0c;请你返回该图的 深拷贝&#xff08;克隆&#xff09;。 图中的每个节点都包含它的值 val&#xff08;int&#xff09; 和其邻居的列表&#xff08;list[Node]&#xff09;。 class Node {public int val;public L…

【EndNote】EndNote进行文献管理可能遇到的问题和解决方案

一、安装GB/T7714-2015(numberic)文献style windows&#xff1a;https://blog.csdn.net/qq_36235935/article/details/115629694 mac os&#xff1a;Mac版Endnote 20导入中文参考格式Chinese Std GBT7714 (numeric)-CSDN博客 安装完之后需要调整Author Name格式&#xff1a;…

Linux内核学习——linux内核体系结构(1)

1 Linux内核模式 学习的是Linux 0.11内核&#xff0c;采用的是单内核模式。单内核模式的主要优点是内核代码结构紧凑、执行速度快&#xff0c;但是层次结构性不强。 操作系统如何提供的服务流程&#xff1f; 应用主程序使用指定的参数值执行系统调用指令(int x80)&#xff0…

用进程和线程完成TCP进行通信操作及广播和组播的通信

进程 代码 #include <stdio.h>#include <sys/types.h>#include <sys/socket.h>#include <netinet/in.h>#include <arpa/inet.h>#include <string.h>#include <unistd.h>#include <stdlib.h>#include <signal.h>#includ…

如何使用idea连接Oracle数据库?

idea版本&#xff1a;2021.3.3 Oracle版本&#xff1a;10.2.0.1.0&#xff08;在虚拟机Windows sever 2003 远程连接数据库&#xff09; 数据库管理系统&#xff1a;PLSQL Developer 在idea里面找到database&#xff0c;在idea侧面 选择左上角加号&#xff0c;新建&#xff…

消息队列kafka中间件详解:案例解析(第10天)

系列文章目录 1- 消息队列&#xff08;熟悉&#xff09;2- Kafka的基本介绍&#xff08;掌握架构&#xff0c;其他了解&#xff09;3- Kafka的相关使用&#xff08;掌握kafka常用shell命令&#xff09;4- Kafka的Python API的操作&#xff08;熟悉&#xff09; 文章目录 系列文…

0.15元1.5Mhz-1.3A同步整流BUCK降压DCDC芯片MT3410(MT3410LB)

前言 国产同步整流DCDC&#xff0c;参考价格约0.15元。 特征 高效率&#xff1a;高达 96% 1.5MHz恒定频率操作 1.3A 输出电流 无需肖特基二极管 2.3V至7V输入电压范围 输出电压低至 0.6V PFM 模式可在轻负载下实现高效率 压差操作中的100%占空比 低静态电流&#xff1a;35μ…

开放式耳机哪个品牌质量比较好?五大公认性能之王推荐!

作为一名热爱音乐的DJ爱好者&#xff0c;我当然知道一款适合DJ使用的开放式耳机应该具备哪些特点。最近&#xff0c;我深入评测了几款热门开放式耳机&#xff0c;从音质、舒适度、耐用性到混音功能等方面进行了全面评估。今天&#xff0c;我想为大家分享我的评测结果&#xff0…

可视化数据科学平台在信贷领域应用系列六:自动机器学习(上篇)

在现代数据驱动的世界中&#xff0c;机器学习已经成为解决复杂问题和推动创新的重要手段。然而&#xff0c;传统的机器学习模型开发过程复杂且耗时&#xff0c;包括数据预处理、特征工程、模型选择、参数调优和模型评估等多个步骤环节&#xff0c;需要模型开发人员具备丰富的专…

深圳比创达电子|EMC与EMI一站式解决方案:源头到终端的全面防护

随着电子技术的飞速发展&#xff0c;电磁兼容性&#xff08;EMC&#xff09;和电磁干扰&#xff08;EMI&#xff09;问题日益成为产品研发和生产的关键因素。为了帮助企业更好地应对这些挑战。 一、EMC与EMI的基本概述 电磁兼容性&#xff08;EMC&#xff09;是指设备或系统在…

众爱宠物开源项目介绍

众爱宠物管理系统是一个集会员管理、宠物管理、商品管理、库存管理、数据管理、收银管理、多门店管理等功能于一体的综合管理系统&#xff0c;具有操作方便、简单、安全等优点。 开源项目地址

STM32---SPI通信协议(小白入、含源码)

写在前面&#xff1a;在单片机的学习过程中&#xff0c;各种通信协议的学习是必不可少的&#xff0c;在前面我们学习了串口通信、IIC通信&#xff0c;本节我们来认识一下SPI通信协议。包括其SPI基本概念、NORFLASH芯片的介绍以及相关的例程实验。 目录 一、SPI介绍 1.1什么是…

“一站式企业服务平台”的功能架构

为提升区域营商环境&#xff0c;为促进区域经济发展&#xff0c;实现资源高效配置&#xff0c;全国各区域政府及产业园区都越来越重视如何创新企业服务机制、提升企业服务水平&#xff0c;来保障区域内的企业稳定及帮扶企业高质量的发展。随着近年来大数据、人工智能等新一代信…

V4和V6双栈处理

现进行双栈 对R1 对R2 对R3 对R4 路由地址配完&#xff0c;起协议 然后起ripng&#xff0c;在R2&#xff0c;R3&#xff0c;R4上都宣告一下 然后在PC1和PC2上都手动配置一下就可以了

对比 Axios 和 Fetch:选择最适合的 HTTP 请求方法

在前端开发中&#xff0c;处理 HTTP 请求是一个常见且重要的任务。JavaScript 提供了多种方式来发送网络请求&#xff0c;其中最受欢迎的两种方式分别就是 Fetch API 和 Axios。尽管两者都能完成同样的任务&#xff0c;即从客户端向服务器发送请求并接收响应&#xff0c;但它们…

项目经验——交通行业数据可视化大屏、HMI设计

交通行业数据大屏、HMI设计时要的注意点&#xff1a;清晰可读、简洁直观、适配性强。颜色对比度满足WCAG标准&#xff0c;深色背景减少干扰&#xff0c;实时展示交通数据&#xff0c;支持有线网络控制内容更新&#xff0c;保障驾驶安全与决策效率。

V4L2读取摄像头资源

1.V4L2 它是Linux内核中标准的关于视频驱动程序&#xff0c;Video for Linux 2&#xff0c;简称V4L2。 它为Linux下的视频驱动提供了统一的接口&#xff0c;使得应用程序可以使用统一的API操作不同的视频设备。 V4L2支持三类设备&#xff1a;视频输入输出设备、VBI设备和rad…

飞速(FS)S5850-24XMG多速率交换机如何实现降本增速

在当今网络环境快速发展的背景下&#xff0c;以太网带宽呈现出快速增长的趋势&#xff0c;降低网络迭代成本成为影响企业决策的关键因素。飞速&#xff08;FS&#xff09;S5850-24XMG多速率交换机可提供无缝连接不同数据速率设备的解决方案&#xff0c;本文将探讨飞速&#xff…

day01-Numpy的安装

numpy的安装 同样&#xff0c;anaconda内置有Numpy包 Numpy是用c语言实现的&#xff0c;运算速度比python快得多 import numpy as np np.__version__out: 1.18.5使用Jupyter编辑器打印numpy包的版本 NumPy ndarray对象 NumPy定义了一个n维数组对象&#xff0c;简称ndarra…

vue 登录

1.创建项目 Set-ExecutionPolicy RemoteSigned npm install -g yarn yarn add axios yarn add element-pluspackage.json {"name": "tom6","version": "0.1.0","private": true,"scripts": {"serve": &…