解读InnoDB数据库索引页与数据行的紧密关联

news2024/9/23 19:28:57

目录

一、快速走进索引页结构

(一)整体展示说明

(二)内容说明

File Header(文件头部)

Page Header(页面头部)

Infimum + Supremum(最小记录和最大记录)

User Records(用户记录)

 Free Space(空闲空间)

Page Directory(页面目录)

File Trailer(文件尾部)

二、索引页与记录行的简单关系说明

(一)数据页的双向链表结构

(二)记录行的单向链表结构

三、InnoDB 数据页中的 User Records 与 Free Space

(一)页满前的处理

初始状态

存储过程

(二)页满后的处理

主要参考和学习来源


干货分享,感谢您的阅读!快速了解索引页结构和数据行的直接关系。前提知识如下:

文章说明具体链接

数据行格式内容分析

探究InnoDB Compact行格式背后-CSDN博客
数据行头信息各个属性探究解析MYSQL行头信息数据行格式分析_jdk 协程-CSDN博客
解析数据行内部单向链表策略数据库记录行在页内查询探索分析_检查代码中循环依赖-CSDN博客

一、快速走进索引页结构

在InnoDB存储引擎的世界里,数据存储和管理就像是一座繁忙而有序的城市。在这座城市中,每一块16KB大小的土地都被称为一个“页”(Page),而这些页是城市基础设施的核心,其主角就是“索引页”(INDEX页),这些页专门用于存储我们表中的实际记录数据,因此也被称为“数据页”(Data Page)。

(一)整体展示说明

索引页就像是城市中的一栋多层大厦。这栋大厦不仅要存放数据,还需要具备高效的检索功能。为了达到这个目的,InnoDB使用了一种高效的B+树结构,每个索引页就是这棵大树上的一个节点。索引页的大小固定为16KB,这个大小经过优化,既能高效利用磁盘空间,又能在内存中快速读取。整体页展示如下:

在这栋大厦中,各个部分各司其职,确保数据的高效存储和快速访问。File Header是大厦的门卫,Page Header是楼层管理,Infimum和Supremum是地基和天花板,User Records是居民,Free Space是预留的空房间,Page Directory是导航系统,File Trailer是安防系统。

(二)内容说明

File Header(文件头部)

占用空间38 字节,文件头部存储了页的一些基础信息:

  • Page Type(页类型):标识该页的类型(如数据页、索引页)。
  • Page Number(页号):当前页在表空间中的唯一编号。
  • Checksum(校验和):用于检测页在读写过程中的完整性。

具像化理解:就像是办公楼的铭牌,记录了楼的基本信息和身份标识。

Page Header(页面头部)

占用空间56 字节,页面头部包含数据页特有的信息:

  • Number of Records(记录数量):当前页中存储的记录数量。
  • Free Space Pointer(空闲空间指针):指向页中第一个可用的空闲空间位置。
  • Heap Top(堆顶位置):记录当前页中数据存储的最高位置。
  • Page Level(页级别):表示当前页在 B+ 树中的层级。

具像化理解:相当于楼的管理办公室,记录了楼内的各种管理信息,如有多少办公室空闲。

Infimum + Supremum(最小记录和最大记录)

占用空间26 字节,这两个虚拟记录用于定义页中的记录范围:

  • Infimum Record(最小记录):一个特殊的最小记录,用于标示页的起始。
  • Supremum Record(最大记录):一个特殊的最大记录,用于标示页的结束。

具像化理解:类似楼的基础和屋顶,标示了楼的起点和终点。

User Records(用户记录)

占用空间不确定,实际存储的用户数据记录:

  • Record Header(记录头部):包含记录的元数据,例如记录长度和下一条记录的指针。
  • Record Data(记录数据):实际的数据内容,包括各字段的值。

具像化理解:实际的办公室,里面有员工在工作,记录了具体的数据内容。

 Free Space(空闲空间)

占用空间不确定,空闲空间用于存储新插入的记录,随着记录的插入,空闲空间逐渐减少:

  • Insertions(插入):当有新记录插入时,系统会在此区域寻找合适的空闲位置。
  • Deletions(删除):删除记录后,空间会返回到空闲区域供新记录使用。

具像化理解:尚未出租的办公室,未来可以容纳新的员工(数据)。

Page Directory(页面目录)

占用空间不确定,页面目录包含记录的相对位置,用于快速检索记录:

  • Directory Slots(目录槽):指向页中各记录的位置,便于快速定位和检索。
  • Efficiency(效率):通过目录可以快速定位记录,提高检索效率。

具像化理解:大楼的导览图,帮助快速找到特定的办公室(记录)。

File Trailer(文件尾部)

占用空间8 字节,文件尾部包含校验信息,用于验证页的完整性:

  • Checksum(校验和):再次验证页的数据完整性,确保数据在读写过程中未被破坏。

具像化理解:大楼的安保系统,确保大楼的安全和完整性。

二、索引页与记录行的简单关系说明

在 InnoDB 中,数据页通过双向链表连接,每个数据页内的记录行按照主键值从小到大的顺序组成单向链表,并且每个数据页都有一个页目录用于快速定位记录。

查找记录时,先在页目录中使用二分法定位到特定槽,再在该槽对应的记录组中顺序遍历找到目标记录。通过这种设计,InnoDB 能够高效地管理和查找数据,确保数据库系统的高性能和可靠性。

(一)数据页的双向链表结构

每个数据页被组织成一个双向链表,这意味着每个数据页都有指向前一个页和后一个页的指针(File Header 记录了页的基础信息和链表指针)。通过这种双向链表结构,InnoDB 可以方便地进行数据页的插入、删除和遍历操作。这种设计保证了数据页之间的高效连接和管理。

(二)记录行的单向链表结构

在每个数据页中,记录行按照主键值从小到大的顺序组织成一个单向链表。这种有序的结构使得在数据页内查找记录变得更加高效。每条记录不仅存储了自身的数据,还包含指向下一条记录的指针,这样可以顺序遍历记录。

每个数据页都有一个页目录,页目录可以看作是数据页内的索引结构。页目录将记录分成多个组,每个组在页目录中都有一个槽。通过页目录,InnoDB 可以快速定位到特定记录所在的组,从而减少遍历记录的时间。

当需要通过主键查找某条记录时,InnoDB 会先在页目录中使用二分法快速定位到对应的槽。页目录中的槽指向该槽对应的记录组,接着在该组中遍历记录,直到找到目标记录。这种查找过程结合了二分查找和顺序遍历的优点,既高效又精确。

三、InnoDB 数据页中的 User Records 与 Free Space

InnoDB 数据页中的 User Records 和 Free Space 部分密切相关。随着记录的不断插入,Free Space 部分的空间会逐渐分配给 User Records 部分,直到 Free Space 被完全消耗。当一个数据页满了之后,InnoDB 会申请新的数据页并将其链接到现有的双向链表中,继续存储新的记录。也就是在页未满前页的存储主要在User Records 和 Free Space发生,页满后将触达到双向链表页中。

(一)页满前的处理

初始状态
  • User Records:初始为空,没有实际数据存储。
  • Free Space:占据大部分页空间,等待新记录的插入。
存储过程
  • 记录插入:当用户插入一条记录时,系统会从 Free Space 部分中申请一个合适大小的空间用于存储这条记录。这条记录被存储到 User Records 部分。
  • 空间调整:随着记录的插入,User Records 部分逐渐增大,存储越来越多的用户数据。同时,Free Space 部分的可用空间减少,逐步被 User Records 部分替代。
  • 页满状态:当 Free Space 部分被完全消耗,整个数据页被 User Records 部分占据,意味着该页已满,无法再存储新的记录。

(二)页满后的处理

当一个数据页中的 Free Space 部分被完全替代为 User Records 部分后,该页就被认为已满。此时,InnoDB 会执行以下操作:

  1. 申请新的数据页:数据库引擎会在表空间中申请一个新的数据页,以继续存储新的记录。
  2. 更新链表指针:新申请的数据页会被链接到现有的数据页双向链表中,确保数据页之间的有序连接。
  3. 维护 B+ 树结构:如果涉及到索引页,InnoDB 会维护 B+ 树结构,确保新的数据页在树中的正确位置。

主要参考和学习来源

《MySQL 是怎样运行的:从根儿上理解 MySQL》

https://www.cnblogs.com/dbf-/p/11891530.html

https://juejin.cn/post/7216914115260301367

mysql数据页和索引页 | Young 小站

一文带你了解MySQL之InnoDB 数据页结构-阿里云开发者社区

https://www.51cto.com/article/702315.html

Mysql之InnoDB数据页(索引页)结构解析 流程图模板_ProcessOn思维导图、流程图

这样理解Mysql索引,阿里面试官也给你点赞_MySQL_慕枫技术笔记_InfoQ写作社区

https://www.51cto.com/article/777873.html

MySQL怎么运行的系列(四)Innodb索引结构和方案-张柏沛IT博客

InnoDB的Page结构 | JieSunn - BLOG

【MySQL】InnoDB行格式、数据页结构以及索引底层原理分析_牛客博客

27丨从数据页的角度理解B+树查询-SQL必知必会-极客时间

OceanBase 社区

页和区体系结构指南 - SQL Server | Microsoft Learn

MySQL InnoDB 聚集索引数据结构 | ellendan

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1929765.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

太速科技-FMC207-基于FMC 两路QSFP+光纤收发子卡

FMC207-基于FMC 两路QSFP光纤收发子卡 一、板卡概述 本卡是一个FPGA夹层卡(FMC)模块,可提供高达2个QSFP / QSFP 模块接口,直接插入千兆位级收发器(MGT)的赛灵思FPGA。支持利用Spartan-6、Virtex-6、Kin…

Webpack看这篇就够了

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 非常期待和您一起在这个小…

java.sql.SQLException: Unknown system variable ‘query_cache_size‘【Pyspark】

1、问题描述 学习SparkSql中,将spark中dataframe数据结构保存为jdbc的格式并提交到本地的mysql中,相关代码见文章末尾。 运行代码时报出相关配置文件错误,如下。 根据该报错,发现网络上多数解决方都是基于java开发的解决方案&a…

GPT-4从0到1搭建一个Agent简介

GPT-4从0到1搭建一个Agent简介 1. 引言 在人工智能领域,Agent是一种能够感知环境并采取行动以实现特定目标的系统。本文将简单介绍如何基于GPT-4搭建一个Agent。 2. Agent的基本原理 Agent的核心是感知-行动循环(Perception-Action Loop)…

【Windows】系统盘空间不足?WizTree 和 DISM++ 来帮忙

当您的系统盘空间接近饱和时,了解硬盘空间的使用情况变得尤为重要。在这种情况下,您可以利用 Windows 内置的存储使用工具来快速查看哪些文件和应用程序占用了大量空间,并采取相应措施进行清理。此外,第三方工具如 WizTree 可以提…

Java NIO合并多个文件

NIO API java.nio (Java Platform SE 8 ) 直接上代码 package com.phil.aoplog.util;import lombok.extern.slf4j.Slf4j;import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.nio.channels.FileChannel;Slf4j public…

勒索防御第一关 亚信安全AE防毒墙全面升级 勒索检出率提升150%

亚信安全信舷AE高性能防毒墙完成能力升级,全面完善勒索边界“全生命周期”防御体系,筑造边界勒索防御第一关! 勒索之殇,银狐当先 当前勒索病毒卷携着AI技术,融合“数字化”的运营模式,形成了肆虐全球的网…

数据结构进阶:使用链表实现栈和队列详解与示例(C, C#, C++)

文章目录 1、 栈与队列简介栈(Stack)队列(Queue) 2、使用链表实现栈C语言实现C#语言实现C语言实现 3、使用链表实现队列C语言实现C#语言实现C语言实现 4、链表实现栈和队列的性能分析时间复杂度空间复杂度性能特点与其他实现的比较…

VBA学习(21):遍历文件夹(和子文件夹)中的文件

很多时候,我们都想要遍历文件夹中的每个文件,例如在工作表中列出所有文件名、对每个文件进行修改。VBA给我们提供了一些方式:(1)Dir函数;(2)File System Object。 使用Dir函数 Dir…

31.RAM-IP核的配置、调用、仿真全流程

(1)RAM IP核简介 RAM是随机存取存储器(Random Access Memory)的简称,是一个易失性存储器,其工作时可以随时对任何一个指定地址写入或读出数据。(掉电数据丢失) (2&#…

Spring Cloud Gateway 入门与实战

一、网关 在微服务框架中,网关是一个提供统一访问地址的组件,它充当了客户端和内部微服务之间的中介。网关主要负责流量路由和转发,将外部请求引导到相应的微服务实例上,同时提供一些功能,如身份认证、授权、限流、监…

【企业级监控】Zabbix监控MySQL主从复制

Zabbix自定义监控项与触发器 文章目录 Zabbix自定义监控项与触发器资源列表基础环境前言四、监控MySQL主从复制4.1、部署mysql主从复制4.1.1、在两台主机(102和103上安装)4.1.2、主机102当master4.1.3、主机103当slave 4.2、MySQL-slave端开启自定义Key值…

JMeter案例分享:通过数据验证的错误,说说CSV数据文件设置中的线程共享模式

前言 用过JMeter参数化的小伙伴,想必对CSV Data Set Config非常熟悉。大家平时更关注变量名称,是否忽略首行等参数,其余的一般都使用默认值。然而我最近遇到一个未按照我的预想读取数据的案例,原因就出在最后一个参数“线程共享模…

摄像头 RN6752v1 视频采集卡

摄像头 AHD倒车摄像头比较好,AHD英文全名Analog High Definition,即模拟高清,拥有比较好的分辨率与画面质感。 RN6752v1 GQW AKKY2 usb 采集卡 FHD(1080p)、HD(720p)和D1(480i&am…

开始Linux之路

人生得一知己足矣,斯世当以同怀视之。——鲁迅 Linux操作系统简单操作指令 1、ls指令2、pwd命令3、cd指令4、mkdir指令(重要)5、whoami命令6、创建一个普通用户7、重新认识指令8、which指令9、alias命令10、touch指令11、rmdir指令 及 rm指令(重要)12、man指令(重要…

C# Winform的三态CheckBox,以及批量修改Panel中的控件

在C# WinForms中,如果你想批量修改一个Panel容器内的所有CheckBox控件的状态,你可以使用foreach循环来遍历Panel的Controls集合。下面是一个示例,展示了如何将一个Panel内所有的CheckBox控件设为选中状态(Checked true&#xff0…

借助 Aspose.Words,在 C# 中将 Word 转换为 JPG

有时我们需要将 Word 文档转换为图片,因为 DOC 或 DOCX 文件在不同设备上的显示可能会有所不同,但图像(例如 JPG 格式)在任何地方看起来都一样。 Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作…

超声波眼镜清洗机哪个牌子好?2024年超全热门眼镜清洗机推荐

夏天来了,在户外活动不到几分钟就已经大汗淋漓!特别是汗珠一滴滴的挂在眼皮上往下坠落简直让戴眼镜的人苦不堪言!虽说戴眼镜在现如今来看是非常普遍的一件事情,但是人们一直深受眼镜清洗的困扰!很多朋友看到这里可能会…

C++学习日记 | Lecture 9 类基础

资料来源:南科大 余仕琪 C/C Program Design LINK: CPP/week09 at main ShiqiYu/CPP GitHub9.1-classes-and-objects_哔哩哔哩_bilibili9.2-constructors-and-destructors_哔哩哔哩_bilibili9.3-this-pointer_哔哩哔哩_bilibili9.4-const-and-static…

好用的《身份证工具》插件,解锁6大实用功能

在数据处理领域,超级处理器插件凭借其强大的功能和高效的性能,一直是Excel和WPS用户的心头好。而今,这一优秀插件再次迎来革新——身份证工具功能现已支持单独安装使用,为用户带来前所未有的便利与灵活性。 超级处理器下载与安装…