【MySQL-23】万字总结<InnoDB引擎>——【逻辑存储结果&架构(内存结构,磁盘结构,后台线程)&事务原理&MVCC】

news2025/2/5 23:04:41

前言

大家好吖,欢迎来到 YY 滴MySQL系列 ,热烈欢迎! 本章主要内容面向接触过C++的老铁
主要内容含:
在这里插入图片描述

欢迎订阅 YY滴C++专栏!更多干货持续更新!以下是传送门!

  • YY的《C++》专栏
  • YY的《C++11》专栏
  • YY的《Linux》专栏
  • YY的《数据结构》专栏
  • YY的《C语言基础》专栏
  • YY的《单片机》专栏
  • YY的《STM32》专栏
  • YY的《数据库》专栏

这里写目录标题

  • 总结/概要
  • 一.逻辑存储结构
  • 二.架构
    • 1.内存结构
      • 1.缓冲池:Buffer Pool
      • 2.更改缓冲区:Change Buffer
      • 3.自适应哈希索引:Adaptive Hash index
      • 4.日志缓冲区:Log Buffer
    • 2.磁盘结构
      • 1.系统表空间:System Tablespace
      • 2.表的独立表空间:File-Per-Table Tablespaces
      • 3.通用表空间:GeneralTablespaces
      • 4.撤销表空间:Undo Tablespaces
      • 5.临时表空间:Temporary Tablespaces
      • 6.双写缓冲区:Doublewrite Buffer Files
      • 7.重做日志:Redo Log
    • 3.后台线程——把缓冲池信息刷新到磁盘当中
  • 三.事务原理
    • 1.事务概述
    • 2.重做日志:redolog——实现事务的持久性(物理日志)
    • 3.回滚日志:undolog——实现事务的原子性(逻辑日志)
  • 四.多版本并发控制:MVCC
    • 1.基本概念(当前读/快照读)
      • 1.记录中的隐藏字段
      • 2.undolog版本链
      • 3.读视图:readview介绍
    • 2.原理分析
      • 1.前置知识(版本链数据访问规则&不同隔离级别,生成ReadView的时机不同)【原理分析中有具体使用场景】
      • 2.底层原理分析(RC:读已提交级别)——生成ReadView
      • 3.底层原理分析(RR:可重复读级别)——生成ReadView

总结/概要

在这里插入图片描述

一.逻辑存储结构

在这里插入图片描述

二.架构

  • MySQL5.5版本开始,默认使用|nnoDB存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛。
  • 下面是InnoDB架构图, 左侧为内存结构,右侧为磁盘结构。
  • 简单看一下,下面有具体介绍
    在这里插入图片描述

1.内存结构

InnoDB引擎的内存架构分为下面四个:

  1. 缓冲池:Buffer Pool
  2. 更改缓冲区:Change Buffer——(针对非唯一,二级索引页)
  3. 自适应哈希索引
  4. 日志缓冲区

1.缓冲池:Buffer Pool

在这里插入图片描述

2.更改缓冲区:Change Buffer

  • Change Buffer的意义
  • 在增删改查时,不用每一次直接操作磁盘IO, 先操作Change Buffer中的数据(合并处理等操作)
  • 再以一定频率把Change Buffer中的数据同步到Buffer Pool ,最后再刷新到磁盘中
    在这里插入图片描述
    在这里插入图片描述

3.自适应哈希索引:Adaptive Hash index

  • InnoDB引擎 默认不支持哈希索引 ,支持 B+树索引。
  • 前情提要,哈希索引优势是快,只需要一次匹配即可(排除哈希冲突情况下)。而B+树则需要匹配两三次。
  • 但哈希索引的局限在于,不能做范围查询,只能做等值匹配等操作
  • 所以自适应哈希索引等于是上了一层自动监控, 如果hash索引更快,他会建立哈希索引
    在这里插入图片描述

4.日志缓冲区:Log Buffer

  • 用于保存日志文件redolog,undolog
    在这里插入图片描述

2.磁盘结构

结构总览,具体解读在下面
在这里插入图片描述

1.系统表空间:System Tablespace

  • System Tablespace: 系统表空间 更改缓冲区 存储区域
  • 如果表是在系统表空间而不是每个表文件或通用表空间中创建的,它也可能包含表和索引数据。(在MySQL5.x版本中还包含InnoDB数据字典、undolog等)
    参数:innodb_data_file_path
    在这里插入图片描述

2.表的独立表空间:File-Per-Table Tablespaces

  • 取决于独立表空间的开关【参数:innodb_file_per_able】是否开启,若开启。则相关数据不会上上文所述系统表空间System Tablespace中存放
  • File-Per-Table Tablespaces:每个表的文件表空间包含单个InnoDB表的数据和索引,并存储在文件系统上的单个数据文件中
    在这里插入图片描述

3.通用表空间:GeneralTablespaces

  • 不自己创建,则没有这块表空间文件
  • GeneralTablespaces:通用表空间,需要通过CREATE TABLESPACE 语法创建通用表空间,在创建表时,可以指定该表空间。
    在这里插入图片描述

4.撤销表空间:Undo Tablespaces

  • Undo Tablespaces:撤销表空间,MySQL实例在初始化时会自动创建 两个默认的undo表空间 (初始大小16M)(图中undo_001,undo_002),用于存储undolog日志。
    在这里插入图片描述

5.临时表空间:Temporary Tablespaces

  • InnoDB 使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据
    在这里插入图片描述

6.双写缓冲区:Doublewrite Buffer Files

  • 一个中转的缓冲区, 出意外时可以通过双写缓冲区恢复数据
  • Doublewrite Buffer Files:双写缓冲区,innoDB引擎将数据页从Buffer Pool刷新到磁盘前,先将数据页写入双写缓冲区文件中,便于系统异常时恢复数据。
  • 双写缓冲区文件【.dblwr】
    在这里插入图片描述

7.重做日志:Redo Log

  • Redo Log:重做日志,是用来实现事务的持久性。不会一直保存,隔一段时间会清理没有使用的Redo Log
  • 该日志文件由两部分组成: 重做日志缓冲 (redo logbuffer)以及 重做日志文件 (redo log),前者是在内存中,后者在磁盘中。
  • 当事务提交之后会把 所有修改信息 都会存到该日志中,用于在刷新脏页到磁盘时,发生错误时,进行数据恢复使用。
  • 循环写入涉及下面两个文件
    在这里插入图片描述
    在这里插入图片描述

3.后台线程——把缓冲池信息刷新到磁盘当中

  • 后台线程主要作用:把缓冲池信息在合适的时机刷新到磁盘当中
    -

在这里插入图片描述

  • 分为4个线程
  1. Master Thread
    核心后台线程,负责调度其他线程,还负责将缓冲池中的数据异步刷新到磁盘中,保持数据的一致性还包括脏页的刷新、合并插入缓存、undo页的回收
  2. IO Thread
    在InnoDB存储引擎中大量使用了AIO来处理IO请求,这样可以极大地提高数据库的性能,而I0Thread主要负责这些IO请求的回调。
    在这里插入图片描述
  3. Purge Thread
    主要用于回收事务已经提交了的undolog,在事务提交之后,undolog可能不用了,就用它来回收。
  4. Page Cleaner Thread
    协助 Master Thread 刷新脏页到磁盘的线程,它可以减轻 Master Thread 的工作压力,减少阻塞。

三.事务原理

1.事务概述

  • 事务 是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作 作为一个整体 一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。

四大特性:

  1. 原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功,要么全部失败。
  2. 一致性(Consistency):事务完成时,必须使所有的数据都保持一致状态。
  3. 隔离性(lsolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。
  4. 持久性(Durability):事务一旦提交或回滚,它对数据库中的数据的改变就是永久的。

实现方式

  • 原子性,一致性,持久性 :通过 日志文件 redo log 和undo log实现
  • 隔离性 MVCC 实现

2.重做日志:redolog——实现事务的持久性(物理日志)

  • 重做日志,记录的是事务提交时数据页的 物理修改 ,是 物理日志 ,是用来实现事务的持久性。
  • 该日志文件由两部分组成:重做日志缓冲(redolog buffer)以及重做日志文件(redolog file),前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中,用于在刷新脏页到磁盘,发生错误时,进行数据恢复使用

举例演示:

  1. 我们有一段update,delete操作,操作缓冲区,要去查找有无我们要更新的数据
  2. 如果没有,就通过 后台线程 ,把数据从磁盘中读到缓存池中。
  3. 我们就在缓冲区中对其中数据进行操作,此时磁盘中数据没有变更,其中的变更过的数据就称作“脏页”
  4. 变更过后的数据,经过后台线程,再刷新回磁盘。完成后,内存和磁盘中的数据都保持一致。
  5. 而脏页的数据并不是立即刷新,而是隔一段时间再刷新到磁盘中
  6. 如果此时出错,内存的数据并没有刷新到磁盘中(脏页刷新失败),但是事务已经提交成功了
  7. 此时就需要我们redo log出现了,我们会记录脏页的数据页变化,出错时就会通过其恢复
    在这里插入图片描述

3.回滚日志:undolog——实现事务的原子性(逻辑日志)

  • 回滚日志, 用于记录数据被修改前的信息 ,作用包含两个: 提供回滚 MVCC (多版本并发控制)
  • undo log和redo log记录 物理日志 不一样,它是 逻辑日志
  • 可以认为当delete一条记录时,undolog中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。当执行rollback时,就可以从undolog中的逻辑记录读取到相应的内容并进行回滚。
  • Undo log销毁相关: undolog在事务执行时产生,事务提交时,并不会立即删除undo log,因为这些日志可能还用于MVCC。
  • Undo log存储相关: undolog采用段的方式进行管理和记录,存放在前面介绍的 rollbackseqment 回滚段中,内部包含1024个undo log segment.

四.多版本并发控制:MVCC

1.基本概念(当前读/快照读)

  • 当前读:
    读取的是记录的最新版本 ,读取时还要保证其他并发事务不能修改当前记录, 会对读取的记录进行加锁。对于我们日常的操作,如:select… lock in share mode(共享锁),select … for update、update、insert、delete(排他锁)都是一种当前读。
  • 快照读:
    简单的selec(不加锁)就是快照读 ,快照读,读取的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。

根据隔离级别不同,会有不同机制:

  1. Read Committed:每次select,都生成一个快照读。
  2. Repeatable Read:开启事务后第一个select语句才是快照读的地方。
  3. Serializable:快照读会退化为当前读。
  • MVCC
    全称 Multi-Version Concurrency Control,多版本并发控制。指维护一个数据的多个版本,使得读写操作没有冲突,快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现,还需要依赖于数据库 [ 记录中的三个隐式字段、undo log日志、readView ]

1.记录中的隐藏字段

  • 我们创造完表就有如下图三个字段(绿色),InnoDB会隐式增加三个字段(灰色)
    在这里插入图片描述

2.undolog版本链

  • undo log
  1. 回滚日志,在insert、update、delete的时候产生的便于数据回滚的日志。
    当insert的时候,产生的undol0g日志只在回滚时需要,在事务提交后,可被立即删除
  2. 而update、delete的时候,产生的undoloq日志不仅在回滚时需要,在快照读时也需要,不会立即被删除

演示:

  1. 进行事务2时,undo log 会记录下来
    在这里插入图片描述
  2. 进行事务3时。undo log再次记录。
    在这里插入图片描述
  3. 重新定向,DB_ROLL_PTR指向0x00002,0x00002指向0x00001
    在这里插入图片描述
  4. 进行事务4时,undo log再次记录。与步骤3同理
    在这里插入图片描述

3.读视图:readview介绍

  • ReadView(读视图)是 快照读 SOL执行时 MVCC提取数据的依据 ,记录并维护系统当前活跃的事务(未提交的)id
  • ReadView中包含了四个核心字段:
  • 具体如何识别:放到下面原理分析部分实战分析

在这里插入图片描述

2.原理分析

1.前置知识(版本链数据访问规则&不同隔离级别,生成ReadView的时机不同)【原理分析中有具体使用场景】

  • 版本链数据访问规则
    在这里插入图片描述
  • 不同隔离级别,生成ReadView的时机不同
    在这里插入图片描述

2.底层原理分析(RC:读已提交级别)——生成ReadView

  • RC隔离级别下,在事务中每一次执行快照读时生成ReadView。

举例:

  1. 在当前快照读的时候,活跃的事务id(未提交的),有3,4,5——>m_ids:{3,4,5}
  2. 最小活动事务id ——>min_trx_id:3
  3. 预分配事务id(最大事务id+1)——>max_trx_id:6
  4. 创建ReadView的事务id ——>creator_trx_id:5
    在这里插入图片描述
    两次查询我们会得到如下两个ReadView (而RR可重复读级别下就只会有一个)
    在这里插入图片描述
    目前我们已知版本链&版本链数据访问规则
    在这里插入图片描述

开始分析

  • 具体方法:带着我们的记录和undo log中的记录 进行比对(逐个套用规则比对)
  • 我们记录当中DB_TRX_ID=4 ,我们拿它去 比对ReadView当中的四个核心字段
    在这里插入图片描述

在这里插入图片描述

  • 发现记录(这个版本)符合一个规则都不符合————>说明我们本次快照读,查找到的记录不是它。 我们要沿着版本链条继续往下找

  • 第二个版本中当中DB_TRX_ID=3
    在这里插入图片描述
    在这里插入图片描述

  • 比对完规则后发现满足第二个条件(3<4)——>找到版本返回

在这里插入图片描述

3.底层原理分析(RR:可重复读级别)——生成ReadView

  • RR隔离级别下,仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView。
    - 在场
  • 既然两次查询的ReadView都一样,匹配规则一样,在版本链中查找到的数据也是一样的————保证了可重复读

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2056609.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【nginx】详细详细超详细,包括编译安装nginx+升级+回滚+核心配置+高级配置+反向代理+Nginx Rewrite相关功能等等

理论部分&#xff1a; 企业高性能Web服务器Nginx是一个开源的、高性能的HTTP和反向代理服务器&#xff0c;同时也支持IMAP/POP3/SMTP协议。它由俄罗斯人Igor Sysoev开发&#xff0c;并在2004年以BSD-like协议发布。Nginx因其卓越的性能、稳定性、丰富的功能集以及简单的配置而…

连锁美业门店收银系统怎么选?什么样的美业系统好用?美业管理系统源码分享

通过“PCiPAD手机APP微信小程序”的便捷功能操作&#xff0c; 提升预约服务、 会员管理、 收银管理、 库存管理、 客勤维护、员工管理、 排班管理等流程效率&#xff0c; 让门店员工的工作重心回归到服务质量上。 ▲ 小程序 ▲ 手机APP ▲ PC管理后台

Aseembly(九)-[BX] Loop

正如本篇文章的标题所示:本篇文章主要是进行 [BX] 和loop的讲解 上篇文章我们讲述了 关于 自己去dosbox里面编写汇编程序并且一步一步的编译(masm) 链接(link) 然后进行debug的过程 ,也进行了一个关于栈的实验: 详情请见我的上一篇文章 Aseembly(八)-汇编语言编写程序 让我们…

JavaScript class和正则

正则表达式练习 出生日期 年 月 日 ()表示一个整体 console.log(1909.match(^19\\d{2}$)); console.log(2024.match(^20(([01][0-9])|(2[0-4]))$)); //年 console.log(1909.match(^(19\\d{2})|(20(([01][0-9])|(2[0-4])))$)); // 月 console.log(12.match(^(0[1-9])|(1[0-2])…

minio版本升级与数据迁移操作记录

系列文章目录 minio单节点与集群安装 文章目录 系列文章目录前言一、问题引出二、升级与数据迁移步骤0.资源清单1.部署及启动新minio单实例2.设置新旧实例的别名3.检查旧实例bucket及存储的文件4.通过mc客户端命令进行数据迁移5.迁移结果验证 三、新旧实例minio数据对比 前言 …

利用Geohash算法,快速检索周边兴趣点

文章目录 一、前言二、基本原理三、Geohash算法四、算法存在的问题五、代码实现六、问题解决处理 一、前言 需要一个需求&#xff0c;查找某小区附近的超市&#xff0c;如果该小区和超市距离在500米以内&#xff0c;则查找成功。 实现该功能按照传统方式&#xff0c;需要获取小…

【秒杀系统架构图】

文章目录 高并发防止超卖和恶意请求定时同步商品用户秒杀的流程秒杀服务的关注点&#xff1a; 秒杀系统一般出现正在电商平台中&#xff0c;秒杀系统需要支持高并发&#xff0c;保持一致性和高可用的特点&#xff1a; 高性能。 秒杀涉及大量的并发读和并发写&#xff0c;因此支…

QT:事件机制

一、事件机制 qt的核心机制&#xff1a;对象树、信号和槽、事件机制 1.1概念 就是当这件事情发生时&#xff0c;自动执行对应的功能代码。该某块功能代码是虚函数&#xff0c;只需重写该虚函数&#xff0c;即可执行重写的代码。 1.2事件处理简介 1. 什么是事件&#xff1f; (重…

algorithm算法库学习之——堆操作,最小/最大操作,比较操作,排列操作

algorithm此头文件是算法库的一部分。本篇介绍堆操作&#xff0c;最小/最大操作&#xff0c;比较操作&#xff0c;排列操作。 接口API 堆操作 is_heap 检查给定范围是否为一个最大堆 (函数模板) is_heap_until (C11) 查找能成为最大堆的最大子范围 (函数模板) make_heap 从一…

SQL 时间盲注 (injection 第十六关)

简介 SQL注入&#xff08;SQL Injection&#xff09;是一种常见的网络攻击方式&#xff0c;通过向SQL查询中插入恶意的SQL代码&#xff0c;攻击者可以操控数据库&#xff0c;SQL注入是一种代码注入攻击&#xff0c;其中攻击者将恶意的SQL代码插入到应用程序的输入字段中&#x…

C:每日一题:双指针法的使用

前言&#xff1a; 思虑再三&#xff0c;觉得如果有时间每日一题还是可以更新一下的。 题目难度&#xff1a;基础 解题方法&#xff1a;双指针法 一、题目 输入一个整数数组&#xff0c; 实现一个函数来调整该数组中数字的顺序使得 数组中所有的奇数位于数组的前半部分&a…

数字人的形象克隆与语音克隆是伪需求

形象克隆与语音克隆技术&#xff0c;在当前的环境上已经可以成熟的实现&#xff0c;但真的解决了痛点问题吗&#xff1f; 普通人或者一般的公司克隆自己内部人的形象有必要吗&#xff1f;对外界而言&#xff0c;克隆的形象与虚拟的形象并无二致&#xff0c;本身并没有什么知名…

Arduino自制手持小风扇项目

1.1 介绍&#xff1a; 实验功能说明&#xff1a;功能&#xff08;1&#xff09;按一下按键小风扇开启&#xff0c;再按一下关闭。 功能&#xff08;2&#xff09;按一下按键小风扇一档风速&#xff0c;再按一下二挡&#xff0c;依次三挡…关闭。 按键模块说明&#xff1a;按下…

【自动化测试必学语言】python:模块和包

目录 导入模块的语法 方式一 方式二 方式三 【了解】 基本不用 模块的查找顺序 __name__ 的作用 代码练习 包(package) Python 源代码文件就是⼀个模块模块中定义的变量函数类&#xff0c;都可以让别人使用&#xff0c;同样&#xff0c;可以使用别人定义的&#xff08…

进程(2) wait、exec函数族

目录 1. fork() 函数 功能 使用时注意事项 2. exit() 函数 功能 使用时注意事项 3. wait() 函数 功能 使用时注意事项 总结 wait() 异常信号结束 waitpid exec函数族 execl() execlp() execv execvp fork()、exit() 和 wait() 函数在进程管理中扮演着重要的角…

【C语言】【Linux】如何在Linux终端中进行彩色输出——C语言篇

&#x1f41a;作者简介&#xff1a;花神庙码农&#xff08;专注于Linux、WLAN、TCP/IP、Python等技术方向&#xff09;&#x1f433;博客主页&#xff1a;花神庙码农 &#xff0c;地址&#xff1a;https://blog.csdn.net/qxhgd&#x1f310;系列专栏&#xff1a;C语言编程&…

双亲委派机制的优势与劣势

三次双亲委派机制的破坏

24 优化算法

目录 优化和深度学习深度学习中的挑战局部最小 vs 全局最小鞍点(saddle point)梯度消失小结凸性(convexity)凸集凸函数(convex function)凸函数优化凸和非凸例子小结梯度下降(gradient descent)1、梯度下降算法是最简单的迭代求解算法2、学习率(learning rate)小结随…

Unity小功能 - 贴墙滑行

目录 一. 简介 二. 创建项目 1.新建地板 2.创建墙体 3.创建主角 三. 编写代码 四. 效果演示 五. 总结 一. 简介 贴墙滑行是在游戏中常见的一种角色动作表现&#xff0c;它能够增加游戏的真实感和趣味性&#xff0c;同时也为游戏玩法带来更多的可能性。 在 Unity 中实…

【秋招笔试】8.18大疆秋招(第三套)-三语言题解

🍭 大家好这里是 春秋招笔试突围,一起备战大厂笔试 💻 ACM金牌团队🏅️ | 多次AK大厂笔试 | 编程一对一辅导 ✨ 本系列打算持续跟新 春秋招笔试题 👏 感谢大家的订阅➕ 和 喜欢💗 和 手里的小花花🌸 ✨ 笔试合集传送们 -> 🧷春秋招笔试合集 🍒 本专栏已收…