【MySQL性能优化】- 一文了解MVCC机制

news2025/2/23 17:14:00

MySQL理解MVCC

😄生命不息,写作不止
🔥 继续踏上学习之路,学之分享笔记
👊 总有一天我也能像各位大佬一样
🏆 博客首页   @怒放吧德德  To记录领地
🌝分享学习心得,欢迎指正,大家一起学习成长!
转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

在这里插入图片描述

文章目录

  • MySQL理解MVCC
    • 简介
    • 理解MVCC
      • undo日志版本链
      • read-view机制
      • 版本链对比规则
    • 案例理解
      • 可重复读
        • 时刻6查询
        • 时刻9查询
        • 时刻13查询
        • 时刻14查询
      • 读已提交
        • 时刻9查询
        • 时刻13查询
    • 总结

转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

简介

多版本并发控制(MVCC,Multi-Version Concurrency Control)是一种常用于数据库管理系统的并发控制方法,MySQL数据库中的InnoDB存储引擎就实现了这种技术。MVCC通过在每个事务中对数据进行版本控制来实现多个事务的高效并发执行,增强了数据库的读写性能,并且减少了锁的需求。

理解MVCC

在MySQL的可重复读的隔离级别中,同样的SQL查询语句在同一个事务中,查出来的数据是一致的,其他事务对这些数据进行修改,当前事务是不可见的。
这个隔离级别就是由MVCC机制来实现的。对一行数据并不会通过对读和写加互斥锁来保证隔离性,避免了频繁加锁互斥,而串行化隔离级别是通过读写互斥实现。

MySQL中读以提交和可重复读隔离级别都是通过MVCC。

undo日志版本链

undo日志版本链是指一行数据被多个事务依次修改后,为了保持数据修改之前版本的可访问性,InnoDB不会直接覆盖旧数据。会将数据的旧版本保存到undo日志中,并且用隐藏字段trx_id(事务id)和roll_pointer(回滚指针)将这些日志串联起来成为一组历史版本链。

这个undo日志不只是保存单个版本,而是随着时间推移和更多事务的执行,可能保存同一数据项的多个历史版本。这些历史版本形成一个链条,称为版本链。当需要某个记录的历史状态时,可以通过回滚undo日志中的操作来获取旧版本数据,或者在不同隔离级别的读取事务中适当地提供旧数据,以此来保证一致性读取。

如下图,可以很好的理解什么是undo日志版本链
在这里插入图片描述

如上图,我们在插入数据的时候,会开启事务,所以会带着一个事务id,接着对这条数据进行修改,MySQL也会将修改的数据加上事务id以及回滚指针(roll_pointer),并且由这个回滚指针来指向上一个事务的旧数据版本,这样就构成了日志版本链。

read-view机制

read-view机制是InnoDB存储引擎实现MVCC的一种来创建一致性读取视图的技术。主要作用是用来确保可重复读和读已提交的隔离级别下,事务能够读到一致的数据快照,即使其他事务在对数据进行修改。
当一个事务想要执行一致性读取操作时候,InnoDB通过多版本并发控制(MVCC)来保存数据的多个版本,每个版本都有一个唯一的事务ID(trx_id)与之关联。read-view机制就会创建一个视图,这个视图是由执行查询时所有未提交的事务id数组组成(数组最小的事务id为min_trx_id)和已创建事务最大id为max_trx_id组成,还有一个creator_trx_id,用来表示生成该read-view的事务ID。
在这里插入图片描述

以上图示read-view机制的区间。

版本链对比规则

1、如果trx_id<min_trx_id,表示生成该版本的事务在事务开始之前已经提交,则该版本对事务可见。
2、如果trx_id>max_trx_id,表示生成该版本的事务在事务开始后才开始,则该版本对事务不可见。
3、如果min_trx_id≤trx_id≤max_trx_id,则需要判断是否在视图数组trx_ids中。

  • 1)、如果trx_id在视图中,表示生成该版本是还没提交的事务,因此该版本对事务不可见。
  • 2)、如果trx_id不在视图中,表示生成该版本的事务是已提交的,因此该版本对事务可见。

对于删除的情况,会将版本链的最新数据复制一份,然后将trx_id修改成删除操作的trx_id,同时会在记录的头信息的标记位(delete_flag)上设置true,用来表示已经删除,在查询时,如果对应记录的delete_flag为true,则表示已经被删除,就不会返回数据。

案例理解

接下来我们通过一个案例来理解。(本次通过上篇文章所用到的数据表来作为案例)
我们假设有三个事务,根据时间顺序会执行不同操作(这里在如下的excel图中会有时刻来标记),以及提交的时间点不同,由此案例来了解MVCC机制是如何通过undo日志版本链和read-view机制工作的。并且介绍可重复读以及读已提交的MVCC机制。

可重复读

首先,假设我们插入一条新的数据(id=12)。然后我们有几个事务在执行各种操作,并且都有相应的事务id,具体的执行过程如下的excel图,用来明确表示各个事务在时间戳的执行流程。
在这里插入图片描述

注:这里需要注意一下,begin/start transation命令并不是一个事务的起点,具体真正开启事务是在执行到第一个修改操作InnoDB表的语句,这时候才会有事务id,MySQL内部是按照事务的启动顺序来分配事务id的。

时刻6查询

首先来看一种情况,事务id:100和101执行了更新操作,但是没提交,事务id:102对id=12进行了更新,并且提交事务,我们通过另一个会话进行查询id=12的这条记录,可见查出的first_name是102更新的数据。
在这里插入图片描述

我们来深入了解这MVCC机制,是如何从undo日志版本链中进行比对获取这个102所更新的数据。
如下图,首先我们需要知道read-view所选中的min_trx_id和max_trx_id。通过当前系统中活跃的最小事务id,从表格中可以看出min_trx_id是事务100,已创建事务最大id为max_trx_id是事务102,100,101是未提交的活跃事务。read-view:[100, 101], 102。

read-view {
  m_ids: [100, 101],   // 事务100和事务101均未提交
  min_trx_id: 100,     // 活跃未提交事务中最小的事务ID
  max_trx_id: 102,     // 已创建事务最大事务的ID
  creator_trx_id: 102  // 创建这个read-view的当前事务的ID
}

在这里插入图片描述

从日志版本链中看出事务102修改后会将回滚指针指向事务id为60上。然后就是进行版本链比对,当前row的trx_id=102,刚好是等于max_trx_id,接着需要判断这个102事务id是否在视图上,显然102是不在[100,101]中,所以就会认为这条数据是可见的,于是输出的值就是102这个事务的数据。

时刻9查询

我们接着往下走,事务id为100的事务执行了两次对id为12的记录进行更新,两次更新之后,事务还没提交,此时select 1会话又进行了一次查询。此时的查出来的数据依然是Liyongde,依旧是事务102更新的数据。
在这里插入图片描述

我们再来分析这个过程。此时如下图,read-view:[100,101], 102。
在这里插入图片描述

根据版本链,最新的数据是事务100更新的数据“Li2”,但是根据版本链规则判断,事务id=100属于视图数组里面,并且是没有提交的,于是就往版本链指向的版本进行判断,直到到达事务id=102的这条记录,不属于视图数组中,认为是可见的,因此返回的数据是“Liyongde”。

时刻13查询

接着看下一种情况,事务100提交了,随即事务101进行了一次更新,并且不提交,此时数据库的数据肯定是“Li2”,之后select 1进行查询id=12的记录,此时的read-view又是否会发生变化呢?得到的结果又是什么呢?
在这里插入图片描述

可见查出来的数据还是“Liyongde”,这是符合可重复读隔离级别的。还是需要通过undo日志版本链的规则来进行研究为什么得到的数据还是事务102提交的数据。
先确定视图数组,在可重复读级别下,同事务中的read-view是不会发生变化。所以依然是[100,101], 102。
在这里插入图片描述

此时数据库id=12是“Li2”,但是查出来的数据还是“Liyongde”,这是MVCC机制通过日志版本链的比对规则,从而达到可重复读的隔离机制。首先当前的trx_id=101,而101处于min_trx_id与max_trx_id之间,进一步判断是在视图里面,所以不可见,依此类推直到102不在视图中,则得到的记录是“Liyongde”。因为一致性视图在同事务并不会发生变化,因此,即便直到100,101,102三个事务全部都提交之后,Select 1查询得到的数据依旧是“Liyongde”。

注:在可重复读级别下,同事务中的read-view是不会发生变化。
这是因为可重复读的设计原则就是确保在同一个事务执行过程中,所看到的数据总是与事务在启动时看到的数据保持一致。当事务启动时,它会创建一个read-view,这个read-view在事务的整个生命周期内都是固定的,不会随着其他事务的提交或修改而改变。这样,即使在事务执行期间有其他事务修改了数据,当前事务所看到的数据仍然与启动时一致,从而保证了数据的可重复读性。因此,在可重复读的隔离级别下,同一个事务的read-view是不会变化的。

时刻14查询

如果此时有个新的事务Select 2,这个事务也是没有分配事务id,一直下来也没有执行查询操作,直到100,102都提交之后在执行了查询。那么此时的查询结果会是什么?
在这里插入图片描述

一致性视图(read-view)的状态取决于事务的启动时刻。根据excel图,我们可以知道创建的read-view数据以及日志版本链,如下图。
在这里插入图片描述

根据版本连的对比,可以得出此时事务查出的数据是“Li2”。当数据库事务开启之后的头一次查询,实际上read-view就已经创建了。我们通过以下例子来测试这个结果。
在这里插入图片描述

因为1是在修改之前进行了查询,此时就已经创建了一致性视图,接着进行修改值,哪怕已经提交了,查出来的结果依然是之前的数据;而2是在修改提交之后才进行的查询,此时创建的一致性视图就已经是更新过的事务数据。

读已提交

如上的案例,我们知道,在可重复读的隔离机制下,read-view是在开启事务的第一次查询就已经创建了,并且是直到事务的结束之前是不会发生变化。而接下来要介绍的读已提交隔离级别就有点不同,主要是read-view的创建,在读已提交的隔离级别下,read-view会在每次的查询的时候进行变化。

时刻9查询

根据上面的excel图,在时刻9的查询中,我们可以得出此时创建的read-view,事务102是提交的,事务100和101都是活跃未提交的事务,所以活跃数组则是[100, 101],当前事务为102,min_trx_id=100,max_trx_id=102。
接着就是一样的进行日志版本对比,对比规则与上文提到的方式是一致的,102不在视图中,所以数据可见,最后返回的是“Liyongde”。

时刻13查询

接着再来看看时刻13的情况,这个时候事务100也提交了,因为读已提交的read-view会在每次的查询发生变化,那么此时活跃事务就剩下了101,所以数组是[101],当前事务为102,min_trx_id=101,max_trx_id=102。
接着就是判断了,根据规则进行比对,最新的版本链中是事务id101,其是落在视图中,所以是不可见的数据,接着往上个版本看,事务id100是小于min_trx_id,因此此条数据是可见的。
在这里插入图片描述

总结

MVCC是一种用于解决数据库并发问题的乐观锁技术,多版本并发控制通过保存数据在某个时间点的快照来实现。换句话说,读操作不会阻塞写操作,写操作也不会阻塞读操作,以此来提高数据库性能。在每次对数据的操作,都用在undo日志版本链中进行。

👍创作不易,如有错误请指正,感谢观看!记得点赞哦!👍

转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1516216.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

压缩json字符串

GZIPOutputStream 需要关闭&#xff0c;而 ByteArrayOutputStream 不需要关闭。具体原因如下&#xff1a; GZIPOutputStream&#xff1a;GZIPOutputStream是一种过滤流&#xff0c;它提供了将数据压缩为GZIP格式的功能。当使用此类的实例写入数据时&#xff0c;它会对数据进行压…

Seata:实现分布式事务的利器

Seata&#xff1a;实现分布式事务的利器 Seata是一种开源的分布式事务解决方案&#xff0c;旨在解决分布式系统中的事务一致性问题。本文将介绍Seata的概念和原理&#xff0c;探讨其在分布式应用程序中的应用场景&#xff0c;并讨论其对于构建可靠的分布式系统的重要性。 Seata…

网赚人,为什么都退圈了?

今儿的话题多少有些悲观。 因为曾经辉煌的网赚圈也开始下滑&#xff0c;从没想过这一天会来的如此之快。最近一直说经济下行影响实体&#xff0c;我想着跟咱互联网人没关系啊&#xff0c;他们做实体的只针对本地客户&#xff0c;咱互联网人针对全国客户。还怕没人了&#xff1…

让短视频博主脾气变好的5款工具!

啊啊啊啊&#xff01;就想问几句&#xff01;谁在职场上脾气变差了&#xff01; 虽然在职场上总会有几天不想上班也是比较正常的事情&#xff0c; 但有的工作做着就有种摔鼠标发疯&#xff01; 考虑中不少做短视频博主一直想用却不知道的工具&#xff0c;也是专门给大家整理…

iTOP-3588开发板快速启动手册Windows安装串口终端调试串口常见问题(一)

2.4.1 设备管理器找不到端口 问题一&#xff1a;win10或者win11设备管理器找不到端口&#xff0c;怎么办&#xff1f; 解决方法&#xff1a; 一 可能是被隐藏了 1 首先进入到“设备管理器”中&#xff0c;找到如下图的位置。 2 点击“查看”&#xff0c;并找到的“显示隐藏…

中小学生校服订购系统lw 微信小程序-python+java+node.js+php

作为一个校服订购系统&#xff0c;数据流量是非常大的&#xff0c;因而&#xff0c;系统的制定需要达到方便使用、实际操作灵便的规定。所以&#xff0c;在设计方案校服订购系统时&#xff0c;应完成下列总体目标&#xff1a; (1)页面应美观大方友善&#xff0c;查找应便捷方便…

Linux:设置别名命令alias

相关阅读 Linuxhttps://blog.csdn.net/weixin_45791458/category_12234591.html?spm1001.2014.3001.5482 在Linux中alias命令用于为一串字符&#xff08;常代表命令&#xff09;设置一个别名&#xff0c;该别名在Bash读取并解析一行命令时会被展开。 下面是该命令的语法。 用…

征战PRO开发板XILINX VIVADO XC7A35T

征战PRO开发板经过几个月的设计准备工作&#xff0c;终于成功投板&#xff0c;来看看它是怎么一步一步变成PCB板的吧。 PCB图 CAD图 PCB裸板 裸板做出来还挺好看的。 大家可以看到我们板子上的丝印是非常丰富的&#xff0c;基本将管脚映射关系都在PCB板上体现出来了&…

(学习日记)2024.03.10:UCOSIII第十二节:多优先级

写在前面&#xff1a; 由于时间的不足与学习的碎片化&#xff0c;写博客变得有些奢侈。 但是对于记录学习&#xff08;忘了以后能快速复习&#xff09;的渴望一天天变得强烈。 既然如此 不如以天为单位&#xff0c;以时间为顺序&#xff0c;仅仅将博客当做一个知识学习的目录&a…

私域营销必看:构建超高回复率和超低删除率的私信交流体系

最近&#xff0c;收到了一位做私域运营的朋友的咨询&#xff0c;他困惑地问我&#xff1a;“为什么我每天给我的企微用户发送群发信息&#xff0c;但回复率却极低&#xff0c;而且删好友率还特别高呢&#xff1f;” 我回应他&#xff1a;“你有没有想过&#xff0c;问题的关键…

C/C++程序设计实验报告2 | 循环结构实验

本文整理自博主学校大一&#xff08;2021级&#xff09;C/C专业课的课程实验报告&#xff0c;适合学弟妹或C语言初学者入门C语言学习、练习。 编译器&#xff1a;gcc 10.3.0 ---- 注&#xff1a; 1.虽然课程名为C程序设计&#xff0c;但实际上当时校内该课的内容大部分其实都是…

idea中操作Git将本地仓库代码完整提交到Gittee中

文章目录 1.在idea中打开你的项目根目录&#xff0c; idea中vcs -> create Git Repository2.选中你的项目所在的目录3. git commit -m"你的备注"4. 直接强制本地仓库覆盖远程仓库的东西5.或者直接使用git 进行这个操作 1.在idea中打开你的项目根目录&#xff0c; …

3d场景重建图像渲染 | 神经辐射场NeRF(Neural Radiance Fields)

神经辐射场NeRF&#xff08;Neural Radiance Fields&#xff09; 概念 NeRF&#xff08;Neural Radiance Fields&#xff0c;神经辐射场&#xff09;是一种用于3D场景重建和图像渲染的深度学习方法。它由Ben Mildenhall等人在2020年的论文《NeRF: Representing Scenes as Neur…

BI数据分析案例详解:零售人货场分析该怎么做?

在当今快节奏、高竞争的商业环境中&#xff0c;人货场分析已成为企业成功的关键因素之一。科技的进步和数据的日益丰富使得企业对人流、货物流和场地布局的深入洞察变得愈发重要。通过科学的人货场分析&#xff0c;企业能更好地理解顾客行为、优化供应链、提高运营效率&#xf…

wpscan专门针对wordpress的安全扫描工具

说明 WPScan是一款专门针对WordPress的漏洞扫描工具&#xff0c;它使用Ruby编程语言编写。WPScan能够扫描WordPress网站中的多种安全漏洞&#xff0c;包括WordPress本身的漏洞、插件漏洞和主题漏洞。此外&#xff0c;WPScan还能扫描类似robots.txt这样的敏感文件&#xff0c;并…

Python打印输出Linux中最常用的linux命令之示例

一、Linux中的~/.bash_history文件说明&#xff1a; 该文件保存了linux系统中运行过的命令的历史。使用该文件来获取命令的列表&#xff0c;并统计命令的执行次数。统计时&#xff0c;只统计命令的名称&#xff0c;以不同参数调用相同的命令也视为同一命令。 二、示例代码&am…

什么是token?token是用来干嘛的?

相信很多从事计算机行业的朋友都听说过token这么个东西&#xff0c;但是其他行业的人就很少了解到token&#xff0c;下面就给大家来详细介绍一下token是什么意思&#xff1f;token是用来干嘛的这一块的内容&#xff0c;希望能帮助到大家。 &#x1f3fb; token是什么意思 作为…

matplotlib-散点图

日期&#xff1a;2024.03.14 内容&#xff1a;将matplotlib的常用方法做一个记录&#xff0c;方便后续查找。 # 引入需要使用的库 from matplotlib import pyplot as plt# 设置画布大小 plt.figure(figsize(20,8),dpi 300)# 全局设置中文字体 plt.rcParams[font.sans-serif]…

DHCP中继实验(思科)

华为设备参考&#xff1a;DHCP中继实验&#xff08;华为&#xff09; 一&#xff0c;技术简介 DHCP中继&#xff0c;可以实现在不同子网和物理网段之间处理和转发DHCP信息的功能。如果DHCP客户机与DHCP服务器在同一个物理网段&#xff0c;则客户机可以正确地获得动态分配的IP…

L2-009 抢红包(Java)

没有人没抢过红包吧…… 这里给出N个人之间互相发红包、抢红包的记录&#xff0c;请你统计一下他们抢红包的收获。 输入格式 输入第一行给出一个正整数N&#xff08;≤104&#xff09;&#xff0c;即参与发红包和抢红包的总人数&#xff0c;则这些人从1到N编号。随后N行&…