深入理解mvcc机制(详解)

news2025/3/1 4:03:00

深入理解mvcc机制

  • 一,MVCC定义
    • 1,undolog日志
    • 2,undolog版本控制链
    • 3,readView
      • 3.1,readview简介
      • 3.2,readview和undolog结合使用规则
      • 3.3,readview和undolog基本使用
    • 4,总结

一,MVCC定义

MVCC:Multi-Version Concurrency Control,多版本并发控制机制。

在mysql中,为了满足事务的四大特性之一的隔离性,就是当前事务中的查询的数据不受其他事务的增删改操作的影响,因此mysql主要是通过这个可串行化的这种隔离级别和现在即将要谈的mvcc机制来实现。而可串行化就是将所有的操作由并行改为串行,就是在每个增删改包括查操作上面都加了锁,因此性能非常的低,因此mysql也并没有选择这个可串行化来作为mysql的默认的隔离级别,而是使用的可重复读。接下来就是主要谈一下这个可重复读事务中的mvcc的机制和底层原理。

1,undolog日志

在讲mvcc机制之前,需要先了解一下这个undolog日志。在mysql中,如果使用的是默认的可重复读的这个隔离级别,在一条更新语句中如果加了事务,那么在这个事务启动之后,提交之前,那么这条数据是暂时不会添加到数据库的,直到事务提交成功才会提交或者更新到数据库。那么中间就需要实现数据的暂存,那么这种存储的方式就是通过这个undolog日志的的是实现的。

CREATE TABLE `product` (
  `id` bigint(20) NOT NULL,
  `product_id` int(11) DEFAULT NULL COMMENT '商品id',
  `version` int(11) DEFAULT NULL COMMENT '版本',
  `stock` int(11) DEFAULT NULL COMMENT '商品数量',
  `updated_time` datetime DEFAULT NULL COMMENT '更新时间',
  `created_time` datetime DEFAULT NULL COMMENT '创建时间',
  `is_deleted` tinyint(4) DEFAULT NULL COMMENT '是否删除',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

如上,创建一张表,然后里面新增一条数据

insert into stock values (1,1,0,100,now(),now(),0);

拿一条更新语句来说,如上面一张商品表,接下来要扣减一件商品的库存,一开始这件商品有100,那么现在扣减20,如果扣减成功,那么数据库的值就是80

update product set stock = stock - 20 where id = 1;

如果在扣减数据时,发生异常出现回滚,那么此时就需要回滚成之前的值,就是需要一个日志来记录扣减之前的值,那么就是通过这个undolog来记录的。就是说在这个update更新语句中,在开启事务之后,提交事务之前,这个库存100就会记录在undolog日志里面,减完后的80这个值如果整个事务没有出现异常那么就直接加入到数据库里面,如果出现异常那么就将undolog里面的值作为回滚数据。一句话说这个undolog日志就是用来记录被修改的值,防止出现异常回滚的

2,undolog版本控制链

当然这个undolog日志也不是只记录一条,如在一个或者多个事务中对这个库存进行了多次的修改,那么这个undolog就会形成一条历史版本控制链。在这个版本控制链中,有一个隐藏的事务id和指针。事务id在新增或者更新都会生成一个事务id,默认自增(重点);指针所指向的就是当前数据修改前的一个历史数据,如果出现了回滚,那么就会根据这个链路依次的往前回滚,直到找到上一个或者前面几个。

在这里插入图片描述

这个事务id是在sql更新或者新增的时候生成,并非事务提交的时候生成,因此可能出现事务大的id先提交,那么版本控制链路里面的事务id的大小就是乱序的。

3,readView

3.1,readview简介

在上面的undolog日志里面,可以发现确实时记录了所有的修改的值,也知道这个undolog是用来回滚的,但是会存在一个问题,如果单纯使用一个undolog来解决这个回滚问题,那么就会不知道回滚到链路中的哪一个结点,因此就需要引入这个readView来和这个undolog结合使用,通过readview来知道需要回滚到链路的哪一个结点。

在一个事务里面,执行任何查询都会生成当前事务的一致性视图read-view,在可重复读中的事务隔离级别中,该视图在事务结束之前都不会变化。当然如果是读已提交的隔离级别那么在每次执行sql时都会重新生成视图。

在可重复读的事务里面,这个readview视图由未提交的事务id数组和已创建的最大事务id(max_id)组成,因此这个最大的 max_id 可能在数组里面,也可能不在,因为事务最大的id可能先提交,而数组里面的id都是未提交的。

[trx_id1,trx_id2],max_id

在这里插入图片描述

如上图,有四个事务ABCD,同时开启事务,同时去操作这个商品表的库存,事务ABC在执行更新语句之后,就会产生一个事务id,因为事务id是自增的,因此从左往右事务依次递增。而事务D里面主要是用来查询,并无增删改操作,主要是查询当前事务中的库存的数量,由于没有更新和查询语句,因此也没有事务id。由于三个事务是同时开始,因此commit提交的时间取决于更新语句的时间,谁先更新完谁先提交,因此可能会出现事务大的id先提交。

上图主要是针对库存表中id为1的那一行数据进行操作的,而id=2只是为了通过更新语句给这个事务生成一个事务id

并且mvcc机制主要是针对于可重复读的这个隔离级别,因此在D中暂时只考虑查询有其他事务提交的数据,未提交之前的数据暂时不做select查询考虑

3.2,readview和undolog结合使用规则

在使用这个readview只能看到当前的几个事务,并且不能得知事务的提交顺序,因此需要结合上面所说的undolog一起使用。在两者结合使用之前,需要有一个readview视图和undolog版本的比对规则,接下来先详细的说一下这个比对规则的一些命名:假设这个数组中未提交的的事务id数组的最小值假设为min_id,已创建事务的事务id的最大id为max_id,undolog版本控制链的头结点为head结点。如在下面的第三个select查询语句中,min_id = 102 , max_id = 104。

然后以这个min_id和这个max_id为分界处,小于这个min_id的为已提交事务,在这两个值区间的为未提交或者已提交事务,大于这个max_id的,为未开始事务。

在这里插入图片描述

那么规则如下:

head结点的事务id <= min_Id:已提交的事务,该事务是可见的

min_Id < head结点的事务id <= max_Id:未提交的事务或者已提交的事务

​ 如果事务id在数组中:表示事务未提交,不可见

​ 如果事务id不在数组中:那么表示已提交,是可见的

max_Id < head结点的事务id : 未开始的事务,不可见

总结:只要满足一个事务是可见的,那么这个版本控制链路对应结点的值就是需要找的值

3.3,readview和undolog基本使用

1,假设库存一开始为200,由于事务id是自增,那么可以暂时假设这个事务trx_id=101的值对应的库存就是200,那么在事务D中,在第一次查询之后就会生成一个readview视图,并且在事务提交之前,这个视图的值不会改变。接下来主要研究一下在这个RR的默认级别事务中,为何select查询的值可以不变化,以及readview和undolog匹配的过程是咋样的。

在这里插入图片描述

2,接下来看第一个select查询,此时事务ABC都因为有了更新语句,因此此时abc都有对应的事务,并且事务A已经提交事务,此时的事务readview组成如下,而undolog链路中的值如下图,因为主要是针对表中id为1的库存对应的版本链路,因此暂时只有两个数据,bc中两个更新语句只为了生成事务id,数据并不在一个undolog版本链路上,并且此时头节点head对应的事务id为102。

那么通过这个头结点head对应的事务和readview的视图进行对比,此时的head事务id为102,min_id为数组中最小值103,max_id为已创建的最大值id104,根据版本比对规则,符合第一条head结点的事务id小于min_id,即当前结点时可见的,只要获取到的值是可见的,那么查询到的值就是这个事务对应的值,即100

//第一个select查询语句的值,由未提交的事务id数组和已创建的最大的事务id组成
[103,104],104

在这里插入图片描述

3,接下来看第二个select查询语句,此时的事务B提交了,事务B是操作id为1的商品数据,因此在更新时会将原始值加入到这个undolog的日志版本链路上。由于事务D并没有提交,因此此时的readview如下,和之前一样,但是undolog日志链路会多一条数据,其链路如下图

那么此时的头节点的值为事务id103,即head对应的事务id为103,min_id为103,max_id为104。根据版本对比规则,符合第二条,但是此时的head对应的事务id还在数组中,因此这个结点的数据并不可见。那么将继续对比下一个结点,下一个结点的事务id为102,符合第一条head结点的事务id小于min_id,即事务id为102对应的结点时可见的,那么查询到的值仍然时100

//第二个select查询语句的值,由未提交的事务id数组和已创建的最大的事务id组成
[103,104],104

在这里插入图片描述

4,接下来再看第三个select语句,第三个select查询语句就是在事务C提交之后进行查询的,那么此时的readview视图如下,依旧不变,因为操作的是id为1的值,因此undolog版本链路上会多一条数据。

此时的头节点head的事务id为104,min_id为103,max_id为104。根据版本对比规则,符合第二条,但是此时的head对应的事务id还在数组中,因此这个结点的数据并不可见;那么将继续对比下一个结点,下一个结点的事务id为103,符合第二条,但是此时的head对应的事务id还在数组中,因此这个结点的数据也不可见;接下来对比第三条,head结点的事务id为102,小于min_id103,即事务id为102对应的结点时可见的,那么查询到的值仍然时100

//第三个select查询语句的值,由未提交的事务id数组和已创建的最大的事务id组成
[103,104],104

在这里插入图片描述

因此不管后面有再多的其他事务更改,只要当前事务没有提交,那么当前事务对应的readview就不会改变,通过undolog的日志版本链路,并且结合readview的版本比对规则,就可以找到一个可见的事务对应的数据,那并且这个值一定是最先获取的值,就如上面商品的库存,即使数据库中的值真的变了,也可以通过这个mvcc机制来保证事务的隔离性,从而解决使用读写锁效率低慢的问题。一句话总结就是:根据数据版本链对比规则,来读取同一条数据在版本链上的不同版本数据,并且可以存在多个事务形成多个readview,但是版本链undolog只有一条

4,总结

mvcc被称为多版本并发控制机制,由于mysql中的事务默认使用的是可重复读,在这个隔离级别中并没有解决幻读问题,因此可以通过mvcc机制解决,并且还可以解决并发中读写锁,读写冲突问题,从而提高并发读写的性能和效率。mvcc机制主要就是通过undolog的日志版本控制链和readview视图组成。undolog链路中的每个结点由一个事务id和一个指针组成,事务id是在更新或者插入数据时会生成,指针是用来指向上一个版本,在执行完更新语句时就会将这个事务id加入到版本链路中;readview视图由未提交的事务id数组和已创建的最大的事务id组成,并且在一个事务中,第一次select查询就会生成一个readview视图,并且在事务提交之前该事务的readview视图不变。然后根据readview视图比对规则,其规则就是将undolog链路中的头节点为head结点,将数组中的最小id为min_id,将已创建的最大的id为max_id,然后根据视图比对规则,找到一个事务id是可见的,那么找到的第一个可见的值,该事务id对应结点的值就是需要查询出来的值。主要就是通过版本链比对规则,来读取同一条数据版本链路上面的不同数据。这样就可以保证在一个事务中查询的值可以一直不变,不受其他事务的影响,并且这种方案的效率远远高于读写锁。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/9406.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java学习----前端3

今日学习内容如下&#xff1a; JavaScript JavaScript是一种基于对象和事件驱动的客户端脚本语言动态、弱类型、基于原型&#xff0c;内置了支持类 解释器称为 JS 引擎&#xff0c;内置于浏览器中 ECMA 欧洲计算机制造商协会Hello world <input type"button" on…

与git相关错误的究极解决方案

没有科学上网导致的git推送和拉取错误&#xff0c;严重阻碍了搬砖进度&#xff0c;遇到的与git有关的错误&#xff1a; 1. gnutls_handshake() failed: The TLS connection was non-properly terminated. 2. Failed to connect to github.com port 443:connection timed out …

Postman 如何获取请求结果并设置到请求头中

目录1.设置环境变量2.获取token&#xff0c;并赋值给环境变量3.将环境变量添加到请求头Postman&#xff1a; 是一款用于接口调试和测试的开发工具&#xff0c;功能强大&#xff0c;使用简单。 无论是开发人员进行接口调试&#xff0c;还是测试人员做接口测试&#xff0c;Postma…

本地生活小程序有什么功能_本地生活小程序的优势

对于平台运营方 痛点&#xff1a;社区团购毛利偏低 零售行业竞争激烈&#xff0c;单纯依靠社区团购卖货整体毛利率较低 手中大量用户&#xff0c;缺少好的变现模式&#xff0c;迫切需要提升盈利能力。 优势&#xff1a;提升盈利&#xff0c;解决流量变现 本地生活属于轻资产…

8Manage:千万别忽视了供应商绩效管理

供应商绩效管理是采购管理流程中的一部分&#xff0c;现代企业几乎都会对供应商实行绩效考核。绩效管理的主要目的是了解供应商的表现、促进供应商改进&#xff0c;并为工业商奖励、供应商优化提供依据&#xff0c;以此来发现优质的供应商&#xff0c;及时改进不合格的供应商。…

Python控制自己的手机摄像头拍照,并把照片自动发送到邮箱

前言 嗨喽&#xff0c;大家好呀~这里是爱看美女的茜茜呐 又到了学Python时刻~ 今天这个案例&#xff0c;就是控制自己的摄像头拍照&#xff0c; 并且把拍下来的照片&#xff0c;通过邮件发到自己的邮箱里。 想完成今天的这个案例&#xff0c;只要记住一个重点&#xff1a;你…

CSDN的MD编辑器【写作技巧】

CSDN的MD编辑器【写作技巧】在线LaTeX公式的编辑器快捷键&#xff0c;结合快捷键提高效率写作技巧在线LaTeX公式的编辑器 推荐去https://www.latexlive.com/在线LaTeX公式编辑器 将写好的公式代码复制过来。 然后复制在CSDN编辑器里面前后加上符合$就行了 前后加两个该符合就会…

Java环境安装即配置

一、java1.8的安装步骤 1 安装目录创建java文件夹 在想要安装java的目录下创建一个java文件夹,不能出现特殊符号和汉字、空格等 2 java文件夹内创建jdk和jre Java安装需要两部分,一个jdk一个jre 所以在java文件夹中创建两个文件夹 3 解压安装包 通过百度网盘分享的文件&#…

【论文精读3】MVSNet系列论文详解-P-MVSNet

P-MVSNet全名为“P-MVSNet: Learning Patch-wise Matching Confidence Aggregation for Multi-View Stereo”&#xff0c;名字当中反映了论文的核心模块即基于学习方法的分块匹配置信聚合模块&#xff0c;乍一看有点难理解&#xff0c;但看完本文肯定很清楚啦。 本文是MVSNet系…

mysql 数据库使用分享(多图解析)

1、大体流程 1.1 一些概念 1.1.1 RDBMS 关系型数据库&#xff0c;是指采用了关系模型来组织数据的数据库&#xff0c;其以行和列的形式存储数据&#xff0c;类似excel 1.1.2 OLAP 和 OLTP OLTP(Online transactionprocessing):在线/联机 事务 处理。主要是对数据库中的数据…

PTA:字符串加密

输入一个原始字符串&#xff08;长度小于80&#xff09;&#xff0c;然后输入一个5位的数字字符串作为加密密钥&#xff0c;对原始字符串中的每个字符根据其位置&#xff08;对5取模&#xff09;变换为加上数字字符串中的数字的字符。如输入原始字符串student&#xff0c;然后输…

Linux学习-36-文件系统管理-硬盘结构

10 Linux文件系统管理 之前在安装Linux的时候已经对 Linux 的分区方法和文件系统进行了介绍。不过那种分区方法是在安装系统的同时使用图形界面进行分区&#xff0c;如果添加了一块硬盘&#xff0c;那么当然要有不重新安装系统就可以分区的方法。文件系统即分区&#xff1a;原…

通达信接口进行二次编程开发步骤

大家都知道通达信接口是比较流行的快速通达信数据excel接口&#xff0c;能够提供多家券商&#xff0c;包括通达信数据excel接口、量化回测平台等。 通达信接口API接口说明&#xff08;部分&#xff09; 今天小编主要讲一下&#xff0c;关于通达信接口进行二次编程开发步骤如下…

【Linux】基本指令合集

1、ls 指令 功能: 显示当前目录下的所以子目录和文件 常用选项&#xff1a; -a&#xff1a;显示目录下的所以文件和以 . 开头的隐藏文件 -l&#xff1a;查看文件&#xff0c;ls -l等价于ll -R&#xff1a;显示所以子目录下的文件 -t&#xff1a;以时间排序 举例&#xff1a; …

PyCharm 的初始设置

目标 1、恢复 PyCharm 的初始设置 2、第一次启动 PyCharm/ 3、新建一个 Python 项目 4、设置 PyCharm 的字体显示 5、PyCharm 的升级以及其他 6、PyCharm 的官方网站地址是&#xff1a; PyCharm: the Python IDE for Professional Developers by JetBrains 01. 恢复 Py…

PMP有用吗,PMP含金量,如何转型项目经理?

先说一句&#xff0c;pmp是有用的&#xff0c;含金量也挺高的&#xff0c;也可以转型项目经理的&#xff0c;我再分别说明一下。 1、PMP有用么&#xff1f; 从本质来说&#xff0c;应该是pmp学习项目管理有没有用。 参加PMP认证与考试的过程是一个系统学习和巩固项目管理知识…

小白速点,计算机的存储规则你知道多少

计算机的存储规则 以前的认知 ​ 我们知道计算机中所有的文件都是存储在硬盘上的。当我们在编辑一个文档的时候&#xff0c;点击了保存按钮&#xff0c;那么文件中所有的数据都会保存在硬盘上。 但是他是怎么存储的呢&#xff1f;咱们就需要来学习一下。 计算机的二进制 ​…

三驾马车、四大赛道,元宇宙如何领跑数字经济?

进入2022年,全球互联网巨头继续加快布局元宇宙步伐,国内互联网企业也争相申请注册元宇宙相关商标,抢占数字经济发展先机。 党的十八大以来,发展数字经济逐渐上升为国家战略。多名业内权威人士表示,元宇宙或将引领全球数字经济发展,亟须尽快出台政策,破解制约元宇宙发展的法律…

隐式神经表示做超分:Local Texture Estimator for Implicit Representation Function

文章目录1. Local Texture Estimator for Implicit Representation Function1. 通过隐式神经网络表示方法 实现 超分辨率。2. 在编码器和解码器之间作者引入一个 local texture estimator3. 代码分析整体框架生成图像特征&#xff0c;编码器是一个常规的卷积网络&#xff0c;文…

vue3【生命周期讲解-详】

一、通过配置项的形式使用生命周期钩子 父组件&#xff1a; <template><button click"isShowDiv!isShowDiv">切换显示隐藏</button><Test v-if"isShowDiv"></Test> </template><script> import Test from ./…