MySQL的事务隔离是如何实现的?

news2024/11/17 15:29:40

目录

从一个例子说起

快照读和当前读

 事务的启动时机和读视图生成的时刻

MVCC

隐藏字段

Undo Log回滚日志

Read View - 读视图

可重复读(RC)隔离级别下的MVCC

读提交(RR)隔离级别下的MCC

关于MVCC的一些疑问 

1.为什么需要 MVCC ?如果没有 MVCC 会怎样?

2.多版本,是在索引保存了该行数据的多个版本吗?

总结

从一个例子说起

当数据库上有多个事务同时执行的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)的问题,为了解决这些问题,就有了“隔离级别”的概念。

MySQL有4个隔离级别:

  • 读未提交:一个事务还没提交时,它做的变更就能被别的事务看到。
  • 读提交:一个事务提交之后,它做的变更才会被其他事务看到。
  • 可重复读:一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。
  • 串行化:顾名思义是对于同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行。

用一个例子说明这几种隔离级别。假设数据表 T 中只有一列,其中一行的值为 1,下面是按照时间顺序执行两个事务的行为。

mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);

在不同的隔离级别中,事务 A 会有不同的返回结果,也就是图里面 V1、V2、V3 的返回值会不同。

  • 隔离级别是“读未提交”, 则 V1 的值就是 2。这时候事务 B 虽然还没有提交,但是结果已经被 A 看到了。因此,V2、V3 也都是 2。
  • 隔离级别是“读提交”,则 V1 是 1,V2 的值是 2。事务 B 的更新在提交后才能被 A 看到。所以,V1还是1,而 V3 的值是 2。
  • 隔离级别是“可重复读”,则 V1、V2 是 1,V3 是 2。之所以 V2 还是 1,遵循的就是这个要求:事务在执行期间看到的数据前后必须是一致的。
  • 隔离级别是“串行化”,则在事务 B 执行“将 1 改成 2”的时候,会被锁住。直到事务 A 提交后,事务 B 才可以继续执行。所以从 A 的角度看, V1、V2 值是 1,V3 的值是 2。

在实现上,数据库里面会创建一个视图read-view),访问的时候以视图的逻辑结果为准。在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的。

这里需要先讲解下当前读和快照读 和 事务的启动时机和读视图生成的时刻

快照读和当前读

MySQL读取数据实际上有两种模式,分别是当前读和快照读。

快照读:普通的select语句(即是不加锁的select操作) 都是采用 快照读的模式。

当前读:数据修改的操作(update、insert、delete) 和select ... lock in share mode; select ... for update;都是采用 当前读的模式,对读取到的数据(索引记录)加锁来保证数据一致性,是读到最新的数据。

 事务的启动时机和读视图生成的时刻

在 MySQL 有两种开启事务的命令,分别是:

  • 第一种:begin/start transaction 命令;
  • 第二种:start transaction with consistent snapshot 命令;

begin/start transaction 命令并不是一个事务的起点,在执行到它们之后的第一个操作 InnoDB 表的语句,事务才真正启动。如果你想要马上启动一个事务,可以使用 start transaction with consistent snapshot 这个命令。

第一种启动方式,一致性视图是在执行第一个快照读语句时创建的;

第二种启动方式,一致性视图是在执行start transaction with consistent snapshot 时创建的。

说到视图read-view),那就会引出MVCC。而事务隔离就是通过MVCC来实现的

更加准确来说,实现事务隔离的方法是有两种:

  • 针对快照读(普通 select 语句),是通过 MVCC 方式解决了幻读,因为可重复读隔离级别下,事务执行过程中看到的数据,一直跟这个事务启动时看到的数据是一致的,即使中途有其他事务插入了一条数据,是查询不出来这条数据的,所以就很好了避免幻读问题。
  • 针对当前读(select ... for update 等语句),是通过 next-key lock(记录锁+间隙锁)方式解决了幻读,因为当执行 select ... for update 语句的时候,会加上 next-key lock,如果有其他事务在 next-key lock 锁范围内插入了一条记录,那么这个插入语句就会被阻塞,无法成功插入,所以就很好了避免幻读问题。

所以,事务隔离是通过MVCC 和 加锁 实现的

那么,MVCC 用来实现哪几个隔离级别?

  • 隔离级别如果是读未提交的话,直接读最新版本的数据就行了,根本就不需要保存以前的版本,即是“读未提交”隔离没有视图概念。
  • 可串行化隔离级别事务都串行执行了(就是直接加锁避免并行访问),所以也不需要多版本。
  • 因此 MVCC 是用来实现读已提交和可重复读

MVCC

多版本并发控制(Multi-Version  Concurrency Control)是一种用来解决读-写冲突的无锁并发控制,可以做到在读操作时不用阻塞写操作,写操作也不用阻塞读操作,提高了数据库并发读写的性能。

最早的数据库系统,只有读读之间可以并发,读写,写读,写写都要阻塞。引入多版本之后,只有写写之间相互阻塞,其他三种操作都可以并行,这样大幅度提高了 InnoDB 的并发度。

实现原理主要是依赖记录中的 三个隐藏字段undo日志 ,Read View 来实现的。

隐藏字段

innodb引擎保存的行数据是有三个隐藏字段的。

 具体的内容可以查看该文章MySQL的一行数据是如何存储的? 

 innodb引擎表 的聚簇索引保存的数据就是完整的行数据(即是上图的数据)。这里就主要是使用TRX_ID和ROLL_PTR。

DB_TRX_ID

最近修改事务ID,记录插入这条记录或最后一次修改该记录的事务ID。

DB_ROLL_PTR

回滚指针,指向这条记录的上一个版本,即是指向指向 undo log 的指针。用于配合Undo Log,指向上一个版本。

 每次对某条聚簇索引记录进行改动时,都会把旧版本的记录写入到 undo 日志中。DB_ROLL_PTR是个指针,指向每一个旧版本记录,于是就可以通过它找到修改前的记录。

Undo Log回滚日志

  • 这个是在增、改、删操作的时候产生的便于数据回滚的日志。
  • INSERT操作的时候,产生的回滚日志在事务提交后可被立即删除。而UPDATEDELETE操作的时候,产生的Undo Log日志不仅在进行数据回滚时需要,在进行快照读时也需要,所以不会立即被删除
  • 因为undo log 记录事务修改之前版本的数据信息,因此假如由于系统错误或者rollback操作而回滚的话可以根据undo log的信息来进行回滚到没被修改前的状态。

undo log 版本链 

用一个表做例子 ,建表和初始化语句如下。

mysql> CREATE TABLE `t` (
  `id` int NOT NULL,
  `age` int DEFAULT NULL,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t values(1,30,'a30');

​ 不同事务或相同事务对同一条记录进行修改,会导致该记录的undolog生成一条记录版本链表,链表的头部是最新的旧记录,链表尾部是最早的旧记录。DB_ROLL_PTR回滚指针指向Undo Log数据地址形成一个链表。我们把这个链表称之为 版本链

Read View - 读视图

Read View就是事务进行快照读操作的时候生产的读视图(Read View),在该事务执行的快照读的那一刻(select ....),会生成数据库系统当前的一个快照,记录并维护系统当前活跃事务的ID(当每个事务开启时,都会被分配一个ID, 这个ID是递增的,所以最新的事务,ID值越大)。

已经弄清楚版本链后,而 readView 就是用来判断哪个版本对当前事务可见的。

readView中有4个概念:

  • m_ids :指的是在创建 Read View 时,当前数据库中「活跃事务」的事务 id 列表,注意是一个列表,“活跃事务”指的就是,启动了但还没提交的事务
  • min_trx_id :指的是在创建 Read View 时,当前数据库中「活跃事务」中事务 id 最小的事务,也就是 m_ids 的最小值。
  • max_trx_id :这个并不是 m_ids 的最大值,而是创建 Read View 时当前数据库中应该给下一个事务的 id 值,也就是全局事务中最大的事务 id 值 + 1;
  • creator_trx_id :指的是创建该 Read View 的事务的事务 id

知道版本链和读视图后,那如何通过读视图来判断哪个版本对当前事务是可见的呢?

代码中判断的逻辑如下:

最新版本开始沿着版本链逐渐寻找老的版本,如果遇到符合任一条件的版本就返回。

注意:在不同的隔离级别下快照读生成的ReadView规则不同:

  • read committed (读已提交):事务每次select时创建ReadView
  • repeatable read (可重复读):事务第一次select时创建ReadView,后续一直使用

而我们写sql语句后进行分析可见版本,是看不到min_trx_id和max_trx_id这些数据的。那我们用另一种方式来判断。

不知min_trx_id等数据的分析规则

一个数据版本,对于一个事务视图来说,除了自己的更新总是可见以外,有三种情况:

  1. 版本未提交,不可见;
  2. 版本已提交,但是是在视图创建后提交的,不可见;
  3. 版本已提交,而且是在视图创建前提交的,可见。

这种通过 版本链 来控制并发事务访问同一个记录时的行为就叫 MVCC(多版本并发控制)

可重复读(RC)隔离级别下的MVCC

用一个表做例子 ,建表和初始化语句如下。

mysql> CREATE TABLE `t` (
  `id` int NOT NULL,
  `age` int DEFAULT NULL,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t values(30,30,'a30');

从上图时间顺序,事务2先启动,跟着是事务3,4,5依次启动。事务2对应的事务id是2,依次类推。

因为是RC隔离级别,所以每次select都会生成新的快照。

下面是每次提交事务生成的版本链&第一次快照读的ReadView

只分析事务5中的select,从最新版本开始沿着版本链逐渐寻找老的版本。

第一次select:

  • 当前最新版本的事务id是4,所以trx_id为4,不等于create_trx_id,所以不符合条件①。条件②,③,④也都不符合。所以事务id是4的版本不可见。
  • 跟着是老版本,事务id为3的版本,条件①不符合,条件②(3<3不符合)不符合。条件③(3<6),说明可能可以可见;条件④,3在[3,4,5]范围内,说明该版本在活跃事务列表中,未提交,不可见。所以事务id是3的版本不可见。
  • 事务id是2的版本,trx_id=2。条件①不符合,条件②符合(2<3)。所以事务id=2的版本可见

 查看上图的并发执行过程,对比事务5,发现事务2是已提交,因此此刻可以读取事务2提交过的数据。

第二次select也是这样分析,但注意的是在RC隔离级别下,是生成新的读视图的,这里还是按照上面的逻辑分析的,这里就不具体写了,留给读者分析。

用不知min_trx_id等数据的分析规则进行分析

第一次select:

  • 从最新版本开始查看,最新版本是事务id为4的,还没提交,属于情况1,不可见。
  • 到事务id为3的版本,还未提交,属于情况1,不可见。
  • 到事务id为2的版本,该版本已提交,而且是在视图创建前提交的(即是在事务5创建视图前),属于情况3,所以事务id为2的版本可见。

第二次select:

  • 从最新版本开始查看,最新版本是事务id为4的,还没提交,属于情况1,不可见。
  • 到事务id为3的版本,已提交,并且在视图创建前提交的(即是在事务创建视图前,第二次select),属于情况3,所以事务id为3的版本可见。

读提交(RR)隔离级别下的MCC

 这里的事务执行顺序和RC隔离级别的是一样的。

在RR隔离级别下,只是在事务中第一次快照读时生成ReadView,后续都是复用该 ReadView,那么既然ReadView都一样, ReadView的版本链匹配规则也一样, 那么最终快照读返 回的结果也是一样的。而且都是和RC隔离级别第一次select中的结果一样的。分析过程和RC级别的一样。

用不知min_trx_id等数据的分析规则进行分析

第一次select:和RC隔离级别的第一次select是一样的,事务id是2的版本可见。

第二次select:

  • 从最新版本开始查看,最新版本是事务id为4的,还没提交,属于情况1,不可见。
  • 到事务id为3的版本,已提交,但是是在视图创建后提交的(即是在事务5创建视图前,因为RR级别是延用第一次生成的视图),属于情况2,不可见。
  • 到事务id为2的版本,该版本已提交,而且是在视图创建前提交的(即是在事务5创建视图前),属于情况3,所以事务id为2的版本可见。

这样分析第一次select和第一次select读取的数据是一致的。

关于MVCC的一些疑问 

1.为什么需要 MVCC ?如果没有 MVCC 会怎样?

如果没有MVCC读写操作之间会有冲突。

假设一个场景:

事务A在执行中,此时事务B修改了记录1,还没提交;而此时事务A想要读取记录1。事务B还没提交,所以事务A无法提取到最新的记录1,不然就是脏读了。

那么事务A就是应该读取被事务B修改前的记录。但是记录1已被事务B修改了,那就只能用锁,用锁阻塞等到事务B的提交。这种实现就是基于锁的并发控制 ,Lock Based Concurrency Control(LBCC)。

这时,如果有多版本就好了,保存事务B修改记录1之前的版本数据。此时事务A就可以读取之前版本的数据,这样读写操作就不会阻塞,也不用加锁。所以说 MVCC 提高了事务的并发度,提升数据库的性能。

2.多版本,是在索引保存了该行数据的多个版本吗?

这个多版本说法只是为了便于理解或者说展现出来像多版本的样子而已。

 InnoDB 不会真的存储多个版本的数据,只是借助 undo log 记录每次写操作的反向操作,所以索引上对应的记录只会有一个版本(即最新版本)。只不过可以根据 undo log 中的记录反向操作得到数据的历史版本,所以看起来是多个版本。

总结

事务是在 MySQL 引擎层实现的,默认的 InnoDB 引擎支持事务。

MySQL InnoDB 引擎的默认隔离级别是 可重复读(RR),但不建议将隔离级别升级为串行化,因为这会导致数据库并发时性能很差。RR隔离级别是可以很大程度避免幻读现象(并不是完全解决),解决的方案有两种:

  • 针对快照读(普通 select 语句),是通过 MVCC 方式解决了幻读,因为可重复读隔离级别下,事务执行过程中看到的数据,一直跟这个事务启动时看到的数据是一致的,即使中途有其他事务插入了一条数据,是查询不出来这条数据的,所以就很好了避免幻读问题。
  • 针对当前读(select ... for update 等语句),是通过 next-key lock(记录锁+间隙锁)方式解决了幻读,因为当执行 select ... for update 语句的时候,会加上 next-key lock,如果有其他事务在 next-key lock 锁范围内插入了一条记录,那么这个插入语句就会被阻塞,无法成功插入,所以就很好了避免幻读问题。

所以,事务隔离是通过MVCC 和 加锁 实现的。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1515293.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

矢量场的通量和散量

矢量与矢量场 矢量&#xff1a;又有大小又有方向的量。&#xff08;力、速度、电场强度等&#xff09; 矢量场&#xff1a;如果空间中处处都有矢量存在&#xff0c;则称形成了一个矢量场。 表示矢量场的方法&#xff1a; 1、数学表达式&#xff1a; 此表达式为直角坐标系下表…

腾讯云轻量服务器地域选择方法整理,选择不能修改!

腾讯云轻量应用服务器地域如何选择&#xff1f;地域就近选择&#xff0c;北方选北京地域、南方选广州地域&#xff0c;华东地区选上海地域。广州上海北京地域有什么区别&#xff1f;哪个好&#xff1f;区别就是城市地理位置不同&#xff0c;其他的差不多&#xff0c;不区分好坏…

全球首位AI软件工程师诞生,未来程序员会被取代吗?

今天早上看到一条消息&#xff0c;Cognition发布了世界首位AI程序员Devin&#xff0c;直接把我惊呆了&#xff0c;难道程序员是真要失业了吗&#xff1f; 全球首位AI软件工程师一亮相&#xff0c;直接引爆整个互联网圈。只需要一句指令&#xff0c;Devin就可以通过使用自己的s…

QT----基于QT的人脸考勤系统(未完成)

目录 1 编译opencv库1.1 下载源代码1.2 qt编译opencv1.3 执行Cmake一直卡着data: Download: face_landmark_model.dat 2 编译SeetaFace2代码2.1 遇到报错By not providing "FindOpenCV.cmake" in CMAKE_MODULE_PATH this project has2.2遇到报错Model missing 3 测试…

Android 13 源码编译及报错修复

下载AOSP指定分支 repo init -u git://aosp../platform/manifest -b android-13.0.0_r83 同步代码到本地 repo sync -c 初始化编译环境, 选择构建目标 source build/envsetup.sh lunch 选择需要构建的目标&#xff0c;此处以aosp_arm64-eng为例 进行固件编译 make -j12 期间编译…

蓝桥杯 填空 卡片

蓝桥杯 填空题 卡片 解题思路&#xff1a; 我们只需要消耗完卡片的个数即可。 代码示例&#xff1a; #include<bits/stdc.h> using namespace std; int a[10]; bool isEnd(){for(int i0;i<10;i){if(a[i]-1)return false;}return true; } bool getN(int x){while(x){i…

第13届软件与计算技术国际会议(ICSCT 2024)即将召开!

2024年第13届软件与计算技术国际会议(ICSCT 2024)将于7月26-28日在越南岘港召开。本次大会由维新大学主办&#xff0c;岘港大学、胡志明市科技大学联合协办。ICSCT 2024旨在为来自业界和学术界的研究人员、学者和专业人士提供一个论坛&#xff0c;分享他们最新的研究成果。欢迎…

Docker 中 MySQL 的部署与管理

目录 一、Docker 中部署 MySQL1.1 部署 MySQL1.2 进入容器并创建数据库1.3 Navicat 可视化工具连接 二、可能存在的问题2.1 1130 - Host ‘172.17.0.1‘ is not allowed to connect to this MySQL server 参考资料 一、Docker 中部署 MySQL 1.1 部署 MySQL 首先&#xff0c;从…

详解Python中open()函数指定文件打开方式的用法

当我们用open()函数去打开文件的时候&#xff0c;有好几种打开的模式。 r->只读 w->只写&#xff0c;文件已存在则清空&#xff0c;不存在则创建。 a->追加&#xff0c;写到文件末尾 b->二进制模式,比如打开图像、音频、word文件。 ->更新(可读可写) 这个带号…

如何使用vue定义组件之——父组件调用子组件

首先&#xff0c;我们需要创建两个组件模板template&#xff1a; <template id"father"><div><h3>我是父组件</h3><h3>访问自己的数据:</h3><h3>{{ msg }}</h3></div></template><template id"…

@RequestParam、@PathVariable、@RequestBody

1、中文翻译 RequestParam-请求参数、PathVariable-路径变量、RequestBody请求体 2、作用&#xff1a; Controller中获取前端传递的参数 3、从注解本身角度分析 3.1、PathVariable&#xff1a;路径变量 通过 PathVariable 可以将URL中占位符参数{xxx}绑定到处理器类的方法形…

论文阅读——Vision Transformer with Deformable Attention

Vision Transformer with Deformable Attention 多头自注意力公式化为&#xff1a; 第l层transformer模块公式化为&#xff1a; 在Transformer模型中简单地实现DCN是一个non-trivial的问题。在DCN中&#xff0c;特征图上的每个元素都单独学习其偏移&#xff0c;其中HWC特征图上…

2024年【危险化学品生产单位安全生产管理人员】复审考试及危险化学品生产单位安全生产管理人员模拟试题

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 危险化学品生产单位安全生产管理人员复审考试根据新危险化学品生产单位安全生产管理人员考试大纲要求&#xff0c;安全生产模拟考试一点通将危险化学品生产单位安全生产管理人员模拟考试试题进行汇编&#xff0c;组成…

Antd中s-table组件某字段进行排序

Antd中s-table组件某字段进行排序 提前说明&#xff0c;s-table组件包含分页等功能 <s-tableref"table":columns"columns":data"loadData"bordered:row-key"(record) > record.id"></s-table>而其中loadData为获取表数…

【深度学习实践】HaGRID,YOLOv5,手势识别项目,目标检测实践项目

文章目录 数据集介绍下载数据集将数据集转换为yolo绘制几张图片看看数据样子思考类别是否转换下载yolov5修改数据集样式以符合yolov5创建 dataset.yaml训练参数开始训练训练分析推理模型转换onnx重训一个yolov5s后记 数据集介绍 https://github.com/hukenovs/hagrid HaGRID&a…

ElementUI Message 消息提示,多个显示被覆盖的问题

现象截图&#xff1a; 代码&#xff1a;主要是在this.$message 方法外层加上 setTimeout 方法 <script> export default {name: "HelloWorld",props: {msg: String,},methods: {showMessage() {for (let i 0; i < 10; i) {setTimeout(() > {this.$mess…

windows ffmpeg 编译环境搭建

编译ffmpeg https://www.msys2.org/ https://www.ffmpeg.org/platform.html#Microsoft-Visual-C_002b_002b-or-Intel-C_002b_002b-Compiler-for-Windows 1.安装msys2 2.安装yasm或者nasm 打开VC 本地环境命令行 唤醒msys2界面 配置编译环境变量参数 export PATH"/d/vs…

Net Core 使用Mongodb操作文件(上传,下载)

Net Core 使用Mongodb操作文件&#xff08;上传&#xff0c;下载&#xff09; 1.Mongodb GridFS 文件操作帮助类。 GridFS 介绍 https://baike.baidu.com/item/GridFS/6342715?fraladdin DLL源码&#xff1a;https://gitee.com/chenjianhua1985/mongodb-client-encapsulati…

Vue3基础速成

Vue常用语法 {{ }} 变量、表达式渲染 {{ }} 用于输出对象属性和函数返回值 <div id"hello-vue" class"demo">{{ message }} </div><script>const HelloVueApp {data() {return {message: Hello Vue!!}}}Vue.createApp(HelloVueApp).…

码头船只出行和货柜管理系统的设计与实现

针对于码头船只货柜信息管理方面的不规范&#xff0c;容错率低&#xff0c;管理人员处理数据费工费时&#xff0c;采用新开发的码头船只货柜管理系统可以从根源上规范整个数据处理流程。 码头船只货柜管理系统能够实现货柜管理&#xff0c;路线管理&#xff0c;新闻管理&#…