本文首发于公众号【看点代码再上班】,欢迎围观,第一时间获取最新文章。
原文:还傻傻搞不懂MySQL事务隔离级别么(图文并茂,保证你懂!)
大家好,我是tin,这是我的第25篇原创文章
上一篇文章已经讲了事务的四大特征,如果不记得了可以再看一下: 昨天去银行转钱,最后怒失300万 。文章中提到,事务是在MySQL引擎中实现的,且我们用得最多的支持事务的引擎是InnoDB。
本文所说的 MySQL 事务也都是指在 InnoDB 引擎下的事务。话不多说,先上一个目录:
-
一、并行事务会有什么问题?
1.1 脏写
-
1.2 脏读
-
1.3 不可重复读
-
1.4 幻读
1.5 区别
二、事务隔离级别
2.1 读未提交
2.2 读已提交
2.3 可重复读
2.4 串行化
三、结语
一、并行事务会有什么问题?
在讲事务隔离级别之前,我们先想一下,如果有多个事务并行执行,MySQL数据最终会有什么问题?
可以说,事务的存在都是为了防止并发问题,我们的MySQL数据库可以同时接受多个client连接,即支持同时多个事务处理,当多个事务同时进行的时候,可能会出现以下等问题:
脏写(dirty write)
脏读(dirty read)
不可重复读(non-repeatable read)
幻读(phantom read)
1.1 脏写
脏写 (dirty write),直白说就是两个事务同时更新一行数据,事务A回滚把事务B的值覆盖了,实质就是两个未提交的事务互相影响。
举个例子, 现在有一张表:
CREATE TABLE `bank_balance` (
`id` int NOT NULL AUTO_INCREMENT,
`user_name` varchar(45) NOT NULL COMMENT '用户名',
`balance` int NOT NULL DEFAULT '0' COMMENT '余额,单位:人民币分,比如100表示人民币1元,默认是0',
`wealth` tinyint NOT NULL DEFAULT '0' COMMENT '富有程度,0:贫穷,1:富有',
PRIMARY KEY (`id`),
UNIQUE KEY `idx_bank_balance_user_name` (`user_name`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
表中有一行id=3 且 user_name=Tom的记录:
mysql> select id,user_name,balance from bank_balance where user_name = 'Tom';
+----+-----------+---------+
| id | user_name | balance |
+----+-----------+---------+
| 3 | Tom | 100 |
+----+-----------+---------+
1 row in set (0.00 sec)
现在有两个事务,事务A和事务B,事务A是给Tom账户余额加100,事务B是给Tom账户余额加200。
在①处,事务A得到的余额是200,事务B得到的余额是300,如果事务B是后更新,那么就覆盖了事务A的值。
在②处,事务 A 和事务B都没有提交的情况下,它们随时都有可能发生回滚,如上图这种情况事务 A 发生了回滚,然后事务B再提交,那么对于事务 B 看到的场景而言,就是自己明明更新了,结果值却还是旧值,这就是 脏写 。
1.2 脏读
脏读(dirty read),指的是读到了其他事务未提交的数据,未提交意味着可能会回滚,也就是可能最终不会持久化到数据库中。其他事务读到了不会持久化的数据,这就是脏读。
比如下图,如果事务A在①处发生回滚,那么事务B在②处使用的Tom余额值200就是一个过期值,这种就是典型的脏读现象。
1.3 不可重复读
不可重复读(non-repeatable read),指的是在同一事务内,相同数据在不同的时刻被读到了不一样的值,它和脏读不一样,脏读是指读取到了其他事务未提交的数据,而不可重复读表示读到了其他事务修改并提交后的值。
比如有两个事务,事务A和事务B,事务A查询Tom账户余额是100,事务B查询Tom账户余额也是100。
接下来,事务A把Tom账户余额更新为200,并提交事务。
当事务B继续读取Tom账户余额的时候,发现Tom账户余额是200了,和之前读取到的不一致,对于事务B而言,这种一个事务内多次读取得到不一样值的现象就称为不可重复读现象。
1.4 幻读
幻读(phantom read),主要是是针对数据插入(INSERT)和删除(DELETE)操作来说的。
最经典的是插入的情况。假如现在有两个事务,事务A和事务B。事务A对某些行的内容作了更改,但是还未提交。
比如现在余额表中余额大于0的账户有2条,分别是小克和Tom,他们的富有程度都是贫穷:
mysql> select *from bank_balance where balance > 0;
+----+-----------+-----------+--------+
| id | user_name | balance | wealth |
+----+-----------+-----------+--------+
| 2 | 小克 | 300000000 | 0 |
| 3 | Tom | 100 | 0 |
+----+-----------+-----------+--------+
然后,接到上级命令,要把所有账户余额大于0的用户全部标识为富有,启动事务A完成这项任务,SQL如下:
update bank_balance set wealth = 1 where balance > 0;
SQL语句只是执行了,但是未提交。
紧接着,事务B插入了一条余额大于0的记录行(富有程度默认为贫穷),并且在事务A提交之前先提交了,SQL如下:
INSERT INTO `bank_balance` (`id`, `user_name`, `balance`) VALUES ('4', 'Eric', '500');
在这之后,如果事务A再发起相同条件的查询,会发现刚刚的更改对于某些数据未起作用(有些记录未被标识为富有),而且数据行比原来还多了!
这对于事务A而言,感觉出现了幻觉一样,这就是幻读现象。
1.5 区别
读到这里,可能有些小伙伴就懵了,从脏读到幻读,感觉它们都一样的呀?其实,它们有实质性的区别:
1、脏读重在指一个事务读到了其他事务未提交的数据。
2、不可重复读主要在于一个事务中多次读到同一条数据,但前后读到的结果不一样,这是因为其他事务对数据进行修改并提交导致。
3、幻读则是因为被其他事务插入或者删除的数据影响,一个事务内同样条件的数据记录变多或者变少了。
二、事务隔离级别
前面已经讲完并行事务可能出现的问题,具体表象就是脏写,脏读,不可重复读,幻读。
针对这些问题,SQL定了一套标准,通过 隔离 来规避,且不同级别的隔离可以规避不同严重程度的事务问题,下面,我们一起看下SQL事务 隔离级别 都有哪些:
1. 读未提交(READ UNCOMMITTED),指一个事务还没提交,它做的修改就能被其他事务看到。
2. 读提交(READ COMMITTED),一个事务做的修改,只有提交之后,其他事务才能看到。
3. 可重复读(REPEATABLE READ),在整个事务过程中看到的数据,自始至终都是一致的。
4. 串行化(SERIALIZABLE),每个读写操作都会加锁,多个事务要访问同一条记录时,必须要进行排队,优先级低的事务必须等优先级高的事务完成以后才能进行。
从1到4,隔离级别依次变高,当然,性能也依次变差。那么这些隔离级别究竟都能防止哪些问题呢?来看一个表格:
只有串行化的隔离级别解决了全部这 3 个问题,其他的 3 个隔离级别都有一定的缺陷。
但,MySQL InnoDB引擎默认的隔离级别是可重复读(RR) 。
为什么MySQL没有使用串行化这个级别?是不是意味着我们日常使用MySQL会有可能存在幻读的问题?
非也! 隔离级别越高代价也是越高的 ,且性能也越差。从性能上来说,当然是隔离级别越低越好。
至于隔离级别是RR(可重复读)下的MySQL怎么避免幻读问题,InnoDB引擎有它自己的想法,以后单独抽一讲来说啦~
我们再来看一张图,理解不同隔离级别下读取到的数据是怎么样的:
有两个事务,事务A和事务B,同时操作(查询或者给Tom余额加100),事务B在事务A提交前更新了Tom的余额,并且事务B在事务A前提交。
1. 读未提交隔离级别 下,事务 B 修改余额后,事务 A 能够马上看见,即使事务B还未提交,所以事务 A 中余额 R1 查询的值是 200,余额 R2、R3 也是 200.
2. 读提交隔离级别 下,事务 B 修改余额后,只有事务B提交后事务A才能看见,所以事务A中余额R1查询在提交前,查的值是100,余额R2和余额R3都是在事务B提交后,查询得到的值都是200。
3. 可重复读隔离级别 下,事务A在提交前自始至终查到的值都必须一样,所以,余额R1、R2都是100,当事务A提交后再查询(其实是新事务)就能查到新的值,所以R3是200。
4. 串行化隔离级别 下,MySQL会给记录行以及记录行之间的'空行'加锁,如果是A事务先获得锁,那么B事务必须等到A事务提交以后才能更新数据。
比如上图,如果事务A查询Tom余额的SQL条件是'where user_name = "Tom"', user_name有唯一索引,所以只会给Tom账户这一行数据加共享锁 。
当B事务要去更新Tom的账户余额时,是获取不到锁的, 必须等待直至事务A完全提交 。
所以以上R1、R2查询得到的值都是100(这个时候事务B在排队等待),事务A提交以后, 事务B就可以更新值并提交了,R3是在事务B提交之后查询,所以是200。
好啦,今天就先讲到这里啦,或许大家一定还会有疑问:
比如
"以上这些隔离级别是如何实现的呢?"
"可重复读是怎么实现的?"
"读提交是怎么实现的?"
"MySQL默认的RR隔离级别是如何规避幻读的?"等等。
我都会一一讲完的,请关注我,等待我下一篇博文吧。
三、结语
我是tin,一个在努力让自己变得更优秀的普通工程师。自己阅历有限、学识浅薄,如有发现文章不妥之处,非常欢迎加我提出,我一定细心推敲并加以修改。
看到这里请安排个“三连”(分享、点赞、在看)再走吧,坚持创作不容易,你的正反馈是我坚持输出的最强动力,谢谢!