尼恩说在前面
在40岁老架构师 尼恩的读者交流群(50+)中,最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试资格,遇到很多很重要的面试题:
- 谈谈:mysql 事务隔离的底层原理?
- 谈谈:RR级隔离是如何解决幻读?
- 谈谈:RR级隔离如何解决幻读?什么情况下不能解决幻读?
- 谈谈:说说mysql 事务隔离级别的底层原理?
- …
最近有小伙伴在面试 京东,又遇到了RR级隔离 与事务ACID 相关的面试题。
小伙伴懵了,因为系统的回答清楚,支支吾吾的说了几句,面试官不满意,面试挂了。
所以,尼恩给大家做一下系统化、体系化的梳理,使得大家内力猛增,可以充分展示一下大家雄厚的 “技术肌肉”,让面试官爱到 “不能自已、口水直流”,然后实现”offer直提”。
当然,这道面试题,以及参考答案,也会收入咱们的 《尼恩Java面试宝典PDF》V171版本,供后面的小伙伴参考,提升大家的 3高 架构、设计、开发水平。
最新《尼恩 架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》的PDF,请关注本公众号【技术自由圈】获取,回复:领电子书
ACID的I 隔离性(Isolation)如何实现?
隔离性是指,事务内部的操作与其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
隔离性与原子性、持久性不同,
-
原子性、持久性等侧重于研究事务本身不同,
-
隔离性呢,隔离性研究的是不同事务之间的相互影响,
内事不决 ,问 原子性、持久性
外事不决 ,问 隔离性
并发事务三大问题:脏读、不可重复读和幻读
首先来看并发情况下,读操作可能存在的三类问题:
(1)脏读:一个事务读取到另一个尚未提交事务的修改。
尼恩解读:脏读是 读到其他事务没有提交的数据,注意,这数据还没有被其他事务提交,彻底的脏数据。
脏读 指的是 当前事务 和 其他事务没有做任何 隔离 。
当前事务(A)中可以读到其他事务(B)未提交的数据(脏数据),这种现象是脏读。
脏读举例如下:
(2)不可重复读:多次读取同一记录,数据的不同。
在同一个事务内,多次读取同一数据返回的结果有所不同。
尼恩解读:幻读是 记录里边的数据变了, 但是,读到的是其他事务已经提交的数据。其他事务没有提交的数据,还是被隔离了, 隔离性稍微好点。
数据记录的数量没有, 没有 隔离 其他事务的 更新操作 。
在事务A中先后两次读取同一个数据,两次读取的结果不一样,这种现象称为不可重复读。
脏读与不可重复读的区别在于:前者读到的是其他事务未提交的数据,后者读到的是其他事务已提交的数据。
不可重复读,举例如下:
(3)幻读:多次执行同一个查询,结果集数量的不同。
具体来说,一个事务在执行两次相同的查询时,因为另一个并发事务的插入或删除操作,导致两次查询返回的结果集不同。
尼恩解读:幻读是结果集的层面发生了变化, 数据记录的数量变了, 没有 隔离 其他事务的 插入或删除操作 。
在事务A中按照某个条件先后两次查询数据库,两次查询结果的条数不同,这种现象称为幻读。
不可重复读与幻读的区别可以通俗的理解为:前者是数据变了,后者是数据的行数变了。
幻读举例如下:
以上内容如果不懂,请参考后面的《尼恩Java面试宝典》 配套视频
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
4种事务隔离级别
什么是事务个隔离级别?
事务隔离级别主要定义了事务在并发执行时的行为,特别是它们如何与其他事务交互以及它们如何看到数据库中的更改。
ANSI/ISO SQL标准定义了4中事务隔离级别:
-
未提交读(read uncommitted),
-
提交读(read committed),
-
重复读(repeatable read),
-
串行读(serializable)。
主流数据的默认隔离级别:
- Oracle中默认的事务隔离级别是提交读 (read committed)。
- 对于MySQL的Innodb的默认事务隔离级别是重复读(repeated read)。
MySQL支持四种不同的事务隔离级别,每种级别都有其特定的行为和适用场景。
以下是MySQL的四种事务隔离级别及其描述:
- READ UNCOMMITTED(读取未提交)
- 允许读取尚未提交的数据变更。
- 这是最低的隔离级别,它可能导致脏读、不可重复读和幻读。
- 在这个级别,一个事务可以读取到另一个尚未提交事务的修改,这可能导致数据的不一致性。
- READ COMMITTED(读取已提交)
- 只允许读取并发事务已经提交的数据。
- 这个级别可以防止脏读,但仍可能导致不可重复读和幻读。
- 在这个级别,每个事务只能看到它开始时的数据状态以及它提交时其他事务所做的提交。
- REPEATABLE READ(可重复读取)
- 这是MySQL的默认隔离级别。
- 它确保在同一事务中多次读取同一数据时,看到的是相同的数据版本,即使其他事务在此期间修改了这些数据。
- 尽管可以避免脏读和不可重复读,但在这个级别下仍可能出现幻读(即在一个事务中,两次相同的查询可能会返回不同的结果集,因为其他事务在此期间插入了新的记录)。
- SERIALIZABLE(可串行化)
- 这是最高的隔离级别。
- 它通过强制事务串行执行来避免脏读、不可重复读和幻读。
- 在这个级别,每个事务在执行时都会完全锁定它所访问的数据,从而确保数据的一致性。但这也可能导致性能下降,因为并发事务必须等待其他事务完成才能执行。
选择适当的事务隔离级别需要根据应用的需求和性能考虑进行权衡。隔离级别最高的是“可串行化”,但是性能最低。
在某些情况下,可能需要更高的隔离级别来确保数据的一致性,而在其他情况下,可能需要降低隔离级别以提高性能。
同时,也需要注意不同隔离级别可能带来的并发问题,如脏读、不可重复读和幻读等。
脏读(Dirty Read)特点: 一个事务读取到另一个尚未提交事务的修改。
隔离性:没有任何隔离。
不可重复读(Non-repeatable Read): 在同一个事务内,多次读取同一数据返回的结果有所不同。
隔离性: 隔离性稍微好点, 其他事务未提交的修改数据 被隔离了。 没有 隔离 其他事务的修改操作、 插入或删除操作,数据值的有可能变化 ,数据记录的数量有可能变化。
幻读(Phantom Read): 一个事务在执行两次相同的查询时,因为另一个并发事务的插入或删除操作,导致两次查询返回的结果集不同。
隔离性: 隔离性更好点, 其他事务未提交的修改数据 被隔离了。 没有 隔离 其他事务的 插入或删除操作,数据记录的数量有可能变化。
表1: 隔离级别 并发事务 三大问题之间的关系
为了帮助大家彻底的了解隔离级别与事务问题之间的关联关系,尼恩帮大家梳理一个 表, 彻底的梳理一下,具体如下。
关于具体的解读,请参见视频。
表2: 隔离级别 与 具体数据操作 之间的隔离关系
为了帮助大家彻底的了解隔离级别 与 具体数据操作 之间的隔离关系,尼恩帮大家梳理一个 表, 彻底的梳理一下,具体如下。
关于具体的解读,请参见视频。
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
mysql 如何实现隔离机制的总结?
这里分场景进行 优化,可以 可以分为两个场景:
- 写写隔离:(一个事务)写操作对(另一个事务)写操作的影响:锁机制保证隔离性
- 读写隔离:(一个事务)写操作对(另一个事务)读操作的影响:MVCC+ 读视图,保证隔离性
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
RR隔离级别下是如何防止幻读的?
MVCC
机制主要通过三个组件实现:
隐藏字段
Undo-log
日志ReadView
。
快照读和当前读
- 快照读,就是读取快照数据,即快照生成的那一刻的数据。
在不加锁的情况下,我们使常用的 普通的SELECT语句 就是快照读,如下:
SELECT * FROM USER WHERE …
- 当前读,就是读取最新的数据,要读取最新提交的数据版本。
我们在加锁SELECT语句,或者对数据进行增、删、改都会进行当前读。如下:
SELECT * FROM USER LOCK IN SHARE MODE;
SELECT * FROM USER FOR UPDATE;
INSERT INTO USER VALUES …
DELETE FROM USER WHERE …
UPDATE USER SET …
在MySQL中只有在RR和RC
这两个事务隔离级别下才会使用 快照读。
在RR中,快照会在事务中第一次SELECT语句执行时生成,只有在本事务中对数据进行更改 才会更新快照。
在RC中,每次SELECT都会重新生成一个快照,总是读取最新快照数据。
MVCC undo log版本链
经过前面的分析,对于MVCC多版本并发控制,多版本是通过Undo-log日志
实现。
先来思考如下的问题:
如果T1
事务要查询id=1的一条行数据,此时这条行数据正在被T2
事务修改,那也就代表着这条数据可能存在多个旧版本数据,T1
事务在查询时,应该读这条数据的哪个版本呢?
此时就需要用到ReadView
,用它来做多版本的并发控制,根据查询的时机,来选择一个当前事务可见的旧版本数据读取。
什么是ReadView呢?
当一个事务在尝试读取一条数据时,MVCC
基于当前MySQL
的运行状态生成的快照,也被称之为读视图,即ReadView
,在这个快照中记录着当前所有活跃事务的ID
(活跃事务是指还在执行的事务,即未结束(提交/回滚)的事务)。
ReadView是事务在进行快照读的时候生成的记录快照, 可以帮助我们解决可见性问题的。
ReadView的核心属性
当一个事务启动后,首次执行select
操作时,MVCC
就会生成一个数据库当前的ReadView
,
通常而言,一个事务与一个ReadView
属于一对一的关系(不同隔离级别下也会存在细微差异),ReadView
一般包含4个核心属性:
属性 | 描述 |
---|---|
creator_trx_id | 代表创建当前这个ReadView 的事务ID 。 |
trx_ids | 表示在生成当前ReadView 时,系统内活跃(未提交)的事务ID 列表,它的数据结构为一个List。(注意 :这里的trx_ids中的活跃事务,不包括当前事务自己和已提交的事务,这点非常重要) |
up_limit_id | 活跃的事务列表(trx_ids)中,最小的事务ID ,如果trx_ids为空,则up_limit_id 为 low_limit_id。 |
low_limit_id | 表示在生成当前ReadView 时,系统中要给下一个事务分配的ID值 。(注意 :它并不是目前系统中活跃事务的最大ID,因为MySQL的事务ID是按序递增的,因此当启动一个新的事务时,都会为其分配事务ID,而这个low_limit_id则是整个MySQL中要为下一个事务分配的ID值。) |
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
ReadView的生成规则
在MySQL中只有在RR(可重复读)和RC(读已提交)
这两个事务隔离级别下有效,生成ReadView规则是不同的:
在RR中,
ReadView
会在事务中第一次SELECT
语句执行时生成,只有在本事务中对数据进行更改才会更新快照。在RC中,每次SELECT都会重新生成一个
ReadView
,总是读取最新版本数据。读已提交和可重复读唯一的区别在于:
1.在RC隔离级别下,是每个select都会创建最新的ReadView;
2.而在RR隔离级别下,则是当事务中的第一个select请求才创建ReadView。 除非发生了数据的修改。
幻读的实操演示
查看 Mysql 隔离级别
在 MySQL 中,可以通过查询系统表 information_schema
中的 GLOBAL_VARIABLES
或 SESSION_VARIABLES
表来查看当前的隔离级别。
以下是查看隔离级别的 SQL 语句:
-- 查看全局隔离级别
SELECT @@global.tx_isolation;
-- 查看会话隔离级别
SELECT @@session.tx_isolation;
这两个查询将返回当前 MySQL 服务器配置的全局和会话级别的事务隔离级别。
请注意,
@@global.tx_isolation
显示的是全局设置,它定义了服务器启动时的默认隔离级别。而
@@session.tx_isolation
显示的是当前会话的隔离级别,它可能会覆盖全局设置。
返回的值可能是以下之一:
- READ UNCOMMITTED
- READ COMMITTED
- REPEATABLE READ
- SERIALIZABLE
这些值代表不同的隔离级别,它们决定了在并发环境下,一个事务可能受到其他事务影响的程度。
例如,REPEATABLE READ
是 MySQL 默认的隔离级别,而 SERIALIZABLE
提供了最高的隔离级别,但可能会影响性能。
如果你想查看或更改全局隔离级别,可以使用以下命令:
-- 查看全局隔离级别
SHOW GLOBAL VARIABLES LIKE 'tx_isolation';
-- 设置全局隔离级别
SET GLOBAL tx_isolation = 'REPEATABLE-READ';
要更改会话隔离级别,可以使用:
-- 查看会话隔离级别
SHOW VARIABLES LIKE 'tx_isolation';
-- 设置会话隔离级别
SET SESSION tx_isolation = 'READ-COMMITTED';
在设置隔离级别时,请确保你了解不同隔离级别对事务处理的影响,以及它们如何影响并发性和性能。
查看 Mysql 的事务提交模式
如果要演示 隔离级别,还需要调整一下 Mysql 的事务提交模式。
MYSQL提供两种事务型引擎:Innodb和NDBCluster。
默认采用自动提交模式,执行一条语句自动COMMIT。
要修改Mysql 的事务提交模式, 通过AUTOCOMMIT变量可启用或者禁用自动提交模式:
mysql> SHOW VARIABLES LIKE "AUTOCOMMIT";
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit | ON |
+---------------+-------+
1 row in set (0.00 sec)
mysql> SET AUTOCOMMIT=0
- AUTOCOMMIT=1表示开启默认提交,
- AUTOCOMMIT=0表示关闭默认提交需要手动提交。
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
演示涉及到的表和操作
事务A进行一次查询,之后事务B插入一条数据,事务A进行第二次查询,如果两次查询到的数量不同,就是发生了幻读。
举个例子,假设有一张表t_user,表中有字段age,没有索引。
事务A | 事务B | |
---|---|---|
t1 | begin; | begin; |
t2 | select * from t_user where age >20 and age<30; | |
t3 | insert into t_user (id, name,age) values (5, “技术自由圈——塔尖技术社群”,25); | |
t4 | commit; | |
t5 | select * from t_user where age >20 and age<30; | |
t6 | commit; |
select 执行 两次,如果记录数量不一致性,则说明发生了幻读。
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
快照读场景
快照读场景下,因为每次都会从快照中读取,所以每次从快照中查询到的数目都一样的。
注意:
1.在RC隔离级别下,是每个select都会创建最新的ReadView; 所以其实会产生幻读。这也是没有隔离 数据修改的原因。
2.而在RR隔离级别下,则是当事务中的第一个select请求才创建ReadView。 所以其实不会产生幻读
事务A | 事务B | |
---|---|---|
t1 | begin; | begin; |
t2 | select * from t_user where age >20 and age<30; | |
t3 | insert into t_user (id, name,age) values (5, “技术自由圈——塔尖技术社群”,25); | |
t4 | commit; | |
t5 | select * from t_user where age >20 and age<30; | |
t6 | commit; |
rr 场景:
-
事务A中,t2和t5 查询的是相同的快照,所以读取到的是相同的条数,
-
事务B中的t3插入数据成功,但是不会影响到事务A的快照,所以不会产生幻读。
rc场景:
- 事务B中的t3插入数据成功,但是会影响到事务A的快照,所以 会产生幻读。
- 大家可以自己实验
当前读场景,不会幻读
- 当前读,就是读取最新的数据,要读取最新提交的数据版本。
我们在加锁SELECT语句,或者对数据进行增、删、改都会进行当前读。如下:
SELECT * FROM USER LOCK IN SHARE MODE;
SELECT * FROM USER FOR UPDATE;
INSERT INTO USER VALUES …
DELETE FROM USER WHERE …
UPDATE USER SET …
事务A | 事务B | |
---|---|---|
t1 | begin; | begin; |
t2 | select * from t_user where age >20 and age<30 for update; | |
t3 | insert into t_user (id, name,age) values (5, “技术自由圈——塔尖技术社群”,25); | |
t4 | commit; | |
t5 | select * from t_user where age >20 and age<30 for update; | |
t6 | commit; |
当前读场景下,可能会产生临界锁,所以会阻塞其他事务的插入操作,从而避免幻读。
事务A中,t2查询的时候,会产生临界锁。
事务B插入的时候,因为临界锁,会一直等待事务A结束后才能插入数据。
所以,t2和t5查询的条数是相同的,不会产生幻读。
本质上,也就变成了 写-写隔离
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
什么情况下,快照读场景,可能产生幻读?(例外的场景演示)
在MySQL中只有在RR和RC
这两个事务隔离级别下才会使用 快照读。
在RR中,快照会在事务中第一次SELECT语句执行时生成,只有在本事务中对数据进行更改时, 才会生成undo log,并且更新read view。
在RC中,每次SELECT都会重新生成一个快照,总是读取最新快照数据。
事务A | 事务B | |
---|---|---|
t1 | begin; | begin; |
t2 | select * from t_user where age >20 and age<30; | |
t3 | insert into t_user (id, name,age) values (5, “技术自由圈——塔尖技术社群”,25); | |
t4 | commit; | |
t5 | update t_user set name = ‘技术自由圈’ where id= 5 | |
t6 | select * from t_user where age >20 and age<30; | |
t7 | commit; |
对于「读已提交」和「可重复读」两种隔离级别的事务来说,它们都是通过 Read View 来实现的。
它们的区别在于创建 Read View 的时机不同:
RC「读已提交」隔离级别是在每个 select 查询时都会生成一个新的 Read View。
这意味着,如果在事务期间的多次读取同一条数据,前后两次读的数据可能会出现不一致的情况,因为可能这期间另外一个事务修改了该记录,并提交了事务。
RR「可重复读」隔离级别是在启动事务时生成一个 Read View,然后在整个事务期间都使用这个 Read View。
这样就保证了在事务期间读到的数据都是事务启动前的记录。
尼恩提示: 以上内容比较复杂,后面会在《尼恩Java面试宝典》配套视频中,进行详细解读。
尼恩架构团队的塔尖 sql 面试题
- sql查询语句的执行流程:
网易面试:说说MySQL一条SQL语句的执行过程?
- 什么是回表?什么是 索引下推 ?
贝壳面试:什么是回表?什么是 索引下推 ?
- mysql 索引失效
美团面试:mysql 索引失效?怎么解决?(重点知识,建议收藏,读10遍+)
- MVCC
MVCC学习圣经:一文穿透MySQL MVCC,吊打面试官
- binlog、redolog、undo log
美团面试:binlog、redolog、undo log底层原理是啥?分别实现ACID哪个特性?(尼恩图解,史上最全)
另外,尼恩也给一线企业提供 《DDD 的架构落地》企业内部培训,目前给不少企业做过内部的咨询和培训,效果非常好。
尼恩技术圣经系列PDF
- 《NIO圣经:一次穿透NIO、Selector、Epoll底层原理》
- 《Docker圣经:大白话说Docker底层原理,6W字实现Docker自由》
- 《K8S学习圣经:大白话说K8S底层原理,14W字实现K8S自由》
- 《SpringCloud Alibaba 学习圣经,10万字实现SpringCloud 自由》
- 《大数据HBase学习圣经:一本书实现HBase学习自由》
- 《大数据Flink学习圣经:一本书实现大数据Flink自由》
- 《响应式圣经:10W字,实现Spring响应式编程自由》
- 《Go学习圣经:Go语言实现高并发CRUD业务开发》
……完整版尼恩技术圣经PDF集群,请找尼恩领取
《尼恩 架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》PDF,请到下面公号【技术自由圈】取↓↓↓