MySQL高级第十五篇:MVCC多版本并发控制原理剖析
- 一、什么是MVCC?
- 二、快照读与当前读?
- 1. 快照读
- 2. 当前读
- 三、MVCC实现原理(ReadView)
- 1. 隐藏字段
- 2. Read View
- 3. 思路设计
- 4. ReadView使用规则
- 5. MVCC整体操作流程
- 四、总结
一、什么是MVCC?
- MVCC(Multiversion Concurrency Control)多版本并发控制。
- 就是通过数据行的多个版本管理来实现数据库的并发控制。
- 这项技术使得在InnoDB的事务隔离级别下执行一致性读操作有了保证。
- 换句话说,就是为了查询一些正在被另一个事务更新的行,并且可以看到它们被更新之前的值,这样在做查询的时候就不用等待另一个事务释放锁。
二、快照读与当前读?
- MVCC在MySQL lnnoDB中的实现主要是为了
提高数据库并发性能
,用更好的方式去处理读–写冲突,做到即使有读写冲突时,也能做到不加锁,非阻塞并发读。 - 而这个读指的就是快照读,而非当前读。当前读实际上是一种加锁的操作,是悲观锁的实现,而MVCC本质是采用乐观锁思想的一种方式。
1. 快照读
- 快照读又叫一致性读,读取的是快照数据。
- 不加锁的简单的SELECT都属于快照读,即不加锁的非阻塞读
- 之所以出现快照读,是基于提高并发性能的考虑,快照读的实现是基于MVCC,它在很多情况下,避免了加
锁操作,降低了开销。 - 既然是基于多版本,那么快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本。
- 快照读的前提是隔离级别不是串行级别,串行级别下的快照读会退化成当前读。
2. 当前读
- 当前读读取的是记录的最新版本,最新数据,读取时还要保证其他并发事务不能修改。
- 当前记录会对读取的记录进行加锁。加锁的SELECT,或者对数据进行增删改都会进行当前读。
在以前学习隔离级别时,对于SQL标准中,可重复读 解决了脏读,不可重复读的问题,没有解决幻读。但是在MySQL中,因为MVCC,读的时候其实读的是快照,所以也不会出现幻读。
三、MVCC实现原理(ReadView)
MVCC 的实现依赖于:隐藏字段,Undo Log、Read View
1. 隐藏字段
- 对于使用InnoDB存储引擎的表来说,它的聚簇索引记录中都包含两个必要的隐藏列。
trx_id
:每次一个事务对某条聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id隐藏列。roll_pointer
:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏
列就相当于一个指针,可以通过它来找到该记录修改前的信息。(每次对记录进行改动,都会记录一条undo日志,每条undo日志也都有一个roll_pointer属性,可以将这些undo日志都连起来,串成一个链表,就是版本链)
insert undo 只在事物回滚时起作用,当事物提交后,该类型的undo日志就没有用了,就会被系统回收。
2. Read View
在MVCC机制中,多个事务对同一个行记录进行更新会产生多个历史快照,这些历史快照保存在Undo Log里。如果一个事务想要查询这个行记录,需要读取哪个版本的行记录,就需要用到ReadView了,它帮我们解决了行的可见性问题。
ReadView就是一个事务在使用MVCC机制进行快照读操作时产生的读视图。当事务启动时,会生成数据库系统当前的一个快照,InnoDB为每个事务构造了一个数组,用来记录并维护系统当前活跃事务的ID
(“活跃”指的就是,启动了但还没提交)。
3. 思路设计
使用 READ UNCOMMITTED 隔离级别的事务,由于可以读到未提交事务修改过的记录,所以直接读取记录的最新版本就好了。
使用 SERIALIZABLE 隔离级别的事务,InnoDB规定使用加锁的方式来访问记录。
所以,以上两个隔离级别READ UNCOMMITTED、SERIALIZABLE是用不着MVCC的。
使用 READ COMMITTED 和 REPEATABLE READ 隔离级别的事务,都必须保证读到已经提交了的事务修改过的记录
,他俩就用到了MVCC机制。
假如另一个事务已经修改了记录但是尚未提交,是不能直接读取最新版本的记录的,核心问题就是需要判断
一下版本链中的哪个版本是当前事务可见的,这是ReadView要解决的主要问题。
- ReadView中主要的参数:
creator_trx_id
:创建这个ReadView的事物IDtrx_ids
:创建ReadView时当前系统的活跃的读写事物列表up_limit_id
:活跃事物中最小的IDlow_limit_id
:已提交事物最大的事物ID(1,2,3事物,1、2未提交3已提交,最大事物ID为3+1=4)
4. ReadView使用规则
- 如果被访问版本的trx_id属性值与ReadView中的creator_trx_id值相同,意味着当前事务在访问它自己修改
过的记录,所以该版本可以被当前事务访问。 - 如果被访问版本的trx_id属性值小于ReadView中的up_limit_id值,表明生成该版本的事务在当前事务生成
ReadView前已经提交,所以该版本可以被当前事务访问。 - 如果被访问版本的trx_id属性值大于或等于ReadView中的low_limit_id值,表明生成该版本的事务在当前事
务生成ReadView后才开启,所以该版本不可以被当前事务访问。 - 如果被访问版本的trx_id属性值在ReadView的up_limit_id和low_limit_id之间,那就需要判断一下trx_id
属性值是不是在trx_ids列表中。- 如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问。
- 如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问。
5. MVCC整体操作流程
比如现在执行一条查询语句:
- 1.首先获取事务自己的版本号,也就是事务ID;
- 2.获取ReadView;
- 3.查询得到的数据,然后与ReadView
- 4.中的事务版本号进行比较;
- 5.如果不符合ReadView规则,就需要从Undo Log中获取历史快照(顺着版本链向下找,如果直到最后一个版本还不可见的话,就意味着这条记录对该事物完全不可见,查询结果就不包含该记录);
- 6.最后返回符合规则的数据。
隔离级别为读已提交时,一个事物每次select都会重新获取一次ReadView
隔离级别为可重复读时,一个事物只在第一次select时获取一次ReadView
四、总结
- 本篇介绍了MVCC在READ COMMITTD、REPEATABLE READ这两种隔离级别的事务在执行快照读操作时访问记录的版本链的过程。这样使不同事务的读–写、写–读操作并发执行,从而提升系统性能。
- 核心点在于ReadView的原理,READ COMMITTD、REPEATABLE READ这两个隔离级别的一个很大不同就是生成ReadView的时机不同:
- READ COMMITTD在每一次进行普通SELECT操作前都会生成一个ReadView
- REPEATABLE READ只在第一次进行普通SELECT操作前生成一个ReadView,之后的查询操作都重复使用这个ReadView就好了。
- 通过MVCC我们可以解决:
- 1.
读写之间阻塞的问题
。通过MVCC可以让读写互相不阻塞,即读不阻塞写,写不阻塞读,这样就可以提升事务并发处理能力。 - 2.
降低了死锁的概率
。这是因为MVCC采用了乐观锁的方式,读取数据时并不需要加锁,对于写操作,也只锁定必要的行。 - 3.
解决快照读的问题
。当我们查询数据库在某个时间点的快照时,只能看到这个时间点之前事务提交更新的结果,而不能看到这个时间点之后事务提交的更新结果。
- 1.