事务并发可能引发的问题
MySQL 是一个客户端/服务器架构的软件,对于同一个服务器来说,可以有多个客户端与之连接,每个客户端与服务器连接后,可以称为一个会话(Session)。每个客户端都可以在自己的会话中向服务器发出请求语句,一个请求语句可能是某个事务的一部分,也就是说,服务器可能同时处理多个事务。
1. 脏读 (Dirty Read)
脏读是指一个事务读取到了另一个事务修改但未提交的数据。
- 在事务 A 执行过程中,事务 A 对数据资源进行了修改,事务 B 读取了事务 A 修改后的数据。
- 如果事务 A 没有提交,而是回滚了(Rollback),则事务 B 读取的数据就是脏数据。
这种读取到另一个事务未提交的数据的现象就是脏读。
2. 不可重复读 (Non-repeatable Read)
不可重复读指的是在同一个事务中,两次读取同一记录时,结果不一致。
事务 B 读取了两次数据资源,在这两次读取的过程中,事务 A 修改了数据,导致事务 B 在这两次读取出来的数据不一致。
3. 幻读 (Phantom Read)
幻读是在事务执行过程中,另一个事务向事务正在读取的记录集中插入了新记录,导致前后读取结果不一致。
事务 B 前后两次读取同一个范围的数据,在两次读取的过程中,事务 A 新增了数据,导致事务 B 后一次读取到前一次查询没有看到的行。幻读强调读取到了之前未存在的记录。
什么是 MVCC?
MVCC (Multi-Version Concurrency Control),基于多版本的并发控制协议,是乐观锁的一种实现方式。它避免了许多加锁操作,降低了开销。MVCC 通过创建快照,允许多个事务并发读取不同版本的数据,从而实现读不加锁,读写不冲突,极大地提升了系统的并发性能。
InnoDB 支持的四种事务隔离级别及其区别
事务并发执行过程中可能遇到的一些问题按照严重性排序为:脏读 > 不可重复读 > 幻读。SQL 标准设立了四个隔离级别:
READ UNCOMMITTED:未提交读,可能发生脏读、不可重复读和幻读问题。
READ COMMITTED:已提交读,可能发生不可重复读和幻读问题,不会发生脏读问题。
REPEATABLE READ:可重复读,可能发生幻读问题,不会发生脏读和不可重复读问题。
SERIALIZABLE:可串行化,各种问题都不会发生。
MySQL 默认隔离级别为 REPEATABLE READ,可手动修改。查看当前会话默认的隔离级别:
SHOW VARIABLES LIKE 'transaction_isolation';
或
SELECT @@transaction_isolation;
MVCC 的底层实现原理
MVCC 依赖于记录中的隐式字段、undo 日志和 Read View 来实现。每行记录中除了自定义字段外,还有隐式定义的 DB_TRX_ID
、DB_ROLL_PTR
和 DB_ROW_ID
等字段。
DB_TRX_ID 是最近修改该记录的事务 ID。
DB_ROLL_PTR 是回滚指针,指向该记录的上一个版本。
不同事务对同一记录的修改会形成版本链。事务进行快照读时会生成一个 Read View,记录并维护系统当前活跃事务的 ID。RC 和 RR 级别下 Read View 生成时机不同,导致两者快照读结果不同。
版本链示例:
创建演示表并插入数据:
CREATE TABLE teacher (
number INT,
name VARCHAR(100),
domain VARCHAR(100),
PRIMARY KEY (number)
) Engine=InnoDB CHARSET=utf8;
INSERT INTO teacher