大厂最爱问的MVCC，到底是个啥？

引言

多版本并发控制（MVCC）是一种用于提高数据库并发性能的技术，尤其在处理高并发读写操作时极为有效。MVCC通过维护数据的多个版本来避免读写冲突，使得读操作无需阻塞写操作，写操作也不会影响读操作。下面，我们具体讲解MySQL中InnoDB存储引擎对MVCC的实现原理。

MySQL

MVCC 的基本概念

MVCC（Multi-Version Concurrency Control）可以看作是行级锁的一种改进，主要通过保存数据在不同时间点的多个版本来实现数据的并发访问。MVCC 常用于实现乐观锁定策略，通过版本号控制数据的一致性，避免了因锁导致的性能瓶颈。

不知道大家是否想过这样一个问题：在日常操作中，为什么读写操作可以互不阻塞？

在MVCC技术出现之前，为了确保在特定隔离级别下，多个事务之间不发生数据异常，需要通过加锁来控制并发。

例如，当事务A正在读取一行数据时，其他事务不能对这行数据进行修改，因为这可能导致事务A读取到不一致的数据。

MVCC的核心优势就在于解决了读写操作之间的阻塞问题，从而显著提高了事务的并发性。接下来，我们通过一个例子来逐步学习MySQL中MVCC的实现。

我们来看图1中的这个例子；

在Session1中对某条记录进行了修改但尚未提交时，此时在Session2中执行查询，返回的记录会是什么呢？
而当Session1提交后，session2再次查询时结果又会如何变化呢？

要回答这个问题，关键在于事务的隔离级别，不同隔离级别下的行为如下：

READ-UNCOMMITTED 隔离级别：在session 1提交前后，session 2查询到的都是修改后的结果，即column= lisi。
READ-COMMITTED 隔离级别：在session 1提交前，session 2查询到的仍是原始数据column= zhangsan

，但在提交后，查询结果变为column= lisi。

REPEATABLE-READ 和 SERIALIZABLE 隔离级别：在session 1提交前后，session 2查询到的始终是修改前的结果column= zhangsan。

以下是MySQL 5.7和MySQL 8.0中查询和修改数据库隔离级别语句的对比表格：

操作	MySQL 5.7	MySQL 8.0
查询当前会话隔离级别	SELECT @@tx_isolation; 或 SHOW VARIABLES LIKE ‘transaction_isolation’;	SELECT @@transaction_isolation; 或 SHOW VARIABLES LIKE ‘transaction_isolation’;
查询全局隔离级别	SELECT @@global.tx_isolation; 或 SHOW GLOBAL VARIABLES LIKE ‘transaction_isolation’;	SELECT @@global.transaction_isolation; 或 SHOW GLOBAL VARIABLES LIKE ‘transaction_isolation’;
修改当前会话隔离级别	SET SESSION TRANSACTION ISOLATION LEVEL 隔离级别;	SET SESSION TRANSACTION ISOLATION LEVEL 隔离级别;
修改全局隔离级别	SET GLOBAL TRANSACTION ISOLATION LEVEL 隔离级别;	SET GLOBAL TRANSACTION ISOLATION LEVEL 隔离级别;

其中，隔离级别可以是以下几种之一：

READ UNCOMMITTED
READ COMMITTED
REPEATABLE READ（MySQL默认）
SERIALIZABLE

在这里我们暂且不讨论数据库的ACID特性，而是关注一个问题：在数据被修改后，数据库是如何确保查询结果仍然保持为之前的值？

这正是通过数据库中的Undo日志和MVCC技术来实现的，如图1-1所示。

1-1

InnoDB 中的 MVCC 主要依赖于以下三个隐藏列，这些列在每行记录中维护，以实现多版本并发控制：

DB_TRX_ID
每条记录都包含一个 DB_TRX_ID，即事务ID，记录了最后一次对该行进行插入或更新的事务ID。当需要判断某个事务中某条记录是否可见时，InnoDB 会根据该列与当前事务的视图进行对比。
DB_ROLL_PTR
DB_ROLL_PTR 是一个回滚指针，指向该行记录的上一个版本。在数据更新时，InnoDB 会保留旧版本的记录，并通过这个指针将其链接起来，从而支持通过回滚找到之前的数据版本。这是实现 MVCC 中多版本存储的关键。
DB_ROW_ID
DB_ROW_ID 是一个自增的行ID，在没有显式主键的情况下，用来唯一标识每一行数据。尽管 DB_ROW_ID 在 MVCC 机制中并不直接控制并发，但它对行记录的管理和定位起着重要作用，尤其是在没有定义主键时。

这三个隐藏列共同支撑了 InnoDB 的 MVCC 实现，确保在高并发场景下，读写操作能够并行进行而不互相阻塞。

当插入一条数据时，在记录上对应的回滚段指针为NULL，如图1-2所示

1-2

在更新记录时，原始记录会被保存到 Undo 表空间中，查询时未提交的修改数据可以通过读取 Undo 表空间中的旧版本来实现。多个数据版本通过链表结构链接，形成一个版本链。MySQL 通过记录中的回滚指针（DB_ROLL_PTR）和事务ID（DB_TRX_ID）来判断数据版本的可见性。具体判断流程如下：

判断流程

在每个事务开始时，系统会将当前所有活跃事务的信息拷贝到一个列表中，称为Read View。读取记录时，会根据记录的 TRX_ID 与 Read View 中的最大 TRX_ID 和最小 TRX_ID 进行比较，判断该记录是否对当前事务可见。

如果记录的 TRX_ID 小于 Read View 中的最小 TRX_ID**********：**
说明该记录在 Read View 中的所有事务开始之前就已提交，因而对当前事务可见，可以直接返回数据。
如果记录的 TRX_ID 大于 Read View 中的最大 TRX_ID**********：**
说明该记录在事务启动后被修改。此时需要根据回滚指针找到前一个版本的记录，并将其 TRX_ID 赋值给当前行，再重新进行判断。
如果记录的 TRX_ID 位于 Read View 的范围内：

需要进一步判断：

如果 TRX_ID 在 Read View 中存在：
- 这意味着该记录在事务启动时是活跃的，未提交。此时根据回滚指针找到前一个版本的记录，取出其 TRX_ID 进行下一轮判断。
如果 TRX_ID 不在 Read View 中：
- 说明该记录在事务启动时已提交，因此对当前事务可见，可以直接返回数据。

什么是 Read View

Read View 是 MySQL InnoDB 引擎用于实现 多版本并发控制 (MVCC) 的关键机制。它在事务执行快照读时生成，确保事务能够看到一致的、稳定的数据视图。Read View 记录了事务生成快照时的系统状态，尤其是所有活跃事务的 ID 列表。通过 Read View，数据库可以确保事务只看到在其生成视图时已经提交的数据，而不受之后其他事务的影响。

当前读和快照读

当前读 (Current Read)

当前读需要获取记录的最新版本，并且在读操作期间可能会加锁，以防止其他事务同时修改这些记录。
场景：SELECT ... LOCK IN SHARE MODE, SELECT ... FOR UPDATE, UPDATE, INSERT, DELETE 等。
这些操作确保事务读取到的数据是最新的，并且避免其他事务在操作期间对数据进行并发修改。

快照读 (Snapshot Read)

快照读通常指的是不加锁的 SELECT 操作，它通过 Read View 实现，确保事务读取到的总是快照生成时的数据版本，而不是之后的修改。
场景：SELECT 操作，在隔离级别为读已提交 (Read Committed) 或可重复读 (Repeatable Read) 时尤其常见。
在隔离级别为串行化 (Serializable) 时，快照读会退化为当前读，因为此时所有操作都必须确保数据的完全一致性，避免幻读现象。

Read View 的四个字段

Read View 的四个字段决定了事务在执行快照读时哪些数据对其可见，哪些不可见。

trx_ids:

trx_ids 是生成 Read View 时所有 活跃事务（即未提交事务）的 ID 列表。
这些事务的更改对当前事务不可见。换句话说，Read View 生成后，这些事务对数据库的修改数据将不被该事务看到。

low_limit_id:

low_limit_id 是下一个将分配的事务 ID。
由于事务 ID 是递增的，因此 low_limit_id 标志着比该 ID 更新的事务（即后续事务）的数据对当前 Read View 不可见。

up_limit_id:

up_limit_id 是生成 Read View 时已经提交的最小事务 ID。
这个 ID 之前提交的所有事务产生的数据变更对当前事务可见，这也是判断数据版本可见性的边界之一。

creator_trx_id:

creator_trx_id 是创建 Read View 的事务 ID。
这个字段用于在当前事务内判断自己提交的数据版本的可见性。例如，如果在事务中执行了多次快照读，creator_trx_id 帮助确定哪些数据版本是当前事务自己生成的，并对其可见。

Read View 通过以上四个字段来管理事务快照的可见性，保证了事务在快照读时的一致性。在 MySQL 的 MVCC 实现中，这一机制非常重要，因为它确保了在高并发环境下事务隔离的实现，防止脏读、不可重复读和幻读问题的发生。

源码解读

在 MySQL 8.0 的源码中，Read View 的核心代码主要涉及 InnoDB 存储引擎的事务管理部分。它们定义了 Read View 的生成、字段初始化和可见性判断等功能。

`read_view_open_now` 函数

read_view_open_now 函数是用来创建一个新的 Read View。它会记录当前活跃事务，并初始化 Read View 的各个字段。

read_view_t* read_view_open_now(trx_t* trx) {
    read_view_t* view;

    view = static_cast<read_view_t*>(ut_malloc_nokey(sizeof(*view)));
    ut_a(view != NULL);

    /* 设置创建者事务 ID */
    view->creator_trx_id = trx->id;

    /* 获取当前活跃事务列表并赋值给 view */
    view->m_trx_ids = trx_sys_get_active_trx_ids();

    /* 活跃事务的数量 */
    view->trx_list_len = trx_sys->rw_trx_list_len;

    /* 设置低水位 */
    view->low_limit_no = trx_sys->rw_trx_list->start->id;

    /* 设置高水位 */
    view->up_limit_no = trx_sys->rw_trx_list->end->id;

    return(view);
}

`trx_sys_get_active_trx_ids` 函数

trx_sys_get_active_trx_ids 函数用于获取当前系统中所有活跃事务的 ID。这个函数返回一个包含所有未提交事务 ID 的列表，这些事务的变更对当前 Read View 不可见。

trx_id_t* trx_sys_get_active_trx_ids() {
    trx_id_t* trx_ids;

    /* 分配用于存储事务 ID 的内存空间 */
    trx_ids = static_cast<trx_id_t*>(ut_malloc_nokey(trx_sys->rw_trx_list_len * sizeof(trx_id_t)));

    /* 遍历当前活跃事务列表，存储每个事务的 ID */
    rw_trx_list_lock();

    rw_trx_t* rw_trx = trx_sys->rw_trx_list->start;

    for (size_t i = 0; i < trx_sys->rw_trx_list_len; i++, rw_trx = rw_trx->next) {
        trx_ids[i] = rw_trx->id;
    }

    rw_trx_list_unlock();

    return trx_ids;
}

`read_view_sees_trx_id` 函数

read_view_sees_trx_id 函数用于判断某个事务 ID 的变更是否对当前 Read View 可见。它依据 Read View 的四个字段来决定可见性。

bool read_view_sees_trx_id(read_view_t* view, trx_id_t trx_id) {
    /* 如果事务 ID 小于 up_limit_id，说明该事务在 Read View 生成之前已经提交，因此可见 */
    if (trx_id < view->up_limit_no) {
        return true;
    }

    /* 如果事务 ID 大于或等于 low_limit_id，说明该事务在 Read View 生成之后启动，因此不可见 */
    if (trx_id >= view->low_limit_no) {
        return false;
    }

    /* 如果事务 ID 在 active_trx_ids 列表中，说明它是活跃事务之一，因此不可见 */
    for (size_t i = 0; i < view->trx_list_len; i++) {
        if (view->m_trx_ids[i] == trx_id) {
            return false;
        }
    }

    /* 如果上述条件都不满足，则该事务可见 */
    return true;
}

`read_view_close` 函数

read_view_close 函数用于关闭并销毁一个 Read View，释放内存。

void read_view_close(read_view_t* view) {
    ut_free(view->m_trx_ids);
    ut_free(view);
}

代码逻辑总结

创建 Read View (read_view_open_now):

为事务生成一个新的 Read View，并初始化其所有字段，包括活跃事务列表、上下限 ID 等。

获取活跃事务 ID (trx_sys_get_active_trx_ids):

遍历系统中所有未提交的事务，获取它们的 ID，并将这些 ID 存储在 Read View 中。

判断事务可见性 (read_view_sees_trx_id):

判断某个事务 ID 是否对当前 Read View 可见。依据生成 Read View 时的系统状态（如事务 ID 上下限、活跃事务列表等）进行判断。

关闭 Read View (read_view_close):

释放 Read View 相关的内存，结束 Read View 的生命周期。

这些核心代码段展示了 InnoDB 是如何通过 Read View 实现快照读，确保事务隔离和一致性。

MVCC相关实现

准备测试数据

在 Navicat 中执行以下 SQL，准备一张简单的测试表：

CREATE TABLE test_mvcc (
    id INT PRIMARY KEY,
    value VARCHAR(50)
) ENGINE=InnoDB;

INSERT INTO test_mvcc (id, value) VALUES (1, 'Initial Value');

在两个会话中进行操作

在 Navicat 中打开两个查询窗口，模拟两个事务会话。

会话 1（启动事务并更新记录）：

START TRANSACTION;
UPDATE test_mvcc SET value = 'Updated Value by Session 1' WHERE id = 1;
-- 此时事务未提交，数据仅对会话 1 可见

会话 2（启动事务并查询记录）：

START TRANSACTION;
SELECT * FROM test_mvcc WHERE id = 1;
-- 此时会话 2 应该仍然看到 'Initial Value'，因为会话 1 的事务未提交

在会话 1 提交事务之前，数据对其他事务不可见。

提交事务并观察变化

会话 1 提交事务：

COMMIT;

会话 2 再次查询：

SELECT * FROM test_mvcc WHERE id = 1;
-- 现在会话 2 可以看到更新后的值 'Updated Value by Session 1'

分析可见性

可以通过这个实验观察事务之间的隔离性和记录的可见性，结合以下 MySQL 内置命令来查看更多细节：

-- 查看 InnoDB 的事务状态
SHOW ENGINE INNODB STATUS;

-- 查看当前事务的 ID 和隔离级别
SELECT @@TRANSACTION_ISOLATION, @@tx_isolation;

Navicat 可以帮助在图形界面中直观地管理和操作多个会话，但代码级别的调试，如跟踪 MySQL 源代码中具体的可见性判断过程，需要使用 GDB 等工具。

这里需要说明一点，对于不同的事务隔离级别，可见性的实现也不一样。

对于READ-COMMITTED隔离级别，事务内的每一条查询语句都会重新创建ReadView，这样就会产生不可重复读现象。
对于REPEATABLE-READ隔离级别，事务内第一条语句执行时会创建ReadView，在事务结束这段时间内每一次查询都不会重新创建ReadView，从而实现了可重复读。

参考资料： https://dev.mysql.com/blog-archive/mysql-8-0-mvcc-of-large-objects-in-innodb/