大厂常问的MySQL事务隔离到底怎么回答

news2024/9/20 16:18:39

请在此添加图片描述

什么是事务

事务就是一组原子性的SQL查询,或者说一个独立的工作单元。事务内的语句,要么全部执行成功,要么全部执行失败。

关于事务银行系统的应用是解释事务必要性的一个经典例子。

假设一个银行的数据库有两张表:支票表(checking)储蓄表(savings)。现在要从张三的账户转移200元到他的储蓄账户,那么需要至少三个步骤。

  • 检查支票账户的余额高于200元。
  • 从张三支票账户余额中减去200元。
  • 在张三储蓄账户余额中增加200元。

上述三个步骤的操作必须打包在一个事务中,任何一个步骤失败,则必须回滚所有的步骤。

可以用START TRANSACTION或者BEGIN语句开始一个事务,然后要么使用COMMIT提交事务将修改的数据

持久保留,要么使用ROLLBACK撤销所有的修改。事务SQL的样本如下:

START TRANSACTION
SELECT balance FROM checking WHERE customer = "张三"
UPDATE checking SET balance = balance - 200.00 WHERE customer = "张三"
UPDATE savings SET balance = balance + 200.00 WHERE customer = "张三"
COMMIT

以上对事务概念并不是故事的全部。

试想一下,如果执行到第四条语句时服务器崩溃了,会发生什么?用户可能会损失200元。

再假如,在执行到第三条语句和第四条语句之间时,另外一个进程要删除支票账户的所有余额,那么可能就是银行在不知

道这个操作的情况下,依然转给了张三200元。

事务的特性

除非系统通过严格的ACID测试,否则空谈事务的概念是不够的。ACID 模型是一组数据库设计原则,强调对业务数据和关键任务应用程序非常重要的可靠性方面。 MySQL 包含诸如InnoDB存储引擎之类的组件,这些组件紧密遵循 ACID 模型,因此数据不会因软件崩溃和硬件故障等异常情况而被损坏,结果也不会被扭曲。

请在此添加图片描述

ACID表示**原子性(atomicity)一致性(consistency)隔离性(isolation)持久性(durability)**。一个运行良好的事务处理系统,必须具备这些标准特征。

  • 原子性(atomicity)

一个事务必须被视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部提交成功,要么全部失败回滚,对于一个事务来说,不可能只执行其中的一部分操作,这就是事务的原子性。

  • 一致性(consistency)

数据库总是从一个一致性的状态转换到另外一个一致性的状态。在前面的例子中,一致性确保了,即使在执行第三、四条语句之间时系统崩,支票账户中也不会损失200元,因为事务最终没有提交,所以事务中所做的修改也不会保存到数据库中。

  • 隔离性(isolation)

通常来说,一个事务所做的修改在最终提交以前,对其他事务是不可见的。在前面的例子中,当执行完第三条语句、第四条语句还未开始时,此时有另外一个账户汇总程序开始运行,则其看到的支票账户的余额并没有被减去200元。

  • 特久性(durability)

一旦事务提交,则其所做的修改就会永久保存到数据库中。此时即使系统崩溃,修改的数据也不会丢失。

事务的ACID特性可以确保银行不会弄丢你的钱。而在应用逻辑中,要实现这一点非常难基至可以说是不可能完成的任务。一个兼容ACID的数据库系统,需要做很多复杂但可能用户并没有觉察到的工作,才能确保ACID的实现。

并发带来的问题

脏读(Dirty Read)

假设事务A读取了某行数据(数据值:96),并且在事务B修改该数据的过程中(数据值:97),事务A读取到了未提交的数据(数据值:97)。如果事务B最终回滚(数据值:96),那么事务A读取到的数据就是_“脏”_的,因为它基于未提交的修改,这种读取是不可靠的。

幻读(Phantom Read)

考虑一个场景,事务A查询了一个范围的数据,例如所有年龄在20到30岁之间的人(共:99人)。在事务A的查询过程中,事务B插入了一条新的记录,该记录的年龄也在20到30岁之间。当事务A再次执行相同的查询时(共:100人),会发现有一些之前不存在的_“幻影”_数据,这导致了不一致的查询结果。

不可重复读(Non-repeatable Read)

如果事务A在读取某个数据后(数据值:96),事务B修改了这个数据并提交了更改(数据值:97),那么事务A再次读取相同数据时,会发现数据已经发生了变化(数据值:97)。这就是_不可重复读_的问题,因为同一条数据在不同时间点的读取结果不一致。

隔离级别

隔离性其实比想象的要复杂。在SQL标准中定义了四种隔离级别,每一种级别都规定了一个事务中所做的修改,哪些在事务内和事务间是可见的,哪些是不可见的。较低级别的隔离通常可以执行更高的并发,系统的开销也更低。

隔离级别脏读
(Dirty Read)
不可重复读
(NonRepeatable Read)
幻读
(Phantom Read)
未提交读(Read uncommitted)可能可能可能
已提交读(Read committed)不可能可能可能
可重复读(Repeatable read)不可能不可能可能
可串行化(Serializable )不可能不可能不可能

下面简单地介绍一下四种隔离级别。

READ UNCOMMITTED(未提交读)

READ UNCOMMITTED 级别,事务中的修改,即使没有提交,对其他事务也都是可见的。事务可以读取未提交的数据,这也被称为**脏读(DirtyRead)**。这个级别会导致很多问题,从性能上来说,READ UNCOMMITTED 不会比其他的级别好太多,但却缺乏其他级别的很多好处,除非真的有非常必要的理由,在实际应用中一般很少使用。

READ COMMITTED(已提交读)

大多数数据库系统的默认隔离级别都是 READ COMMITTED(但MySQL不是)。READ COMMITTED 满足前面提到的隔离性的简单定义:一个事务开始时,只能“看见”已经提交的事务所做的修改。换句话说,一个事务从开始直到提交之前,所做的任何修改对其他事务都是不可见的。这个级别有时候也叫做不可重复读(nonrepeatableread),因为两次执行同样的查询,可能会得到不一样的结果。

REPEATABLE READ(可重复读)

REPEATABLE READ 解决了脏读的问题。该级别保证了在同一个事务中多次读取同样记录的结果是一致的。但是理论上,可重复读隔离级别还是无法解决另外一个幻读(PhantomRead)的问题。所谓幻读,指的是当某个事务在读取某个范围内的记录时,另外一个事务又在该范围内插入了新的记录,当之前的事务再次读取该范围的记录时,会产生幻行(PhantomRow)。InnoDB和XtraDB存储引擎通过多版本并发控制(MVCC,MultiversionConcurrencyControl)解决了幻读的问题。本章稍后会做进一步的讨论。

可重复读是MySQL的默认事务隔离级别。

SERIALIZABLE(可串行化)

SERIALIZABLE是最高的隔离级别。它通过强制事务串行执行,避免了前面说的幻读的问题。简单来说,SERIALIZABLE会在读取的每一行数据上都加锁,所以可能导致大量的超时和锁争用的问题。实际应用中也很少用到这个隔离级别,只有在非常需要确保数据的一致性而且可以接受没有并发的情况下,才考虑采用该级别

设置事务的隔离级别

全局级别

设置全局级别的事务隔离级别,可以使用 SET GLOBAL

SET GLOBAL TRANSACTION ISOLATION LEVEL <隔离级别>;

会话级别

设置当前会话的事务隔离级别,可以使用 SET SESSION

SET SESSION TRANSACTION ISOLATION LEVEL <隔离级别>;

永久保存设置

如果想永久保存设置,以便在 MySQL 重新启动后仍然有效,可以使用 SET PERSIST:

SET PERSIST TRANSACTION ISOLATION LEVEL <隔离级别>;

注意:__PERSIST 仅在 MySQL 8.0.16 及更高版本中可用。

启动事务

在设置隔离级别后,使用以下语句启动事务

START TRANSACTION;

提交事务

在完成所有数据库操作后,使用以下语句提交事务:

COMMIT;

回滚事务

如果需要撤销事务中的所有更改,可以使用以下语句回滚事务:

ROLLBACK;

查询当前事务隔离级别

使用以下语句查看当前事务隔离级别:

SELECT @@tx_isolation;

不可重复读和幻读的区别

  • 不可重复读: 想象有个镇民张三进入图书馆并查询一本书的信息。在可重复读的隔离级别下,张三读取了这本书的信息后,系统会将这本书的信息标记为**“已被读取”**,以防其他人修改。即使其他人想修改这本书的信息,都会被阻塞。但不可重复读的问题在于,即使张三在事务中已经读取了这本书的信息,如果有人在此期间修改了这本书的内容,张三再次查询时就会发现书籍信息已经发生了变化,导致信息不可重复。
  • 幻读: 现在假设小王想要捐赠一本新书给图书馆。在可重复读的隔离级别下,小王将书捐赠给图书馆,并且这本书的信息被标记为**“已存在”**。然而,由于可重复读无法锁住新增的数据,如果在此期间有人插入了一本书,小王再次查询时就会发现多了一本之前不存在的书籍,形成了幻读的情况。
  • 锁机制和MVCC: 为了解决不可重复读和幻读的问题,可以使用锁机制,例如在Serializable隔离级别下使用行锁,但这会显著降低数据库并发能力。然而,成熟的数据库系统如MySQL、Oracle和PostgreSQL更倾向于使用MVCC。MVCC通过保存数据在某个时间点的快照来实现,不仅可以防止不可重复读和幻读,而且在性能上更为高效。

在MVCC中,每个事务看到的数据都是一致的,不受其他事务的影响。这样,即使在事务A读取数据的同时,事务B插入了新的数据,事务A也不会发生幻读,因为它只看到了在它开始之前已经存在的数据。MVCC以乐观锁为基础,避免了悲观锁所带来的并发性能下降。

事务隔离的实现(MVCC)

MySQL的大多数事务型存储引擎实现的都不是简单的**行级锁**。基于提升并发性能的考虑,它们一般都同时实现了多版本并发控制(MVCC)。不仅是MySQL,包括OraclePostgreSQL等其他数据库系统也都实现了MVCC,但各自的实现机制不尽相同,因为MVCC没有一个统一的实现标准。

可以认为MVCC是行级锁的一个变种,但是它在很多情况下避免了加锁操作,因此开销更低。虽然实现机制有所不同,但大都实现了非阻塞的读操作,写操作也只锁定必要的行。

MVCC的实现,是通过保存数据在某个时间点的 快照 来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。根据事务开始的时间不同,每个事务对同一张表,同一时刻看到的数据可能是不一样的。如果之前没有这方面的概念,这句话听起来就有点迷惑。熟悉了以后会发现,这句话其实还是很容易理解的。

下面我们通过InnoDB的简化版行为来说明MVCC是如何工作的。

InnoDBMVCC,是通过在每行记录后面保存两个隐藏的列来实现的。,

  • 一个保存了行的创建时间;
  • 一个保存行的过期时间(或删除时间);

当然存储的并不是实际的时间值,而是系统版本号(system version number)。每开始一个新的事务,系统版本号都会_自动递增_。事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。

下面看一下在_REPEATABLE READ_隔离级别下,MVCC具体是如何操作的。

  • SELECT

InnoDB会根据以下两个条件检查每行记录
InnoDB只查找版本早于当前事务版本的数据行(也就是,行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的。
行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除只有符合上述两个条件的记录,才能返回作为查询结果。

  • INSERT

InnoDB为新插人的每一行保存当前系统版本号作为行版本号。

  • DELETE

InnoDB为删除的每一行保存当前系统版本号作为行删除标识。

  • UPDATE

InnoDB为插入一行新记录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标识。

保存这两个额外系统版本号,使大多数读操作都可以不用加锁。这样设计使得读数据操作很简单,性能很好,并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的行检查工作,以及一些额外的维护工作。

MVCC只在REPEATABLE READREAD COMMITTED两个隔离级别下工作。其他两个隔离级别都和MVCC不兼容,因为READ UNCOMMITTED总是读取最新的数据行,而不是符合当前事务版本的数据行。而SERIALIZABLE则会对所有读取的行都加锁。

参考资料

  • MySQL参考手册
  • 《高性能MySQL 第3版》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2149385.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenAI o1大模型:提示词工程已死

OpenAI 最近发布了最新大模型 o1&#xff0c;通过强化学习训练来执行复杂的推理任务&#xff0c;o1 在多项基准测试中展现了博士级别的推理能力&#xff0c;甚至在某些情况下可以与人类专家相媲美。 当你使用 o1 的时候&#xff0c;会发现文档中多了一项提示词建议。 翻译一下&…

OBB-最小外接矩形包围框-原理-代码实现

前言 定义&#xff1a;OBB是相对于物体方向对齐的包围盒&#xff0c;不再局限于坐标轴对齐&#xff0c;因此包围点云时更加紧密。优点&#xff1a;能够更好地贴合物体形状&#xff0c;减少空白区域。缺点&#xff1a;计算较为复杂&#xff0c;需要计算物体的主方向&#xff0c…

二叉树的遍历【C++】

对于二叉树系列的题&#xff0c;必须要会遍历二叉树。 遍历的有&#xff1a;深度优先&#xff1a;前序、中序、后序&#xff0c;广度优先&#xff1a;层序遍历 什么序是指处理根节点在哪个位置&#xff0c;比如前序是指处理节点顺序&#xff1a;根左右。 接下来要说明的是&…

深入浅出Docker

1. Docker引擎 Docker引擎是用来运行和管理容器的核心软件。通常人们会简单的将其指代为Docker或Docker平台。 基于开放容器计划&#xff08;OCI&#xff09;相关的标准要求&#xff0c;Docker引擎采用了模块化的设计原则&#xff0c;其组件是可替换的。 Docker引擎由如下主…

从理论到实践:全面指导企业实现数字化转型的战略路径

全球企业数字化转型的必然性 在全球范围内&#xff0c;数字化转型成为了企业战略中的核心命题。随着云计算、大数据、人工智能等新兴技术的快速发展&#xff0c;企业的运营模式、管理体系及客户体验正在发生深刻的变革。数字技术不仅为企业带来了新的商业机会&#xff0c;还使…

【Elasticsearch】-图片向量化存储

需要结合深度学习模型 1、pom依赖 注意结尾的webp-imageio 包&#xff0c;用于解决ImageIO.read读取部分图片返回为null的问题 <dependency><groupId>org.openpnp</groupId><artifactId>opencv</artifactId><version>4.7.0-0</versio…

【2025】中医药健康管理小程序(安卓原生开发+用户+管理员)

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…

海报制作哪个软件好?这些在线工具不容错过

国庆节的脚步越来越近&#xff0c;不少公司正计划利用这个时机开展一些特别的庆典活动。 在这些活动中&#xff0c;海报作为一种传统的宣传方式&#xff0c;仍然是不可或缺的。但在制作海报时&#xff0c;我们可能会遇到创意瓶颈、时间限制或者预算约束等问题。 幸运的是&…

高棉语翻译神器上线!中柬互译,OCR识别,语音翻译一应俱全,《柬埔寨语翻译通》App

全新的高棉语翻译神器已经正式上架&#xff01; 无论你是安卓还是iOS用户&#xff0c;现在都可以轻松开始使用&#xff0c;开启你的翻译之旅&#xff01; 这款应用不仅仅是一个简单的翻译工具&#xff0c;它还支持中文与高棉语的双向翻译。翻译结果可以语音播放&#xff0c;翻…

AI服务器是什么?为什么要用AI服务器?

AI服务器的定义 AI服务器是一种专门为人工智能应用设计的服务器&#xff0c;它采用异构形式的硬件架构&#xff0c;通常搭载GPU、FPGA、ASIC等加速芯片&#xff0c;利用CPU与加速芯片的组合来满足高吞吐量互联的需求&#xff0c;为自然语言处理、计算机视觉、机器学习等人工智…

企业微信-前往服务商后台页面对接解决方案

序 我会告诉你在哪里点我会告诉你在哪里配置点下去他只返回auth_code的&#xff0c;我怎么登录 正文 他是在这个位置 是这样&#xff0c;应用授权安装第三方应用后&#xff0c;企业微信&#xff08;管理员角色&#xff09;是可以从pc端企业后台点第三方应用的。 如果我没记…

【余弦相似度】

余弦相似度 又称为余弦距离&#xff0c;利用两个向量之间的夹角的余弦值来衡量两个向量的余弦相似度&#xff0c;两个向量夹角越小&#xff0c;余弦值越接近1。 向量模&#xff08;向量长度&#xff09;计算方法&#xff1a; n维向量的相似度计算&#xff1a; 余弦相似度的取…

黑盒测试 | 挖掘.NET程序中的反序列化漏洞

通过不安全反序列化漏洞远程执行代码 img 今天&#xff0c;我将回顾 OWASP 的十大漏洞之一&#xff1a;不安全反序列化&#xff0c;重点是 .NET 应用程序上反序列化漏洞的利用。 &#x1f4dd;$ _序列化_与_反序列化 序列化是将数据对象转换为字节流的过程&#xff0c;字节流…

Entity更新坐标不闪烁需采用setCallbackPositions方法赋值

问题描述&#xff1a; 1.new mars3d.graphic.PolygonEntity({在更新点位高度模拟水面上身的时候&#xff0c;会存在闪烁 2.当把addDemoGraphic4添加到图层后&#xff0c;addDemoGraphic1水位变化不闪烁&#xff0c;把addDemoGraphic4注释后&#xff0c;addDemoGraphic1闪烁。…

UI自动化测试的边界怎么定义?

标题&#xff1a;定义UI自动化测试的边界&#xff1a;从0到1的详细指南 引言&#xff1a; UI自动化测试是现代软件开发过程中至关重要的一环。为了确保自动化测试的有效性和准确性&#xff0c;我们需要明确定义测试的边界。本文将从0到1为您提供一篇详细且规范的指南&#xf…

基于YOLOv8/YOLOv9/YOLOv10的河道漂浮物检测识别系统

摘要&#xff1a; 河道漂浮物检测识别是指利用技术手段自动识别河流、湖泊等水体表面的漂浮垃圾或物体的过程。随着环境保护意识的增强和技术的进步&#xff0c;河道漂浮物检测已经成为水环境保护和管理的重要组成部分。这项技术的应用可以帮助及时发现污染源&#xff0c;采取措…

一些线上常用排查问题的命令

排查CPU过高时使用到的一些命令 top free df top命令 top 命令是一个动态的实时视图&#xff0c;显示系统的整体运行状况&#xff0c;包括 CPU 使用率、内存使用情况、进程信息等。 free 命令 free 命令用于显示系统中物理内存和交换内存的使用情况。 df 命令 df 命令用…

纯前端表格导出Excel

先写好两个js文件 直接复制粘贴 文件目录是这样的 Bolb.js /* eslint-disable */ /* Blob.js* A Blob implementation.* 2014-05-27** By Eli Grey, http://eligrey.com* By Devin Samarin, https://github.com/eboyjr* License: X11/MIT* See LICENSE.md*//*global self, …

Vuex 入门与实战

引言 Vuex 是 Vue.js 官方推荐的状态管理库&#xff0c;它可以帮助我们更好地管理 Vue 应用的状态。在大型应用中&#xff0c;组件之间的状态共享和通信是一个非常重要的问题&#xff0c;而 Vuex 提供了一种优雅的解决方案。 在 Vue 应用中&#xff0c;数据的流动一般是单向的…

PCA贡献率

什么是 PCA&#xff1f; PCA&#xff08;Principal Component Analysis, 主成分分析&#xff09;是一种常用的数据降维技术。它通过找到一组新的互不相关的正交轴&#xff08;主成分&#xff09;&#xff0c;将高维数据映射到低维空间。这些新轴是按照数据的方差大小排列的&am…