你一定能看懂的SQL事务及其实现原理

news2025/1/15 20:55:31

一。概念

事务 是数据库执行原子操作的基本单位。一个事务中的多个修改,则要么全部成功执行,要么全部不执行。

关于事务的 MYSQL 官网的解释

Transactions are atomic units of work that can be *committed* or *rolled back*. When a transaction makes multiple changes to the database, either all the changes succeed when the transaction is committed, or all the changes are undone when the transaction is rolled back.

一句话概括 事务的四大特性:

  • 原子性:多个变更操作,要么全做,要么全不做(基于undo log实现事务回滚)
  • 持久性:数据修改是永久的,即便系统故障也不会丢失(基于data和redo log实现故障后恢复)
  • 隔离性:保证多事务并发时不相互干扰(可以调整不同的隔离级别,基于锁、MVCC的并发控制实现)
  • 一致性:事务过程中要么全用旧值,要么全用新值,不允许新旧值混合(基于原子性和隔离性实现)

二。四大特性(ACID)

关于ACID的 MYSQL 官网的解释

Transactions are *atomic* units of work that can be *committed* or *rolled back*. When a transaction makes multiple changes to the database, either all the changes succeed when the transaction is committed, or all the changes are undone when the transaction is rolled back.

The database remains in a consistent state at all times — after each commit or rollback, and while transactions are in progress. If related data is being updated across multiple tables, queries see either all old values or all new values, not a mix of old and new values.

Transactions are protected (isolated) from each other while they are in progress; they cannot interfere with each other or see each other’s uncommitted data. This isolation is achieved through the *locking* mechanism. Experienced users can adjust the *isolation level*, trading off less protection in favor of increased performance and *concurrency*, when they can be sure that the transactions really do not interfere with each other.

The results of transactions are durable: once a commit operation succeeds, the changes made by that transaction are safe from power failures, system crashes, race conditions, or other potential dangers that many non-database applications are vulnerable to. Durability typically involves writing to disk storage, with a certain amount of redundancy to protect against power failures or software crashes during write operations. (In InnoDB, the *doublewrite buffer* assists with durability.)

1. 原子性(A)

一个事务(transaction)中的所有操作,要么全做,要么全不做,不会结束在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。

a.如何实现原子性?

开始执行事务操作时(beigin),数据库底层开始undo日志记录。在做每一个会对数据产生影响的地方,undo日志中都会记录下修改前的数据,例如:

  • 执行delete一条数据的时候,需要记录这条数据的信息,发生回滚的时候,重新插入这条旧数据

  • 执行update一条数据的时候,需要记录之前的旧值,发生回滚的时候,将记录还原为旧值

  • 执行insert一条数据的时候,需要这条记录的主键,发生回滚的时候,根据主键执行delete操作

当事务成功结束后(commit),则会清空undo日志,等待下一次事务执行。

2.持久性(D)

事务一旦提交成功,对数据的修改就是永久的,即便系统故障也不会丢失。

a.持久性要解决什么问题?

在MySQL这类的非内存数据库中,表数据是持久化在磁盘文件,同时为了提高效率,处理中的数据会加载在内存中。此外,内存中修改的数据不会实时回写磁盘,而是根据MYSQL的更新策略回写到磁盘文件。因此,事务提交成功,并不能保证数据能持久化保存在磁盘文件。需要在考虑在事务提交完后,数据还未写会磁盘文件时,发生系统崩溃或者软件崩溃导致内存数据丢失的情况。

b. 如何实现持久性?

在MYSQL中使用Redo log解决上面的问题。

当做数据修改的时候,不仅在内存中操作,还会在Redo log中记录这次操作。当事务提交的时候,会将Redo log日志回写redo日志文件。如果数据库崩溃,则会将Redo log中的内容恢复到数据库中,再根据undo log和bin log内容决定回滚数据还是提交数据。

c.为什么不直接写到data文件?

为什么要通过redo来实现持久化,而不直接写把此次修改的数据持久化到date文件?(非标准,个人观点)

  1. 磁盘数据文件缓存到内存时,不是对一条条数据进行组织而是按照实际块进行缓存
  2. 同一个数据块可能有多个事务正在使用,不能随时将数据块回写到数据库,需要加锁或者判断状态
  3. 一个事务很可能不仅仅修改一个表,如果同时修改多个表则可能同时回写很多个内存块

而持久化redo log则只需要向redo文件追加一条事务的redo记录即可。

2.一致性(C)

在事务开始之前和事务结束以后,数据库的完整性没有被破坏。即:写入的数据必须完全符合所有的预设规则,包含数据的精确度、串联性以及后续数据库可以自发性地完成预定的工作。

a.如何实现一致性

基于原子性和隔离性实现

3.隔离性(I)

事务在进行过程中应该相互隔离,保证多个事务间不能相互干扰,即不能看到对方未提交的数据。

3.1 并发问题

实现隔离性目的是为了解决多个事务并发时的一些问题,下面是关于并发引发的几类问题总结

3.1.1 脏读

事务A读取了事务B修改的数据,若事务B发生回滚,事务A依然使用回滚的数据,称 事务A 脏读。

时间事务A事务B
T1开始事务A(Data=500)
T2开始事务B(Data=500)
T3修改数据(Data=1000)
T4读取数据(Data=1000)
T5回滚事务(Data=500)
T6使用Data=1000继续事务

注意:T4时刻,事务A读到的是未提交的数据(Data=1000)

3.1.2 脏写

事务B修改一条数据还未提交,事务A修改同一条数据未提交,事务B回滚(数据变成事务B修改前的数据),事务A提交。称 事务A 脏写(即:写入的不是事务A想要的数据)。

时间事务A事务B
T1开始事务A(Data=500)
T2修改数据(Data=2000)
T3开始事务B(Data=500)
T4修改数据(Data=1000)
T5回滚事务(Data=500)
T6提交事务(写入Data=500)
3.1.3 不可重复读

事务A读取数据后,事务B修改并提交同一个数据,事务A再次读取数据。此时事务A两次读数据不一致。称 事务A 不可重复读。

时间事务A事务B
T1开始事务A(Data=500)
T2读取数据(Data=500)
T3开始事务B(Data=500)
T4修改数据(Data=1000)
T5提交事务(Data=1000)
T6读取数据(Data=1000)
3.1.4 幻读

事务A读取了两次数据,在这两次的读取过程中事务B增删记录,事务A的两次读取出来的集合不一样。称 事务A 幻读(和不可重复读的些微区别在于:这里是集合操作,可以是读/写,比如统计记录条数、全表修改字段)

时间事务A事务B
T1开始事务A(100条数据)
T2统计数据(100条数据)
T3开始事务B(100条数据)
T4插入数据(新增10条数据)
T5提交事务(110条数据)
T6统计数据(110条数据)
3.1.5 丢失更新
A. 第一类丢失更新(回滚丢失,Lost update)

事务A期间,事务B对数据进行了更新并提交;事务A发生回滚,覆盖了事务B已经提交的数据

时间事务A事务B
T1开始事务A(Data=500)
T2读取数据(Data=500)
T3开始事务B(Data=500)
T4修改数据(Data=1000)
T5提交事务(Data=1000)
T6回滚事务(Data=500)
B. 第二类丢失更新(覆盖丢失/两次更新问题,Second lost update)

事务A期间,事务B对数据进行更新并提交;在事务A提交之后,覆盖了事务B已经提交的数据。

时间事务A事务B
T1开始事务A(Data=500)
T2读取数据(Data=500)
T3开始事务B(Data=500)
T4修改数据(Data=1000)
T5提交事务(Data=1000)
T6修改数据(Data=600)
T7提交(Data=600)
3.1.6 小结

上面的每种并发问题之间都有一些细微的差别。

  • 脏读:读到脏的数据(回滚了的数据)
  • 脏写:写入脏的数据(被回滚还原的数据)
  • 不可重复读:第一次读到修改前数据,第二次读到修改后数据(两次读数据不一致)
  • 幻读:第一次操作修改前集合数据,第二次操作修改后集合数据(两次数据结果不一致,和不可重复读区别在于一者为读数据和一者为读/写集合)
  • 丢失更新:
    • 第一类丢失更新:因为回滚,把其他事务更新的数据覆盖了
    • 第二类丢失更新:因为并发更新,把其他事务更新的数据覆盖了

3.2 解决并发问题的三种实现

3.2.1 悲观锁

理论

在关系数据库管理系统里,悲观并发控制(又名“悲观锁”,PessimisticConcurrency Control,缩写“PCC”)是一种并发控制的方法。它可以阻止一个事务以影响其他用户的方式来修改数据。如果一个事务执行的操作读某行数据应用了锁,那只有当这个事务把锁释放,其他事务才能够执行与该锁冲突的操作。

事实上我们常说的悲观锁并不是一种实际的锁,而是一种并发控制的思想。悲观并发控制对于数据被修改持悲观(保守)的态度,认为数据被外界访问时,必然(较大概率)会产生冲突,所以在数据处理的过程中都采用加锁的方式来保证对资源的独占。

实现流程

  1. 开始事务后,按照操作类型给需要加锁的数据申请加某一类锁:例如共享行锁等
  2. 加锁成功则继续后面的操作,如果数据已经被加了其他的锁,而且和现在要加的锁冲突,则会加锁失败(例如已经加了排他锁),此时需等待其他的锁释放(可能出现死锁)
  3. 完成事务后释放所加的锁

优缺点

  • 优点:

    悲观并发控制采取的是保守策略:“先取锁,成功了才访问数据”,这保证了数据获取和修改都是有序进行的,因此适合在写多读少的环境中使用。当然使用悲观锁无法维持非常高的性能,但是在乐观锁也无法提供更好的性能前提下,悲观锁却可以做到保证数据的安全性。

  • 缺点:

    由于需要加锁,而且可能面临锁冲突甚至死锁的问题,悲观并发控制增加了系统的额外开销,降低了系统的效率,同时也会降低了系统的并行性。

3.2.2 乐观锁

理论

在关系数据库管理系统里,乐观并发控制(又名“乐观锁”,OptimisticConcurrency Control,缩写“OCC”)是一种并发控制的方法。它假设多用户并发的事务在处理时不会彼此互相影响,各事务能够在不产生锁的情况下处理各自影响的那部分数据。

乐观观锁同样不是一种实际的锁,是一种并发控制的思想。乐观并发控制对数据修改持乐观态度,认为即使在并发环境中,外界对数据的操作一般是不会造成冲突,所以并不会去加锁,而是在提交数据更新之前,每个事务会先检查在该事务读取数据后,有没有其他事务又修改了该数据。如果其他事务有更新的话,则让返回冲突信息,让用户决定如何去做下一步,比如说重试或者回滚。

实现方式

CAS(比较与交换,Compare and swap) 是一种有名的无锁算法。无锁编程,即不使用锁的情况下实现多线程之间的变量同步,也就是在没有线程被阻塞的情况下实现变量的同步,所以也叫非阻塞同步(Non-blocking Synchronization)。实现非阻塞同步的方案称为“无锁编程算法”( Non-blocking algorithm)。

乐观锁的实现就类似于上面的过程,主要有以下几种方式:

  1. 版本号标记:在表中新增一个字段:version,用于保存版本号。获取数据的时候同时获取版本号,然后更新数据的时候用以下命令:updatexxx set version=version+1,… where … version=“old version” and …。这时候通过判断返回结果的影响行数是否为0来判断是否更新成功,更新失败则说明有其他请求已经更新了数据了。
  2. 时间戳标记:和版本号一样,只是通过时间戳来判断。一般来说很多数据表都会有更新时间这一个字段,通过这个字段来判断就不用再新增一个字段了。
  3. 待更新字段:如果没有时间戳字段,而且不想新增字段,那可以考虑用待更新字段来判断,因为更新数据一般都会发生变化,那更新前可以拿要更新的字段的旧值和数据库的现值进行比对,没有变化则更新。
  4. 所有字段标记:数据表所有字段都用来判断。这种相当于就、不仅仅对某几个字段做加锁了,而是对整个数据行加锁,只要本行数据发生变化,就不进行更新。

优缺点

  • 优点:

    乐观并发控制没有实际加锁,所以没有额外开销,也不错出现死锁问题,适用于读多写少的并发场景,因为没有额外开销,所以能极大提高数据库的性能。

  • 缺点:

    乐观并发控制不适合于写多读少的并发场景下,因为会出现很多的写冲突,导致数据写入要多次等待重试,在这种情况下,其开销实际上是比悲观锁更高的。而且乐观锁的业务逻辑比悲观锁要更为复杂,业务逻辑上要考虑到失败,等待重试的情况,而且也无法避免其他第三方系统对数据库的直接修改的情况。

3.2.3 MVCC(多版本并发控制)

3.3 四个隔离级别(隔离级别从低到高)

3.3.1 读未提交

在事务之间提供最低的隔离级别。一个事务正在读数据时,允许其他事务同时进行读写操作。这种做法虽然能提升性能,但是以不太可靠的结果为代价,比如出现脏读。

请谨慎使用此隔离级别,并注意结果可能不一致或不可再现,这取决于其他并发事务此时正在做什么。通常,具有此隔离级别的事务只执行查询,不执行插入、更新或删除操作。

参考:https://dev.mysql.com/doc/refman/8.0/en/glossary.html#glos_read_uncommitted

3.3.2 读已提交

一种隔离级别,它使用一种锁定策略,在事务之间放松一些保护,以提高性能。事务不能看到其他事务中未提交的数据,但可以看到当前事务启动后另一个事务提交的数据。因此,事务永远不会看到任何坏数据,但是它看到的数据可能在一定程度上取决于其他事务的时间。

当具有此隔离级别的事务执行 UPDATE...WHERE...DELETE...WHERE... 操作,其他事务可能必须等待。的成交方式代码表

参考:https://dev.mysql.com/doc/refman/8.0/en/glossary.html#glos_read_committed

3.3.3 可重复读

InnoDB 的默认隔离级别。它可以防止查询的任何行被其他事务更改,从而避免不可重复读取的场景,但不会避免虚读。它使用适度严格的锁定策略,以便事务中的所有查询看到来自同一快照的数据,即事务启动时的数据。

当具有此隔离级别的事务执行UPDATE...WHEREDELETE...WHERE...SELECT...FOR UPDATELOCK IN SHARE MODE 操作,其他事务可能必须等待。

参考:https://dev.mysql.com/doc/refman/8.0/en/glossary.html#glos_repeatable_read

3.3.4 串行化

使用最保守锁定策略的隔离级别,以防止任何其他事务插入或更改由该事务读取的数据,直到该事务完成。通过这种方式,同一个查询可以在事务中反复运行,并且确保每次都检索相同的结果集。任何更改自当前事务开始以来由另一个事务提交的数据的尝试都会导致当前事务等待。

这是SQL标准指定的默认隔离级别。在实践中,这种严格程度很少出现

参考:https://dev.mysql.com/doc/refman/8.0/en/glossary.html#glos_serializable

3.3.5 小结
隔离级别脏读不可重复读幻读示例
读未提交不解决不解决不解决
读已提交能解决不解决不解决
可重复读能解决能解决不解决
串行化能解决能解决能解决

参考:

  • 图文并茂讲解Mysql事务实现原理
  • MYSQL官方说明
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/435689.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

substrate实例-基于OCW发送一个签名交易

目录标题 1. 获取substrate-node-template代码2. 添加一个用于测试的ocw-test目录至pallets3. 编写ocw-test/src/lib.rs代码3.1 需要用到的包名的引用3.2 模块crypto的实现3.3 mode pallet 的实现-config、storage、event3.4 mode pallet 的实现-call3.5 mode pallet 的实现-ho…

整理的汉字及拼音、编码数据文件,依据拼音声母进行归类共计2万多条

本篇文章主要讲解自己整理的汉字拼音数据资源的下载及使用方法。 资源截图 包含:sql、xls、txt、json等格式文件 汉字涵盖:多音字、生僻字 下载地址:https://download.csdn.net/download/hj960511/87705416 使用方法 步骤一、下载资源包&…

七、使用arcgis对道路结果进行后处理及iou优化步骤详解

最近在研究对道路的后处理 废话不多说 直接放我的教程了 分别对real真实和predict预测的图片进行镶嵌操作 教程在这里 工具在这里 结果如下 矢量化提取道路中心线 经过很多尝试 arcscan是提取效果最好的一个方法,操作见这 或者这里这篇文章注解更详细一点&am…

问题汇总1

问题汇总 Linux相关1. vim 修改挂载文件时 报错 read-only filesystem2.root 用户密码无法更改3.linux 用户被锁定4.linux 查看登录日志其他小问题 Windows 相关1.添加 删除 默认路由2.exel合并单元格 添加 分隔符 Linux相关 1. vim 修改挂载文件时 报错 read-only filesystem …

Linux namespace

​ 前言 从《initrd&init进程》可知,我们通过ssh连接linux服务器,其实主是linux启动一shell进程与我们做交互。而Linux又是多租户的,这使用得用户与用户间产生了,资源的争抢。 如何隔离资源,且让用户都无法察觉&…

SpringBoot项目实现热部署

文章目录 SpringBoot实现热部署手动开启热部署自动开启热部署热部署相关配置 SpringBoot实现热部署 什么是热部署? 所谓热部署,就是在应用正在运行的时候升级软件,却不需要重新启动应用。对于Java应用程序来说,热部署就是在运行时…

初学数据库

1、什么是数据库 数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。 每个数据库都有一个或多个不同的API用于创建,访问,管理,搜索和复制所保存的数据。 我们也可以将数据存储在文件中,但是在…

企业级实践:大厂项目研发流程

引言 战国邹孟轲《孟子离娄上》:“离娄之明,公输子之巧,不以规矩,不能成方圆。” 每一个行业都有自己行之有效的规矩,同样软件行业也有自己一套的开发流程,今天就来跟大家聊一聊咱们公司的开发流程&#…

智能修改文案-智能写作平台

智能原创自动写作工具在线 随着人工智能技术的发展,智能原创自动写作工具在线已经成为了网络营销的一个重要工具。这种工具可以根据您输入的关键词和主题,自动生成高质量、原创性强的文章。下面是智能原创自动写作工具在线的优势。 节省时间和人力成本 …

IDEA重复下载SNAPSHOT包问题

问题现象 reimport 之后 状态栏显示resolving dependencies… 遇到某个比较大的快照包(33M),同一天的第2个版本时 1.0-xxx-SNAPSHOT.时间戳-2 idea importer 会先分片下载 x.jar.part文件中,然后复制为x.jar吧 如图中所示,其实已经下载完了&…

C++四种类型转换运算符

C语言之所以增加强制类型转换的语法,就是为了强调风险,让程序员意识到自己在做什么。 但是,这种强调风险的方式还是比较粗放,粒度比较大,它并没有表明存在什么风险,风险程度如何。再者,C风格的…

深入浅出OkHttp,【带你手写】构建高效、高性能的网络请求框架

简述 OKHttp是一个用Java编写的网络框架,可用于 Android,以及一些基于Java的web应用开发中。它使用了HTTP/2标准的支持和连接池技术,可以让应用快速向Web服务器发送网络请求,并得到响应。OKHttp提供了一个简单的API,允…

【SQL】列的选择与查询

本文内容参考书籍《SQL基础教程》第二章,课后习题在最后,请多指教。之前章节的内容请点击下方链接。 前言 PostgreSQL的下载与安装 第一章 数据库的创建,表的创建、更新、删除 一、SELECT语句 1、查询表中的列 (1&#xff09…

【每日一题】——移除元素

🌏博客主页:PH_modest的博客主页 🚩当前专栏:每日一题 💌其他专栏: 🔴 每日反刍 🟡 C跬步积累 🟢 C语言跬步积累 🌈座右铭:广积粮,缓称…

重装系统重启后无法进入系统解决方法

重启无法进入系统怎么办?让大家平日里使用小白装机系统的话,很有可能会由于没有办法顺利的进行引导菜单而导致无法进入系统下面,小编今天教大家小白装机重启无法进入系统解决方法。 方法/步骤: 方法一:运用热键再次进入。 1、小…

【LeetCode】剑指 Offer(29)

目录 题目:剑指 Offer 56 - II. 数组中数字出现的次数 II - 力扣(Leetcode) 题目的接口: 解题思路: 代码: 过啦!!! 题目:剑指 Offer 57. 和为s的两个数…

JVM垃圾回收机制(GC)

目录 GC的作用: 申请内存的时机和释放内存的时机 内存泄露和内存溢出 内存泄露 内存溢出 GC(垃圾回收的劣势) GC(垃圾回收) 的工作过程 垃圾回收的过程: 第一阶段:找垃圾/判定垃…

Baumer工业相机堡盟工业相机如何联合BGAPISDK和OpenCV实现图像的直方图算法增强(C++)

Baumer工业相机堡盟工业相机如何联合BGAPISDK和OpenCV实现图像的直方图算法增强(C) Baumer工业相机Baumer工业相机使用图像算法增加图像的技术背景Baumer工业相机通过BGAPI SDK联合OpenCV使用图像增强算法1.引用合适的类文件2.BGAPI SDK在图像回调中引用…

基于NXP iMX8处理器扩展外部 SGTL5000 音频接口

By Toradex胡珊逢 Apalis iMX8 计算机模块的数字音频接口 SAI(Synchronous Audio Interface)可以配置为 AC97、I2S格式,用于连接外部音频编解码器。文章接下来将介绍在 Linux BSP v6 上如何扩展第二路 SGTL5000。 iMX8 处理器具有多路 SAI 通…

I2C基础入门

I2C参数 主从模式: 主机从机 常见速率: 普通模式(100kHz)快速模式(400kHz)快速模式(1MHz)高速模式(3.4MHz)超高速模式(5MHz) 地址…