实现悲观协议,除了锁还能咋办?

news2024/10/6 12:24:37

相对乐观和局部悲观是一体两面的关系,识别它的要点就在于是否有全局有效性验证,这也和分布式数据库的架构特点息息相关。但是关于悲观协议,还有很多内容没有提及,下面我们就来填补这一大块空白。

悲观协议的分类

要先跳出来,从并发控制技术整体的分类体系看。

并发控制的分类体系,学术界标准也不一:

  • “Principles of Distributed Database Systems”分类按宽泛的乐观协议和悲观协议进行分类,子类之间又有很多重叠的概念,理解复杂
  • “Transactional Information Systems : Theory, Algorithms, and the Practice of Concurrency Control and Recovery”划分是狭义乐观协议和其他悲观协议。这里狭义乐观协议,就是指我们在第13讲提到过的,基于有效性验证的并发控制,也是学术上定义的OCC

狭义乐观协议和其他悲观协议这种分类方式更清晰些,所以就选择“ Transactional Information Systems : Theory, Algorithms, and the Practice of Concurrency Control and Recovery”中的划分体系。书中一幅图,梳理不同的并发控制协议。

先分为悲观、乐观。因为这里的乐观协议是指狭义乐观并发控制,所以包含内容较少,只有前向乐观并发控制和后向乐观并发控制;而悲观协议又分为基于锁和非锁两大类,其中基于锁的协议是数量最多的。

两阶段封锁(Two-Phase Locking,2PL)

基于锁的协议显然不只是2PL,还包括有序共享(Ordered Sharing 2PL, O2PL)、利他锁(Altruistic Locking, AL)、只写封锁树(Write-only Tree Locking, WTL)和读写封锁树(Read/Write Tree Locking, RWTL)。但这几种协议在真正的数据库系统中很少使用,所以就不过多介绍了,我们还是把重点放在数据库系统主要使用的2PL上。

2PL就是事务具备两阶段特点的并发控制协议,两阶段指:

  • 加锁阶段
  • 释放锁阶段

加锁阶段严格区别于紧接着的释放锁阶段。

在t1时刻之前是加锁阶段,在t1之后则是释放锁阶段,我们可以从时间上明确地把事务执行过程划分为两个阶段。2PL的关键点就是释放锁之后不能再加锁。而根据加锁和释放锁时机的不同,2PL又有一些变体。

保守两阶段封锁协议(Conservative 2PL,C2PL),事务在开始时设置它需要的所有锁。

img

严格两阶段封锁协议(Strict 2PL,S2PL),事务一直持有已经获得的所有写锁,直到事务终止。

强两阶段封锁协议(Strong Strict 2PL,SS2PL),事务一直持有已经获得的所有锁,包括写锁和读锁,直到事务终止。SS2PL与S2PL差别只在于一直持有的锁的类型,所以它们的图形是相同的。

理解这几种2PL变体,回想13的Percolator模型。当主锁(Primary Lock)没有释放前,所有的记录上的从锁(Secondary Lock)实质上都没有释放,在主锁释放后,所有从锁自然释放。所以,Percolator也属于S2PL。TiDB的乐观锁机制是基于Percolator的,那么TiDB就也是S2PL。

事实上,S2PL可能是使用最广泛的悲观协议,几乎所有单体数据都依赖S2PL实现可串行化。而在分布式数据库中,甚至需要使用SS2PL来保证可串行化执行,典型的例子是TDSQL。但S2PL模式下,事务持有锁的时间过长,导致系统并发性能较差,所以实际使用中往往不会配置到可串行化级别。这就意味着我们还是没有生产级技术方案,只能期望出现新的方式,既达到可串行化隔离级别,又能有更好的性能。最终,我们等到了一种可能是性能更优的工程化实现,这就是CockroachDB的串行化快照隔离(SSI)。而SSI的核心,就是串行化图检测(SGT)。

串行化图检测(SGT)

SSI是一种隔离级别的命名,最早来自PostgreSQL,CockroachDB沿用了这个名称。它是在SI基础上实现的可串行化隔离。同样,作为SSI核心的SGT也不是CockroachDB首创,学术界早就提出了这个理论,但真正的工程化实现要晚得多。

理论来源:PostgreSQL

PostgreSQL在论文“Serializable Snapshot Isolation in PostgreSQL”中最早提出了SSI的工程实现方案,这篇论文也被VLDB2012收录。

串行化理论的核心是串行化图(Serializable Graph,SG)。这图用来分析数据库事务操作的冲突情况。每个事务是一个节点,事务之间的关系则表示为一条有向边。啥关系可表示为边呢?

串行化图的构建规则是这样的,事务作为节点,当一个操作与另一个操作冲突时,在两个事务节点之间就可以画上一条有向边。事务之间的边的分类:

  • 写读依赖(WR-Dependencies),第二个操作读取了第一个操作写入的值
  • 写写依赖(WW-Dependencies),第二个操作覆盖了第一个操作写入的值
  • 读写反依赖(RW-Antidependencies),第二个操作覆盖了第一个操作读取的值,可能导致读取值过期

案例看咋用这几条规则构建一个简单的串行化图:

图中共三个事务先后执行:

  • 事务T1先执行W(A),T2再执行R(A),所以T1、T2之间存在WR依赖,形成一条T1指向T2的边
  • T2的W(B)与T3的R(B)也是WR依赖
  • T1的W(A)与T3的R(A)之间也是WR依赖

最终产生一个DAG,能构建出DAG,说明相关事务可串行化执行,无需中断任何事务。

可用SGT验证典型死锁情况。事务T1、T2分别以不同顺序写两个数据项,就会形成死锁:

串行化图体现,显然构成环:

RW反向依赖

SGT中,WR依赖和WW依赖都与直觉相符,RW反向依赖较难理解。PostgreSQL论文专门描述了一个RW反向依赖场景。

该场景需维护两张表:

  • 收入表(reciepts),记入当日的收入情况,每行都会记录一个批次号
  • 独立的控制表(current_batch),只有一条记录即当前的批次号。也可把这里的批次号理解为一个工作日

同时,还有三个事务T1、T2、T3:

  • T2记录新的收入(NEW-RECEIPT),从控制表中读取当前的批次号,然后在收入表中插入一条新记录
  • T3负责关闭当前批次(CLOSE-BATCH),将控制表中的批次号递增,意味着后续再发生的收入会划归下一批次
  • T1是报告(REPORT),读取当前控制表的批次号,处理逻辑是用当前已+1的批次号再-1。T1用这个批次号作为条件,读取收据表中的所有记录。查询到这批次,即这一日所有交易

例子很像银行存款系统的日终翻牌。因为T1要报告当天收入,所以要在T3后执行。事务T2记录当天每笔入账,须在T3前执行,这样才能出现在当天报表。三者顺序执行可正常工作,否则异常,如下:

T2先拿到一个批次号x,随后T3执行,批次号关闭后,x这个批次号其实已经过期,但是T2还继续使用x,记录当前的这笔收入。T1正常在T3后执行,此时T2尚未提交,所以T1的报告中漏掉了T2的那笔收入。因为T2使用时过期的批次号x,第二天的报告中也不会统计到这笔收入,最终这笔收入就神奇地消失了。

在理解了这个例子的异常现象后,我们用串行化图方法来验证一下。我们是把事务中的SQL抽象为对数据项的操作,可以得到下面这张图。

img

图中batch是指批次号,reps是指收入情况。

接下来,我们按照先后顺序提取有向边,先由T2.R(batch) -> T3.W(batch),得到T2到T3的RW依赖;再由T3.W(batch)->T1.R(batch),得到 T3到T1的WR依赖;最后由T1.R(reps)->T2.W(reps),得到T1到T2的RW依赖。这样就构成了下面的串行化图。

显然这三个事务之间是存在环的,那么这三个事务就是不能串行化的。

这个异常现象中很有意思的一点是,虽然T1是一个只读事务,但如果没有T1的话,T2与T3不会形成环,依然是可串行化执行的。这里就为我们澄清了一点:我们直觉上认为的只读事务不会影响事务并发机制,其实是不对的。

工程实现:CockroachDB

RW反向依赖是特别存在,在于传统的锁机制无法记录这种情况。因此论文“Serializable Snapshot Isolation in PostgreSQL”提出,增加一种锁SIREAD,记录快照隔离(SI)上所有执行过的读操作(Read),从而识别RW反向依赖。

SIREAD并不是锁,只是一种标识。但这方案面临困境:读操作涉及数据范围太大,跟踪标识带来的成本可能比S2PL还高,也就无法达到最初目标。

CockroachDB做了关键设计,读时间戳缓存(Read Timestamp Cache,RTC)。

RTC

执行任何读取操作时,操作的时间戳都会被记录在所访问节点的本地RTC。当任何写操作访问这节点时,都以将要访问的Key为输入,向RTC查询最大的读时间戳(MRT),如MRT>这写入操作的时间戳,继续写入就会形成RW依赖。这时须终止并重启写入事务,让写入事务拿到一个更大的时间戳重新尝试。

RTC是以Key范围组织读时间戳。这样,当读取操作携带了谓词条件如where子句,对应操作就是个范围读取,会覆盖若干Key,那整个Key的范围也可被记录在RTC。这样处理好处是,可兼容一种特殊情况。

如事务T1第一次范围读取(Range Scan)数据表,where“>=1 and <=5”,读取到1、2、5,T1完成后,事务T2在该表插入4,因为RTC记录范围区间[1,5],所以4也可被检测出存在RW依赖。这个地方,有点像MySQL间隙锁的原理。

RTC是个大小有限,采用LRU淘汰算法的缓存。达存储上限时,最老的时间戳被抛弃。为应对缓存超限,会将RTC中出现过的所有Key上最早的那个读时间戳记录,作为低水位线(Low Water Mark)。如一个写操作将要写的Key不在RTC中,则会返回该低水位线。

相对乐观

SGT的运行机制和传统的S2PL一样属于悲观协议。但SGT没有锁的管理成本,所以性能比S2PL更好。

CockroachDB基于SGT理论进行工程化,使可串行化真正成为生产级可用的隔离级别。从整体并发控制机制看,CockroachDB和上一讲的TiDB一样,虽然在局部看是悲观协议,但因为不符合严格的VRW顺序,所以在全局来看仍是一个相对乐观的协议。

这种乐观协议同样存在[第13讲]提到问题,所以CockroachDB也在原有基础上进行了改良,通过增加全局的锁表(Lock Table),使用加锁的方式,先进行一轮全局有效性验证,确定无冲突的情况下,再使用单个节点的SGT。

总结

  1. 并发控制机制的划分方法很多,没有统一标准,使用Transactional Information Systems : Theory, Algorithms, and the Practice of Concurrency Control and Recovery提出的划分标准,分为悲观协议与乐观协议两种。这里的乐观协议是上一讲提到的狭义乐观协议,悲观协议又分为锁和非锁两大类,我们简单介绍了2PL这一个分支。
  2. 我们回顾了Percolator模型,按照S2PL的定义,Percoloatro本质就是S2PL,因此TiDB的乐观锁也属于S2PL。
  3. S2PL是数据库并发控制的主流技术,但是锁管理复杂,在实现串行化隔离级别时开销太大。而后,我们讨论了非锁协议中的串行化图检测(SGT)。PostgreSQL最早提出了SGT的工程实现方式SSI。CockroachDB在此基础上又进行了优化,降低了SIREAD的开销,是生产级的可串行化隔离。
  4. CockroachDB最初和TiDB一样都是局部采用悲观协议,而不做全局有效性验证,是广义的乐观协议。后来,CockroachDB同样也将乐观协议改为悲观协议,采用的方式是增加全局的锁表,进行全局有效性验证,而后再转入单个的SGT处理。

串行化理论,只有当相关事务形成DAG图时,这些事务才是可串行化的。这个理论不仅适用于SGT,2PL的最终调度结果也同样是DAG图。在更大范围内,批量任务调度时DAG也同样被作为衡量标准,如Spark。

参考

  • 最早的SSI工程实现方案:Serializable Snapshot Isolation in PostgreSQL
  • 按狭义乐观协议和其他悲观协议划分并发控制协议:Transactional Information Systems : Theory, Algorithms, and the Practice of Concurrency Control and Recovery

FAQ

看到SGT使用了DAG检测时,就想到Spark和“环路检测”。所以,知识学到最后,还是需要从底层和基础去探寻答案。

Q:读时间戳缓存RTC,是为防止RW反依赖,这里读时间戳比写时间戳大的判定,是否和分布式数据库的时钟机制有关,如果授时不存在误差,是否就无需RTC设计?

A:RTC设计是为简化SIREAD,不是因为时间误差,就算用TSO没有时间误差,也需要RTC。

Q:有数据库教材将MVCC作为一种重要的并发控制技术,与乐观协议、悲观协议并列。如何理解MVCC与乐观协议、悲观协议的关系呢?

MVCC与乐观、悲观协议无直接关系,因为乐观悲观本质区别在“何时校验冲突”,而 MVCC 是另一层次技术,对冲突检验的时间点没任何影响,不论乐观悲观协议,都可以有 MVCC。

Q:MVCC可看作单个数据的无锁结构吗?乐观锁和悲观锁是全局事务级别的并发控制。

A:MVCC是一种数据库并发控制策略,为每个数据行维护多版本来实现高并发。每个版本都有一个时间戳,因此不同事务可同时访问同一行数据的不同版本,避免了锁竞争和阻塞。

而乐观锁/悲观锁是在事务级别实现并发控制的策略:

  • 乐观锁假设在事务提交时不会发生冲突,因此不会阻塞其他事务的执行
  • 悲观锁则假设在事务执行期间会发生冲突,并在事务执行期间持有锁以防止其他事务对数据进行修改

因此,MVCC和乐观锁、悲观锁都是用于实现并发控制的策略,但MVCC更适于单个数据的无锁结构,且可提供更好并发性能。
关注我,紧跟本系列专栏文章,咱们下篇再续!

作者简介:魔都技术专家兼架构,多家大厂后端一线研发经验,各大技术社区头部专家博主。具有丰富的引领团队经验,深厚业务架构和解决方案的积累。

负责:

  • 中央/分销预订系统性能优化
  • 活动&优惠券等营销中台建设
  • 交易平台及数据中台等架构和开发设计

目前主攻降低软件复杂性设计、构建高可用系统方向。

参考:

  • 编程严选网

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1525131.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Word使用通配符替换

1.通配符替换 使用&#xff08;[通配替换文本]&#xff09; M-MM12-00([0123456789])-0([0123456789])([0123456789])-0([0123456789])([0123456789]) 2.根据自定义格式替换 根据格式、样式替换&#xff0c;如只替换标题的内容&#xff0c;不替换征文

ASP.NET 服务器控件

目录 一、使用的软件 1、下载 2、新建文件&#xff08;写一个简单的web网页&#xff09; 二、相关知识点 1、Web窗体网页的组件 &#xff08;1&#xff09;可视化组件 &#xff08;2&#xff09;用户接口逻辑 2、Web Form网页的代码模型 &#xff08;1&#xff09;单文件…

STM32的USART能否支持9位数据格式话题

1、问题描述 STM32L051 这款单片机。平常的 USART 串口传输是 8 位数据&#xff0c;但是他的项目需要用串口传输 9 位数据。当设置为 8 位数据时&#xff0c;串口响应中断正常。但是&#xff0c;当设置为 9 位数据时&#xff0c;串口就不产生中断了。USART2 的 ISR 寄存器 RXN…

前端基础篇-深入了解 JavaScript(一)

&#x1f525;博客主页&#xff1a; 【小扳_-CSDN博客】 ❤感谢大家点赞&#x1f44d;收藏⭐评论✍ 文章目录 1.0 JavaScript 概述 2.0 JS - 引入方式 3.0 JS - 基础语法 4.0 JS - 数据类型 5.0 JS - 函数 6.0 JS - Array 数组 7.0 JS - String 字符串 1.0 JavaScript 概述…

Java推荐算法——特征加权推荐算法(以申请学校为例)

加权推荐算法 文章目录 加权推荐算法1.推荐算法的简单介绍2.加权推荐算法详细介绍3.代码实现4.总结 1.推荐算法的简单介绍 众所周知&#xff0c;推荐算法有很多种&#xff0c;例如&#xff1a; 1.加权推荐&#xff1a;分为简单的特征加权&#xff0c;以及复杂的混合加权。主要…

Qt文件读写

做一个简单的文件读写&#xff0c;我们把一个结构体内的数据写入到二进制文件中&#xff0c;并重新读取解析。代码结构如下&#xff1a; 项目名称随便起就好了。main.cpp是主函数&#xff1b;DataHandler实现文件的写与读&#xff0c;还要模拟过程&#xff1b;Definition.h放置…

蚁群算法实现 - 全局路径规划算法

参考博客&#xff1a; &#xff08;1&#xff09;【人工智能】蚁群算法(密恐勿入) &#xff08;2&#xff09;计算智能——蚁群算法 &#xff08;3&#xff09;蚁群算法(实例帮助理解) &#xff08;4&#xff09;【数之道 04】解决最优路径问题的妙招-蚁群ACO算法 &#xff08;…

51单片机—DS18B20温度传感器

目录 一.元件介绍及原理 二&#xff0c;应用&#xff1a;DS18B20读取温度 一.元件介绍及原理 1.元件 2.内部介绍 本次元件使用的是单总线 以下为单总线的介绍 时序结构 操作流程 本次需要使用的是SKIP ROM 跳过&#xff0c; CONVERT T温度变化&#xff0c;READ SCRATCHPAD…

IP对讲终端SV-6002 可以选配POE供电方式

18123651365微信 IP对讲终端SV-6002是一款采用了ARMDSP架构&#xff0c;接收网络音频流&#xff0c;实时解码播放&#xff1b;配置了麦克风输入和扬声器输出&#xff0c;作为网络数字广播的播放终端。主要用于银行、部门机构、酒店等场所的网络广播、网络对讲。 I…

华为PixArt-α:高质量、低成本的文生图模型,训练时长只有SD 1.5的10.8%

2024年3月11日由华为诺亚方舟实验室、大连理工大学和香港大学的研究团队共同开发的PixArt-Σ是一款能够直接生成4K分辨率图像的扩散变换模&#xff08;DiT&#xff09;。PixArt-Σ相比其前作PixArt-α&#xff0c;在图像质量和文本提示对齐方面有了显著提升&#xff0c;展示了从…

Mybatis-xml映射文件与动态SQL

xml映射文件 动态SQL <where><if test"name!null">name like concat(%,#{name},%)</if><if test"username!null">and username#{username}</if></where> <!-- collection&#xff1a;遍历的集合--> <!-- …

CoAP计算机协议,应用于物联网

什么是CoAP协议&#xff1f; CoAP&#xff08;Constrained Application Protocol&#xff0c;受限应用协议&#xff09;是一种专为物联网&#xff08;IoT&#xff09;设备和资源受限网络设计的应用层协议。它的诞生也是由于物联网设备大多都是资源限制型的&#xff0c;比如 CP…

HTML详细教程

文章目录 前言一、快速开发网站最简模板二、HTML标签1.编码2.title3.标题4.div和span5.超链接6.图片7.列表8.表格9.input系列10.下拉框11.多行文本 三、GET方式和POST方式1.GET请求2.POST请求 前言 HTML的全称为超文本标记语言&#xff0c;是一种标记语言&#xff0c;是网站开发…

Spring Boot(六十九):利用Alibaba Druid对数据库密码进行加密

1 Alibaba Druid简介 之前介绍过Alibaba Druid的,章节如下,这里就不介绍了: Spring Boot(六十六):集成Alibaba Druid 连接池 这章使用Alibaba Druid进行数据库密码加密,在上面的代码上进行修改,这章只介绍密码加密的步骤。 目前越来越严的安全等级要求,我们在做产品…

RuoYi-Vue开源项目2-前端登录验证码生成过程分析

前端登录验证码实现过程 生成过程分析 生成过程分析 验证码的生成过程简单概括为&#xff1a;前端登录页面加载时&#xff0c;向后端发送一个请求&#xff0c;返回验证码图片给前端页面展示 前端页面加载触发代码&#xff1a; import { getCodeImg } from "/api/login&q…

JavaWeb请求响应

目录 一请求响应 1.1请求响应概述&#xff1a; 1.2网页接口与发送 1.2.1简单参数传输 1.2.2实体参数 1.2.3数组集合参数 ​编辑1.2.4集合参数 1.2.5日期时间的参数 1.2.6Json参数 1.2.7路径参数 小结 1.3响应请求 二请求响应小demo 源码链接&#xff1a; 一请求响…

愈宠引领宠物大健康生态新时代——打造临床医养与新膳食营养的完美融合

愈宠(VetCurePet)创立于2023年&#xff0c;隶属于中创集宠(深圳)科技有限公司&#xff0c;是一家集研发、生产、销售为一体的综合型现代化企业。愈宠致力于打造宠物大健康生态系统&#xff0c;以临床医养新膳食营养自効愈宠健康&#xff0c;旗下产品涵盖宠物膳食食品烘焙处方粮…

蓝桥杯嵌入式2021年第十二届第二场省赛主观题解析

1 题目 2 解析 /* Includes ------------------------------------------------------------------*/ #include "main.h" #include "adc.h" #include "tim.h" #include "gpio.h"/* Private includes ----------------------------…

sql join

-- 创建事实表 CREATE TABLE product_facts (id INT AUTO_INCREMENT PRIMARY KEY,product_name VARCHAR(255),price DECIMAL(10, 2) );-- 插入数据 INSERT INTO product_facts (product_name, price) VALUES (Product A, 100.00); INSERT INTO product_facts (product_name, pr…

【GPT-SOVITS-03】SOVITS 模块-生成模型解析

说明&#xff1a;该系列文章从本人知乎账号迁入&#xff0c;主要原因是知乎图片附件过于模糊。 知乎专栏地址&#xff1a; 语音生成专栏 系列文章地址&#xff1a; 【GPT-SOVITS-01】源码梳理 【GPT-SOVITS-02】GPT模块解析 【GPT-SOVITS-03】SOVITS 模块-生成模型解析 【G…