项目难点——【4】分布式事务
1 概述
我们想知道什么是分布式事务首先了解下什么是本地事务。
- 平常我们在程序中通过spring去控制事务是利用数据库本身的事务特性来实现的,因此叫数据 库事务,由于应用主要靠关系数据库来控制事务,而数据库通常和应用在同一个服务器,所以基于关系型数据库的事务又被称为本地事务。
- 本地事务具有ACID四大特性,数据库事务在实现时会将一次事务涉及的所有操作全部纳入到一个不可分割的执行单元,该执行单元中的所有操作 要么都成功,要么都失败,只要其中任一操作执行失败,都将导致整个事务的回滚。
了解了本地事务,那么什么是分布式事务呢?
- 我们现在有一个需求是课程发布后将数据写入数据库、redis、ES、MinIO四个地方。这四个地方已经不限制在一个数据库内,是由四个分散的服务去提供,与这四个服务去通信需要网络通信,而网络存在不可到达性,这种分布式系统环境下,通过与不同的服务进行网络通信去完成事务称之为分布式事务。
在分布式系统中分布式事务的场景很多:
- 例如用户注册送积分,银行转账,创建订单减库存,这些都是分布式事务。
拿转账举例:
# 本地事务
begin transaction;
//1.本地数据库操作:张三减少金额
//2.本地数据库操作:李四增加金额
commit transation;
# 分布式事务
begin transaction;
//1.本地数据库操作:张三减少金额
//2.远程调用:让李四增加金额
commit transation;
- 可以设想,当远程调用让李四增加金额成功了,由于网络问题远程调用并没有返回,此时本地事务提交失败就回滚了张三减少金额的操作,此时张三和李四的数据就不一致了。
- 因此在分布式架构的基础上,传统数据库事务就无法使用了,张三和李四的账户不在一个数据库中甚至不在一个应 用系统里,实现转账事务需要通过远程调用,由于网络问题就会导致分布式事务问题。
1.1 分布式事务应用场景
-
微服务(多服务、多数据库)
-
单服务多数据库
-
多服务单数据库
1.2 CAP理论
控制分布式事务首先需要理解CAP理论,什么是CAP理论?
- CAP是 Consistency、Availability、Partition tolerance三个词语的缩写,分别表示一致性、可用性、分区容忍性。
客户端经过网关访问用户服务的两个结点:
- 一致性是指用户不管访问哪一个结点拿到的数据都是最新的,比如查询小明的信息,不能出现在数据没有改变的情况下两次查询结果不一样。
- 可用性是指任何时候查询用户信息都可以查询到结果,但不保证查询到最新的数据。
- 分区容忍性也叫分区容错性,由于网络通信异常导致请求中断、消息丢失,但服务依然对外提供服务。
CAP理论要强调的是在分布式系统中这三点不可能全部满足,由于是分布式系统就要满足分区容忍性,因为服务之间难免出现网络异常,不能因为局部网络异常导致整个系统不可用。
满足P之后,C和A不能同时满足
"C:一致性"
"A:可用性"
- 如果满足了一致性,那么就需要等到数据同步之后才能访问服务,期间服务不可用
- 如果满足可用性,那么数据可能还没来得及同步,此时是不一致的
1.3 分布式事务控制方案(BASE理论)
学习了CAP理论我们知道进行分布式事务控制要在C和A中作出取舍,保证一致性就不要保证可用性,保证可用性就不要保证一致,首先你确认是要CP还是AP,具体要根据应用场景进行判断。
- CP的场景:满足C舍弃A,强调一致性。
- 跨行转账:一次转账请求要等待双方银行系统都完成整个事务才算完成,只要其中一个失败另一方执行回滚操作。
- 开户操作:在业务系统开户同时要在运营商开户,任何一方开户失败该用户都不可使用,所以要满足CP。
- AP的场景:满足A舍弃C,强调可用性。
- 订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
- 注册送积分,注册成功积分在24分到账。
- 支付短信通信,支付成功发短信,短信发送可以有延迟,甚至没有发送成功。
在实际应用中符合AP的场景较多,其实虽然AP舍弃C一致性,实际上最终数据还是达到了一致,也就满足了最终一致性,所以业界定义了BASE理论。
BASE理论(核心服务可用、存在中间状态、最终一致):
BASE 是 Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent (最终一致性)三个短语的缩写。
- 基本可用:当系统无法满足全部可用时保证核心服务可用即可,比如一个外卖系统,每到中午12点左右系统并发量很高,此时要保证下单流程涉及的服务可用,其它服务暂时不可用。
- 软状态:是指可以存在中间状态,比如:打印自己的社保统计情况,该操作不会立即出现结果,而是提示你打印中,请在XXX时间后查收。虽然出现了中间状态,但最终状态是正确的。
- 最终一致性:退款操作后没有及时到账,经过一定的时间后账户到账,舍弃强一致性,满足最终一致性。
2 分布式事务实战
- 1、执行发布操作,内容管理服务存储课程发布表的同时向消息表添加一条“课程发布任务”。这里使用本地事务保证课程发布信息保存成功,同时消息表也保存成功。
- 2、任务调度服务定时调度内容管理服务扫描消息表,由于课程发布操作后向消息表插入一条课程发布任务,此时扫描到一条任务。
- 3、拿到任务开始执行任务,分别向redis、elasticsearch及文件系统存储数据。
- 4、任务完成后删除消息表记录。
- 执行发布操作,记录到消息表
- 定时任务扫描消息表,进行任务调度
- 任务调度成功,删除消息表记录