分布式相关理论详解

news2025/1/15 17:18:51

目录

 

1.绪论

2.什么是分布式系统,和集群的区别

3.CAP理论

3.1 什么是CAP理论

3.2 一致性

3.2.1 计算机的一致性说明

1.事务中的一致性

2.并发场景下的一致性

3.分布式场景下的一致性

3.2.2 一致性分类

3.2.3 强一致性

1.线性一致性

a) 定义

a) Raft算法是如何实现线性一致性的

2.顺序一致性

a)顺序一致性的定义

b) 顺序一致性和线性一致性的区别

c) zookeeper是如何实现顺序一致性的

3.2.4 弱一致性

3.2.5 最终一致性

3.3 可用性

3.4 分区容忍性

3.5 CAP组合

4.Base理论

4.1 Base理论的定义

4.1.1基本可用

4.1.2  软状态

4.1.3 最终一致性

5.拜占庭将军问题

6.引用


 

1.绪论

本文主要介绍的分布是系统中的一些常见的理论知识,比如CAP理论,BASE理论,拜占庭将军问题等。

2.什么是分布式系统,和集群的区别

分布式系统就是将整个系统根据业务拆分多个微服务,服务之间通过Rpc进行通信。

集群是将多个相同应用部署到不同的集群模式上,本质上是为了提高吞吐量已经保证高可用性。

3.CAP理论

3.1 什么是CAP理论

CAP理论是分布式系统的理论基础,即一个分布式系统最多满足CAP这三项中的两项。即只能满足一致性(Consistance)、可用性(Aviablity)、分区容忍性(Partition tolerance)中的两项。

3.2 一致性

在CAP理论中,一致性指的是,每次读取到的数据一定是当前最新的数据,否者报错。可以看出一致性其实指的是强一致性。

3.2.1 计算机的一致性说明

在计算机中机中有很多地方都会出现一致性这个概念,我们也经常将他们混淆一谈,这里将根据我的经验,来说明不同的一致性表达的含义。

1.事务中的一致性

事务有4个性质,分别是ACID,原子性,一致性,隔离性,持久性。什么是一致性呢?我认为这里的一致性是事务的操作逻辑应该客观事实一致。比如,张三向李四转账50元,张三卡中减少50,李四增加50,钱的总数是不变的。如果张三卡中减少50,而李四卡中余额未变,相当于钱的总数增加50,这是不符合客观事实的。

2.并发场景下的一致性

在并发场景下,由于资源的共享,导致锁竞争,所以可能出现每次请求到结果是不一样的问题,这样就会出现一致性问题。

3.分布式场景下的一致性

分布式场景下的一致性其实是并发场景下的一致性的演变。我们可以想象,分布式场景下,由于有副本的概念,可能因为同步时延问题,或者其他问题,导致不同的副本之间数据是不完全一致的,所以访问不同的节点,会有不同的结果,这也会有一致性问题。

那为什么说这个一致性是并发场景下一致性的演变呢?在JMM里面我们讲到过为什么会有一致性问题,主要原因是java的缓存采用二级缓存的方式,线程A读取本地缓存前,可能线程B更新数据到了共享缓存中,但是线程A读取到的还是老数据。所以这里一致性本质上是解决线程A、B、C的本地缓存之间数据不一致问题。

1c06efd037594540821e26389978fc50.png

由于不同副本之间需要网络同步,所以在同一个时刻,不同的客户端访问不同的节点可能得到的数据是不一致的。

5f6a5ba4cb114843adae3e5ae3e0eb93.png

可以看出,并发场景下的一致性和分布式系统中的一致性其实都是为了解决同一个时刻多个副本之间数据一致的问题。

3.2.2 一致性分类

我们这里主要介绍的是分布式场景下的一致性问题,这里一致性主要分为强一致性,弱一致性和最终一致性。

3.2.3 强一致性

1.线性一致性

a) 定义

线性一致性是要求最高的一种一致性,他要求无论从哪个副本读取数据,一定读到的是当前整个集群里面最新的数据。其实在并发的一致性中,我们可以常用加悲观锁的方式,使得整个程序像是在单线程中执行一样。

像Paxos、Raft等共识算法其实就实现了线性一致性。

a) Raft算法是如何实现线性一致性的

在讲Raft算法是如何实现一致性之前,我们先来大概了解一下Raft算法接受写请求的原理,其实就是通过二阶段提交来保证数据的一致性。Raft算法详细介绍可以看深度解析RocketMq源码-高可用存储组件(一) raft协议详解

1.主节点接收写请求

2.主节点向所有的从节点发送预写请求

3.从节点返回ack给主节点

4.当主节点收到超过半数的从节点返回ack过后,将数据commit并且应用到状态机中。

5.向所有的从节点发送commit请求,从节点将数据应用到状态机中。

注:这里状态机是什么,Raft算法是一个共识算法,目的是为了让所有节点达成共识,也即可以将客户端接收的数据写入到磁盘中,而写入磁盘这个动作其实就是交给状态机来实现的。状态机其实就是应用Raft算法达到共识过后的逻辑处理。

我们知道,Raft算法的写请求只能交给主节点处理,我们如果要保证线性一致性的话,可以在有写请求到达的时候,将全部节点加锁,此时所有节点不能处理任何请求,当主节点接收请求并且应用到状态机中过后,同时将数据同步给所有的节点都成功(不只是半数以上节点成功)才给客户端返回成功,并且释放锁。这样,后面所有的读请求无论访问哪个节点,数据一定是一样的。但是这样性能太低,所以Raft算法是如何实现的呢?

1.写写顺序性:写请求只能交给主节点处理,并且Raft算法是交给主线程来处理写请求的,这样其实就保证了写写的顺序性。

2.写读顺序性:当读请求来的时候。如果访问的是主节点,主节点首先会判断当的lastApplyIndex和lastCommitIndex是否相等,如果不相等便等待。这里lastApplyIndex表示的是最后的应用状态机的index,lastCommitIndex表示的是最后达成共识的index,因为主节点可能在达成共识过后,就给客户端返回成功,但是还没有将数据应用到状态机,如果此时有读请求到达主节点,会返回老数据;如果访问的的是从节点,从节点首先会发送一个请求获取lastCommitIndex的请求到达主节点,只有当前从节点的lastApplyIndex和主节点的lastCommitIndex相等,才能返回数据,此时一定返回的是最新的数据。

2.顺序一致性

a)顺序一致性的定义

顺序一致性主要满足两点:

1.对于单个线程来说,它的所有操作一定是保证顺序性的;

2.对于多个线程的写操作,需要需要按照时间排列。即所有线程的写操作是放到一个队列中,先到达的写先被读取。

b) 顺序一致性和线性一致性的区别

对于写写的关系,顺序一致性和线性一致性都要求全局有序;对于写读操作,线性一致性要求全局写读有序,但是顺序一致性只要求本线程类写读有序。比如客户端A更新了集群的数据,客户端B来读取数据,如果是线性一致性,一定能够读取到客户端A更新的数据。如果是顺序一致性,客户端B可能读取老数据,但是在过一定的时间后,一定能够读取到A更新的数据。

c) zookeeper是如何实现顺序一致性的

zookeeper是采用自己的zab协议来实现顺序一致性的。就我的理解,zab中的顺序一致性其实只实现了写写的顺序性,没有实现单个客户端之间写读的顺序性。我们来看看zab是如何实现写写的一致性的。

1.和Raft协议一样,zab也是一个单主节点共识算法,所以他会通过选举得到一个主节点,来接收写请求。

2.如果写请求到达的时候,会给每个日志维护一个全局递增的zxid,并且采用二阶段提交的方式将数据同步给从节点。

3.当超过半数以上的节点返回同步成功(ack)响应的时候,主节点会将数据应用到状态机中,并且给从节点发送应用请求。

4.从节点应用数据到状态机。

可以看出zab协议和raft协议的最本质的区别就是否实现线性一致性读(保证写读的顺序性),这也是线性一致性和顺序一致性最本质的区别。

3.2.4 弱一致性

弱一致性包括因果一致性,会话一致性等子模型,并不常见,这里不再过多叙述。

3.2.5 最终一致性

最终一致性不关心的请求执行的先后顺序,只关心结果正确的就行。比如有A->B->C三个写请求,最终一致性要求无论你先执行A还是B或者C,只要结果正确,便满足最终一致性。而顺序一致性要求执行结果一定是按照请求到达顺序执行的,这也是最终一种性和顺序一致性的区别。

3.3 可用性

在CAP理论中,可用性指的是,每次读取到的数据一定要返回数据,可以是旧数据。

3.4 分区容忍性

分区容忍性就是当某个网络节点宕机或者丢包的情况下,依然能够向外提供服务。

3.5 CAP组合

cap理论中,c和a其实是天然矛盾的两个性质,所以在分布式系统中是不能够共存的。对于单点系统,其实是保证ca两个性质;而对于zookeeper这种,保证的是cp两个性质; 对于redis其实保证的是ap两个性质。

4.Base理论

4.1 Base理论的定义

base理论主要由基本可用、软状态、最终一致性三个性质组成.

4.1.1基本可用

基本可用指的是服务在某些情况下,比如流量突增等情况下,可以对某些边缘服务进行降级,只保证核心服务可用即可。

4.1.2  软状态

软状态指的是运行系统存在中间状态,比如下下单支付两个微服务,下单成功过后不需要立刻进行支付并支付成功,存在一个中间状态-支付中,这个状态就是软状态。在支付中这个状态中,如果我们扣款失败,可以进行重试,直到扣款成功。

4.1.3 最终一致性

最终一致性在前面已经讲过,其实就是不关心中间状态,只需要保证最后的结果达成一致性即可。

5.拜占庭将军问题

拜占庭将军问题描述的是,拜占庭的一队军队需要攻打一个城市,攻打成功需要不同的将军进行系统决策,但是有些将军可能是叛徒,他们可能发出虚假的信息干扰决策,如何让每个将军在不知道哪些将军是叛徒的情况下做出决策。

常见的解决方式就是就是采用少数服从多数的原则,每个将军会对一个指令进行投票,只要超过半数的将军的投票通过,该协议便被达成共识。只要叛徒数不超过一半,那一定能做出正确的决定。

这个解决方案在Raft协议,zab协议中都会用到,Raft协议和zab协议本质上是为了选举出拥有最新日志的节点成为主节点,这就是将军们的决议。所以在选举的时候,只要超过半数节点同意某个节点成为主节点(选举的规则就是备选举节点拥有比超过半数的节点新的日志),该节点便会升为leader。为了保证叛徒节点不超过半数,Raft协议或者zab协议在同步日志的时候,二阶段提交的时候,要求半数以上节点同步成功日志,才会返回成功,保证了整个集群至少有半数的节点拥有最新日志。

6.引用

[1] 深度剖析zookeeper原理

[2] 手写SOFA-JRAFT:实现线性一致读功能

[3] 分布式系统一致性模型:线性一致性和顺序一致性_线性一致性 顺序一致性-CSDN博客

[4] 图解一致性模型 - 哔哩哔哩

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1950069.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据危机!4大硬盘数据恢复工具,教你如何正确挽回珍贵记忆!

在这个数字化的时代,硬盘里的数据对我们来说简直太重要了。但糟糕的是,数据丢失这种事时不时就会发生,可能是因为不小心删了,硬盘坏了,或者中了病毒。遇到这种情况,很多人可能就慌了,不知道怎么…

鸿蒙(HarmonyOS)下拉选择控件

一、操作环境 操作系统: Windows 11 专业版、IDE:DevEco Studio 3.1.1 Release、SDK:HarmonyOS 3.1.0(API 9) 二、效果图 三、代码 SelectPVComponent.ets Component export default struct SelectPVComponent {Link selection: SelectOption[]priva…

模拟信号介绍

定义: 模拟信号是指用连续变化的物理量表示的信息,其信号的幅度、频率或相位随时间作连续变化,或在一段连续的时间间隔内,其代表信息的特征量可以在任意瞬间呈现为任意数值的信号。我们通常又把模拟信号称为连续信号,它…

挑战房市预测领头羊:KNN vs. 决策树 vs. 线性回归

挑战房市预测领头羊(KNN,决策树,线性回归) 1. 介绍1.1 K最近邻(KNN):与邻居的友谊1.1.1 KNN的基础1.1.2 KNN的运作机制1.1.3 KNN的优缺点 1.2 决策树:解码房价的逻辑树1.2.1 决策树的…

AttributeError: ‘list‘ object has no attribute ‘text‘

AttributeError: ‘list‘ object has no attribute ‘text‘ 目录 AttributeError: ‘list‘ object has no attribute ‘text‘ 【常见模块错误】 【解决方案】 示例代码 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页,我是博主英…

前端三大主流框架Vue React Angular有何不同?

前端主流框架,Vue React Angular,大家可能都经常在使用,Vue React,国内用的较多,Angualr相对用的少一点。但是大家有思考过这三大框架的不同吗? 一、项目的选型上 中小型项目:Vue2、React居多…

人工智能AI合集:Ollama部署对话语言大模型-网页访问

目录 🍅点击这里查看所有博文 随着人工智能技术的飞速发展,AI已经不再是遥不可及的高科技概念,而是逐渐融入到我们的日常生活中。从智能手机的语音助手到家庭中的智能音箱,再到工业自动化和医疗诊断,AI的应用无处不在…

gitee设置ssh公钥密码避免频繁密码验证

gitee中可以创建私有项目,但是在clone或者push都需要输入密码, 比较繁琐。 公钥则可以解决该问题,将私钥放在本地,公钥放在gitee上,当对项目进行操作时带有的私钥会在gitee和公钥进行验证,避免了手动输入密…

港科夜闻 | 香港科大与阿里巴巴合作,计划成立大数据与人工智能联合实验室

关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1、香港科大与阿里巴巴合作,计划成立大数据与人工智能联合实验室。香港科大7月19日与阿里巴巴集团签署合作备忘录,计划成立「香港科技大学–阿里巴巴大数据与人工智能联合实验室」,就生成…

STM32-寄存器DMA配置指南

配置步骤 在STM32F0xx中文参考手册中的DMA部分在开头给出了配置步骤 每个通道都可以在外设寄存器固定地址和存储器地址之间执行 DMA 传输。DMA 传输的数据 量是可编程的,最大达到 65535。每次传输之后相应的计数寄存器都做一次递减操作,直到 计数为&am…

前后端分离的开发模式+YAPI接口文档

博客主页:音符犹如代码系列专栏:JavaWeb关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ 早期的开发模式:前后端混合开发 在这种模式下开发下,…

数组和链表的区别

简介 从定义上讲: 数组和链表都是数据的集合。 1.数组中每个元素都是连续的,通过下标进行访问,当我们获取到下标后,就可以随意访问数组中的值 2.链表中的元素则是不连续的,必须获得链表中某个元素后,才能顺序访问该元…

便携气象站通常用在哪些地方?

推荐型号:TH-PQX5】便携气象站是一种设计轻便、易于携带的气象监测设备,主要用于提供实时气象数据,支持多种领域的应用,包括科研、农业生产、户外活动和应急气象监测等。以下是根据提供的参考资料对便携气象站的详细分析&#xff…

基于k8s快速搭建docker镜像服务的demo

基于k8s快速搭建docker镜像服务的demo 一、环境准备 如标题,你需要环境中有和2个平台,并且服务器上也已经安装好docker服务 接下来我来构建一个docker镜像,然后使用harbork8s来快速部署服务demo 二、部署概述 使用docker构建镜像&#x…

FPGA开发——呼吸灯的设计

一、原理 呼吸灯的原理主要基于‌PWM(脉冲宽度调制)技术,通过控制LED灯的占空比来实现亮度的逐渐变化。这种技术通过调整PWM信号的占空比,即高电平在一个周期内所占的比例,来控制LED灯的亮度。当占空比从0%逐渐变化到1…

springboot项目从jdk8升级为jdk17过程记录

背景:公司有升级项目jdk的规划,计划从jdk8升级到jdk11 开始 首先配置本地的java_home 参考文档:Mac环境下切换JDK版本及不同的maven-CSDN博客 将pom.xml中jdk1.8相关的版本全部改为jdk17,主要是maven编译插件之类的&#xff0c…

使用 MongoDB 向量搜索和 OpenAI 进行反洗钱和预防欺诈

使用 MongoDB Vector Search 和 OpenAI 进行反洗钱和预防欺诈 欺诈和反洗钱 (AML) 是企业和消费者的主要担忧,影响金融服务和电子商务等行业。解决这些问题的传统方法包括静态、基于规则的系统和预测人工智能 (AI) 方法,这些方法虽然有效,但也…

数据结构--单链表代码(王道书上代码手敲!!!)c++

目录 1.带头结点的初始化以及检查单链表是否为空 2.不带头结点的单链表初始化以及表是否为空检查 3.带头结点按位序插入 4.不带头结点的按位序插入 5.带头结点的后插,前插,按位删除,删除固定节点操作 6 不带头结点的后插,前…

算法 —— 暴力枚举

目录 循环枚举 P2241 统计方形(数据加强版) P2089 烤鸡 P1618 三连击(升级版) 子集枚举 P1036 [NOIP2002 普及组] 选数 P1157 组合的输出 排列枚举 P1706 全排列问题 P1088 [NOIP2004 普及组] 火星人 循环枚举 顾名思…

C语言进阶——一文带你深入了解“C语言关键字”(中篇)

本篇文章属于C语言进阶篇的“C语言关键字”,旨在分享我对C语言关键字的深度学习和了解。同时带领大家深入浅出的走进C语言进阶知识——关键字篇! 目录 一、变量的命名规则 二、标识符的命名规则 一、变量的命名规则 1、命名应当直观且可以拼读&#x…