raft算法学习备忘

news2025/1/15 13:04:53

一致性共识算法

参考:分布式一致性算法应用场景,写了为什么需要共识算法,以及相比于mysql这些主从同步方式的区别。

raft算法简介

一种分布式一致性共识算法的实现方式,机制相比于其它例如paxos来说无论从可读性还是实现机制上要简单很多,并且可以证明其正确性。raft论文只提出想法与证明,具体实现参考官网下面的Where can I get Raft?章节,包含了各种语言的实现。golang最出名的raft算法实现就是etcd团队开源的。
raft算法将集群划分为一主多从,由主节点接收写操作,所以包含了集群自动选主,如果暂时没有选出主节点,集群是不可用状态,等待选出主节点(一般几百ms内就可以选出主节点)。
主节点负责写操作,并将写操作广播给集群来让半数以上节点保存写操作日志,一旦半数同意,就可以

raft算法核心机制

每个节点拥有一个任期term属性

任期term是个数字,可以认为是王朝代号,每次发起选举自增,follower追随者使用leader主节点的任期
在这里插入图片描述

自动选主-保证有主节点对外提供服务

  • 每个节点初始都是follower追随者状态,开启一个选举超时定时器(一般大于给集群广播消息消耗时间,例如内网100ms-300ms),定时器到了还没收到leader心跳消息,就认为leader死了,自己变成candidate发起选举
  • candidate给集群广播要票消息,带上自己当前任期和最新日志索引
  • follower收到要票消息,只要对方任期比自己大且最新日志索引index都和自己一样或者新(raft叫isUpToDate逻辑),并且先来后到没给别人投过票,就直接投票给对方,candidate收集到半数以上投票就变为leader,或者收集到半数以上拒绝或者超时(例如100-300ms)还没统计完投票就变为follower继续开启走心跳监测
  • leader定时给集群发送心跳广播维持自己的统治
    在这里插入图片描述

日志同步

每个提议开始都由leader发起,leader变为日志条目提交,所以每个日志有个自增索引号,与leader所处任期term。
follower需要与主节点leader保持日志条目统一,raft强制让follower纠正自己的日志来保持和leader一致,具体做法为:

  • leader维持了每个follower的日志索引进度,初始等于leader自己的进度,用心跳消息带上维持的follower进度来探测对方进度,对方只要响应不一致,就递减这个进度并带上follower的进度与leader自己的进度之间的日志条目发送给对方继续探测,直到和对方一致。leader会将半数节点都达到的索引处及之前的日志认为已提交成功
  • follower收到心跳消息,比对对方记录的进度的日志索引和任期是否和自己当前记录的一致,一致就将日志条目追加到自己记录上,否则拒绝leader同步让leader再递减索引来探测
    在这里插入图片描述

leader发起提议(写操作)

提议由leader处理,leader会将提议追加到提议日志目录中,所以每个提议日志条目都有自增索引号,任期term+索引index可以确定一个条目,具体操作:

  • leader收到写操作提议,将提议打包成日志条目追加到自己的条目进度里,走上面日志同步 流程来保持日志进度一致

raft算法额外机制

核心机制便于理解raft如何做到共识,而额外机制保证raft算法达到一致性

leader必须提交一笔空写操作

在这里插入图片描述
如果没有这个机制,会像上图所示:

  • (a)时期:如果S1选为leader,向集群复制日志2
  • (b)时期:S1崩溃,此时S5选为leader,准备给集群复制日志3
  • (c)时期:S5还没来得及复制日志3,也崩溃了,S1重新选为leader,重新发起复制日志2并且接收了日志4,在同步给节点S3后又崩溃了
  • (d)时期:S5重新选为leader会要求整个集群应用自己的日志3,但明明©时期S1已经复制了半数日志给集群了,日志2被错误覆盖
  • (e)时期:如果S1当选能立即提交一个日志4的空操作给半数集群,那么S5是无法获得投票再次当选的,因为任期数小于半数集群认同的任期
    这种机制防止了一些崩溃或者网络分区的情况下,旧leader通过旧任期覆盖一些新数据引起线性一致性问题

follower每次随机一个检查心跳超时时间

节点初始都是follower状态,如果一起启动,用一个选举超时时间,会一起变为candidate参与竞选,大家瓜分选票导致竞选失败再次超时重来无限循环。
因此raft规定follower每次检查心跳超时的时间随机等待,防止同时产生竞选。

遵循:broadcastTime ≪ electionTimeout ≪ MTBF,即广播时间小于竞选超时时间小于节点系统不可用时间

已提交日志不能更改

raft算法将日志条目分为已提交段和未提交的临时段,上面的leader纠正follower日志也只能是未提交段

优化raft集群

通过以上说明只是完成了一个固定集群一致性共识,不是真实商用状态,存在诸多问题需要解决。

配置变更(增删节点)

真实环境动态改变节点不可避免,可以将配置变更也作为日志提交,并且新增的节点不参与集群选举

日志条目压缩

随着集群运行很久,日志条目越来越多,假如是个kv数据库,其实保存set key的最后一条写操作即可,因此每个节点可以单独生成已提交日志的快照后删除已提交条目,后续的日志同步涉及快照内的索引就直接以快照同步

处理读请求

将raft集群看成一个整体,写请求打到follower节点会被路由到leader节点处理,那么读请求呢?
假设客户端提交了一笔写操作马上来读这个操作的值,读到的值和写入的一样,这叫线性一致性。raft集群也要满足线性一致性。如果读请求由follower节点处理,可能follower还没接受到leader同步,数据落后;如果由leader处理,leader是保存当前最新的数据,但是读写都在leader又性能不好。
raft论文讨论了往leader节点读,但是有可能该leader是网络分区下的少数派,所以读之前leader要和集群广播确定和集群通信仍有效。
还有其它方法例如将读请求也作为一次提议,这样半数集群通过就可以直接返回数据。例如租约的形式让follower在选举超时内确认没发起竞选期间有处理读的权限,但是依赖时间比对逻辑,时钟可能发生回拨等存在不安全因素。

etcd实现的raft

尝试读了下最新的etcd raft代码,太过于复杂,一个Step函数各种分支走法,于是切换到2.0.0版本学习了下。结合raft论文和etcd的写了个备忘项目:
golang raft (https://github.com/xlkness/lraft): 链接

以下是最新etcd raft Step方法:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/926992.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MQTT协议抓包

MQTT通讯协议的特点 1. 概述 MQTT(Message Queuing Telemetry Transport,消息队列遥测传输)是IBM开发的一个即时通讯协议,有可能成为物联网的重要组成部分。该协议支持所有平台,几乎可以把所有联网物品和外部连接起来,被用来当做…

html-dom核心内容--四要素

1、结构 HTML DOM (文档对象模型) 当网页被加载时,浏览器会创建页面的文档对象模型(Document Object Model)。 2、核心关注的内容:“元素”,“属性”,“修改样式”,“事件反应”。>四要素…

详解numpy.random.shuffle函数

文章目录 函数原型参数解析该函数的注意事项例子示例代码示例结果 参考 numpy的random模块中的shuffle函数用于np.ndarray数组中的元素打乱顺序,进打乱多维数组的第一维顺序。本博客详细节将该函数的API,并给出示例代码和结果。 函数原型 random.shuff…

【计算机网络】HTTPs 传输流程

HTTPS和HTTP的区别 1、HTTP协议传输的数据都是未加密的,是明文的,使用HTTP协议传输隐私信息非常不安 HTTPS协议是由SSLHTTP协议构建的可进行加密传输、身份认证的网络协议,要比http协议安全。 2、HTTPS协议需要到CA申请证书,一般…

【C++】开源:Box2D动力学库配置与使用

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍Box2D动力学库配置与使用。 无专精则不能成,无涉猎则不能通。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下&#xff0c…

LiveNVR通过海康SDK实现Web无插件播放并实现双向语音对讲的注意事项和配置方法

1、确认摄像头是否支持对讲 可以访问摄像头自己的页面,看是否能够对讲。可以看摄像头的音频编码页面,看看音频输入有没有mic的音频输入。如下: 2、摄像头视频类型复合流 确认摄像头的视频类型,是否是复合流。 3、通道配置SD…

第三批广东省智能制造生态合作伙伴名单公布,科东软件再获殊荣!

8月22日,广东省工业和信息化厅公布了第三批广东省智能制造生态合作伙伴名单。科东软件凭借多年在工业操作系统领域的技术积累和创新实力,成功入选广东省智能制造生态合作伙伴名单(关键软件领域)。 智能制造生态合作伙伴是指为广东…

实现高效消息传递:使用RabbitMQ构建可复用的企业级消息系统

文章目录 前言1.安装erlang 语言2.安装rabbitMQ3. 内网穿透3.1 安装cpolar内网穿透(支持一键自动安装脚本)3.2 创建HTTP隧道 4. 公网远程连接5.固定公网TCP地址5.1 保留一个固定的公网TCP端口地址5.2 配置固定公网TCP端口地址 前言 RabbitMQ是一个在 AMQP(高级消息队列协议)基…

计算机竞赛 基于卷积神经网络的乳腺癌分类 深度学习 医学图像

文章目录 1 前言2 前言3 数据集3.1 良性样本3.2 病变样本 4 开发环境5 代码实现5.1 实现流程5.2 部分代码实现5.2.1 导入库5.2.2 图像加载5.2.3 标记5.2.4 分组5.2.5 构建模型训练 6 分析指标6.1 精度,召回率和F1度量6.2 混淆矩阵 7 结果和结论8 最后 1 前言 &…

ssh免密配置后没生效问题

一、背景 3台linux服务器搭建集群需要互相做ssh免密,按正常流程操作后验证,免密未生效,还需要输入密码,开始了一路问题定位的历程。。。。 原理请移步 linux服务配置ssh免密 二、思路 (一)确认免密操作…

虚拟展览有什么优势?设计虚拟展览时需注意什么?

引言: 在这个数字化飞速发展的时代,虚拟展览作为一种崭新的展示方式,正逐渐走入人们的视野。虚拟展览,顾名思义,是通过数字技术将传统的展览呈现方式转变为虚拟的线上体验。 一、什么是虚拟展览 虚拟展览是一种以数…

【Python脚本】轻松实现12306自动抢票脚本,100%成功,假期出行无忧!

文章目录 前言1.导入需要的模块2.初始化WebDriver:3.打开12306网站:4.登录12306账号:5.进入车票查询页面:6.查询车票:7.选择车次和座位:8.填写乘客信息和提交订单:9.处理验证码:10.确…

powerJob的正确部署方式(server部署,其他worker统统指定这个server)

PowerJob 的设计目标为企业级的分布式任务调度平台,即成为公司内部的任务调度中间件。整个公司统一部署调度中心 powerjob-server,旗下所有业务线应用只需要依赖 powerjob-worker 即可接入调度中心获取任务调度与分布式计算能力。 实现PowerJob的设计目标…

nginx 中新增url请求参数

1、nginx中新增配置: set $args "$args&参数名参数值"; 示例: set $args "$args&demo1cn_yaojin&demo2123123&myip$remote_addr"; location / {add_header Access-Control-Allow-Origin *;add_header Access-Contro…

小红书达人种草指南,投放总结!

提到针对小红书的品牌和产品传播,人们总会提起一个词语,那就是达人种草。今天就来为大家分享一下小红书达人种草指南,投放总结! 一、什么是达人种草 小红书达人种草是一种以达人为核心的产品传播方式。借助达人在粉丝中的影响力&a…

解析直播美颜SDK功能算法:肤色识别、特征增强与实时渲染

在这个数字化时代,美颜技术在直播中的应用愈发受到重视,为主播和观众创造更加美好的视觉体验。本文将深入探讨直播美颜SDK 的核心功能算法,包括肤色识别、特征增强与实时渲染,揭示其背后的技术原理与工作机制。 一、肤色识别算法…

无脑007--Yolov7推理测试

此次项目是为了下一个项目做准备,打算学习一下docker和迁移学习的技术。 1.下载代码和模型 首先从github下载yolov7的官方代码: https://github.com/WongKinYiu/yolov7 直接点击绿色的code,然后点Download zip进行下载 我们把下载好的文件统…

水库大坝安全监测的主要内容包括哪些?

在水库大坝的实时监测中,主要任务是通过无线传感网络监测各个监测点的水位、水压、渗流、流量、扬压力等数据,并在计算机上用数据模式或图形模式进行实时反映,以掌握整个水库大坝的各项变化情况。大坝安全监测系统能实现全天候远程自动监测&a…

EVE-NG MPLS L3VPN 基本组网

1 拓扑 2 配置步骤 2.1 在MPLS节点上配置接口IP 和路由协议 PE1 interface LoopBack 0ip address 1.1.1.9 32 quitinterface GigabitEthernet4/0ip address 172.1.1.1 24quitospf 1area 1network 1.1.1.9 0.0.0.0network 172.1.1.0 0.0.0.255quitquit P interface LoopBac…

数字世界的入口:二维码生成器 API 的实用指南

前言 当今数字化世界中,二维码已经成为了无处不在的存在。无论是商业领域、社交媒体,还是个人生活中,我们都可以看到二维码的身影。它们不仅是一种信息传递的便捷方式,还可以用于营销、身份验证、跟踪和更多用途。本文将介绍二维…