【Redis-09】Redis哨兵机制的实现原理-Sentinel

news2024/11/27 20:40:29

 Sentinel是Redis高可用性的解决方案:由一个或者多个Sentinel实例组成的哨兵系统监视多个主从服务器,并实现主从服务器的故障转移。

 Sentinel本质上只是一个运行在特殊模式下的Redis服务器,使用以下命令可以启动并初始化一个Sentinel实例:

redis-sentinel /path/../sentinel.conf
redis-server /path/../sentinel.conf --sentinel

 下面我们看一下,启动一个Sentinel实例后,它做了哪些初始化步骤吧。

1. 启动并初始化Sentinel

1.1 初始化服务器

 首先Sentinel也是一台Redis服务器,所以启动后的第一步就是初始化服务器,但是这里的初始化和之前我们普通的Redis服务器不太一样,有些步骤不需要执行,例如载入持久化文件还原数据库状态等等。

1.2 使用Sentinel专用代码

 初始化后的第二步就是将一部分Redis服务器的代码替换成为Sentinel的专用代码,比如服务器的默认端口号,比如Sentinel模式下的命令表等等,正是由于两者使用的命令表不同,所以在哨兵模式下,有些普通键值对命令无法正常执行。

1.3 初始化Sentinel的状态

 接下来Sentinel服务器会初始化一个SentinelState的结构,这里面用于保存和哨兵模式相关的一些状态属性。源代码如下,先混个眼熟,下面我们讲解各部分过能时会用到里面的属性。

struct sentinelState {
	// 当前sentinel的运行id
    char myid[CONFIG_RUN_ID_SIZE+1]; /* This sentinel ID. */
    // 当前纪元
    uint64_t current_epoch;         /* Current epoch. */
    // 所监视的主服务器字典
    dict *masters;      /* Dictionary of master sentinelRedisInstances.
                           Key is the instance name, value is the
                           sentinelRedisInstance structure pointer. */
    int tilt;           /* Are we in TILT mode? */
    int running_scripts;    /* Number of scripts in execution right now. */
    mstime_t tilt_start_time;       /* When TITL started. */
    mstime_t previous_time;         /* Last time we ran the time handler. */
    list *scripts_queue;            /* Queue of user scripts to execute. */
    char *announce_ip;  /* IP addr that is gossiped to other sentinels if
                           not NULL. */
    int announce_port;  /* Port that is gossiped to other sentinels if
                           non zero. */
    unsigned long simfailure_flags; /* Failures simulation. */
    int deny_scripts_reconfig; /* Allow SENTINEL SET ... to change script
                                  paths at runtime? */
} sentinel;

1.4 初始化sentinelState的masters属性

 这个masters属性是一个指针,指向一个dict结构,记录了所有被Sentinel监视的主服务器的信息,记住,这里是主服务器。其中key = 主服务器的名字,value = 主服务器的实例结构(由sentinelRedisInstance结构实现)

 这里提到了**sentinelRedisInstance结构,它可以是主服务器,从服务器或者另一个Sentinel实例。这里仅展示一部分代码片段:

typedef struct sentinelRedisInstance {
    // 该实例当前的状态
    int flags;      /* See SRI_... defines */
    // 该实例的名字
    char *name;     /* Master name from the point of view of this sentinel. */
    // 实例运行的id
    char *runid;    /* Run ID of this instance, or unique ID if is a Sentinel.*/
    // 配置纪元,用于实现故障转义
    uint64_t config_epoch;  /* Configuration epoch. */
    // 实例的地址
    sentinelAddr *addr; /* Master host. */
    ...
} sentinelRedisInstance;

 这里面有一个addr指针,保存着当前实例的ip地址和端口号,指向的是一个sentinelAddr实例,看代码如下所示:

typedef struct sentinelAddr {
    char *ip;	/* 实例的ip地址 */
    int port;	/* 实例的端口号 */
} sentinelAddr;

1.5 创建连向主服务器的网络连接

 初始化Sentinel的最后一步是创建连向被监视主服务器的网络连接,之后Sentinel实例会成为此主服务器的客户端,可以向Redis主服务器发送命令消息,并获取相关回复信息。对于每个被监视的Redis主服务器来说,Sentinel会创建两个连向它们的异步网络:

  1. 一个是命令连接,这个用于发送命令并接受回复消息;
  2. 一个是订阅链接,用于监听__sentinel__:hello频道。

2.获取主服务器的信息

 在初始化一个Sentinel实例并且连接到主服务器之后,Sentinel接下来会以每10s一次的频率,通过命令连接向所有被监视的主服务器发送INTO命令,并通过分析命令回复来获取服务器当前的状态信息。这里会包含两方面的信息,分别是:

  1. 一方面是关于主服务器本身的信息,比如run_id服务器运行id,role角色信息等;
  2. 主服务器下所有从服务器的信息,每个从服务器会通过一个“slave”字符串开头的行记录,基于此,Sentinel无需用户提供,就可以知道所有从服务器的信息。

 通过以上的回复信息,Sentinel就可以对主服务器实例结构的部分信息进行更新,而且会将从服务器的实例记录到主服务器的 slaves字典中,当然如果之前 slaves已经存在此从服务器的实例,会对这部分实例的内容进行更新,这是存在于sentinelRedisInstance里面的一个属性:

typedef struct sentinelRedisInstance {
    ...
    // 表示主服务器下的所有从服务器信息
    dict *slaves;       /* Slaves for this master instance. */
    ...
} sentinelRedisInstance;

 综上,Sentinel监视主从服务器的示意图如下:
在这里插入图片描述

3. 获取从服务器的信息

 通过第二步,Sentinel检测到了从服务器的存在,那么接下来,Sentinel除了会给从服务器创建实例外,还会创建连接到从服务器的命令连接和订阅连接。之后,Sentinel也会以每10s一次的频率通过命令连接向服务器发送 INTO命令。同理根据命令的回复,Sentinel会对从服务器的内容属性进行更新,包括从服务器的运行ID run_id,服务器的role,从服务器的复制偏移量,此从服务器对应主服务器的信息等。

4.发布与订阅消息

4.1 发布消息

 默认情况下,Sentinel会以2s一次的频率向所有监视的主服务器和从服务器,通过命令连接发送以下消息:

PUBLISH __sentinel__hello: "sentinel-ip,sentinel-端口号,sentinel-runid,sentinel-纪元,服务器名称,服务器ip,服务器端口号,服务器纪元"

 通过这条命令,所有服务器都会在这个__sentinel__:hello频道上执行发布操作。

4.2 订阅消息

 Sentinel与主服务器和从服务器建立连接后,会订阅此服务器__sentinel__:hello这个频道。也就是说,Sentinel既通过命令连接要求各服务器向这个频道发送消息,也从这个频道上接收消息,这是为什么呢?
在这里插入图片描述

 其实,对于监视同一个服务器的Sentinel来说,他们会通过监听这个频道获悉正在监听此服务器的其他Sentinel实例,用于更新自己的sentinels字典。所以在接收到__sentinel__:hello这个频道的消息后,Sentinel还要做下面这几件事情:

  1. 更新当前sentinel实例监听主服务器的sentinels字典:当一个Sentinel接收到来自其他Sentinel发来的问候消息时,会分析并提取出其他sentinel和master的参数,并检查自身的sentinels字典里面是否包含此sentinel实例,如果不包含就添加,如果包含会比对数据并进行更新。这里祭出源码:
typedef struct sentinelRedisInstance {
    ...
    // 表示监听当前主服务器下的所有sentinel实例(这里不包含当前的sentinel实例)
    dict *sentinels;    /* Other sentinels monitoring the same master. */
    ...
} sentinelRedisInstance;
  1. 创建与其他Sentinel的命令连接:在经历步骤1之后,如果发现了新的Sentinel实例,会创建一个连接到新Sentinel的命令连接,同理新Sentinel在收到新消息后也会创建与当前Sentinel的链接,最终所有的Sentinel之间,会形成一张相互连接的网络。这里需要注意一下,Sentinel实例之间不会创建订阅链接,所以其实是新上线的Sentinel通过与主服务的订阅链接告诉所有Sentinel实例,然后他们之间再互相创建命令连接。
    在这里插入图片描述

5. 检测主观下线状态

 经过这么多复杂的过程后,Sentinel就会以每秒一次的频率向所有与他创建了命令连接的实例(我们来看一下这些实例有哪些,分别是主服务器、从服务器、其他Sentinel实例)发送PING消息,并通过对方的回复确定是否在线。
 如果实例在指定的时间内(down-after-milliseconds毫秒)没有回复,Sentinel会将此实例标记为下线的状态(flags = SRI_S_DOWN),此实例相对于此Sentinel就进入了主观下线状态。然而对于监视同一个服务器的多个Sentinel实例而言,由于设置的判断阈值时间不一样,会存在其他Sentinel实例判断此服务器仍然在线。

6. 检测客观下线状态

 当Sentinel将一个主服务器判定为主观下线后,为了防止因网络问题误判造成的假死结果,Sentinel会向其他所有的Sentinel实例咨询,当收到足够的主观下线回复后,就会将主服务器标记为客观下线,并进行故障转移,步骤如下:

  1. 源Sentinel向其他Sentinel实例发送询问命令 sentinel is-master-down-by-addr,命令中包含主服务器的ip、端口号、当前纪元等信息。
  2. 其他Sentinel实例接收 sentinel is-master-down-by-addr 命令后检查主服务器的状态(是否SRI_S_DOWN),并回复结果(是否主观下线)
  3. 源Sentinel接收其他Sentinel命令,当反馈的主服务器主观下线数量超过配置的阈值数量(quonum)时,将此服务器的客观下线状态标识(flags = SRI_O_DOWN)打开。

7. 选举领头Sentinel

 经过上面客观下线的判定后,监视下线主服务器的所有Sentinel会进行协商选举出一个领头Sentinel,由领头Sentinel对下线的主服务器进行故障转移。这里需要注意的是,检测主观和客观下线的可能不是一个Sentinel,由于时间先后顺序,监视同一个主服务器的Sentinel实例会陆续执行主观下线到客观下线的判定执行。下面我们看下选举领头Sentinel的选取规则:

  1. 最先判定客观下线的Sentinel实例(称为源1Sentinel)会向监视此服务器的所有Sentinel实例(目标Sentinel)发送 sentinel is-master-down-by-addr ,命令中会包含主服务器的ip、端口号、当前纪元,还有一个自身的runid。
  2. 目标Sentinel由于是首次收到领头Sentinel的选举,此时会将源1Sentinel设置为自身的leader,并给源1Sentinel回复一条命令,命令中包含源1的runid和当前纪元。后面再有其他Sentinel要求此目标Sentinel选举自身当leader的命令到来,都会被目标Sentinel拒绝,因为在当前纪元只能有一次选举权。
  3. 源1Sentinel接收到目标Sentinel的命令消息后,判断纪元和runid与自身的值是否相同,如果相同,那么表示目标已经将源1自己设置为领头Sentinel了。在向所有目标Sentinel发送完命后,如果源1收集到半数以上的回复后,就会成为最终的领头Sentinel。
  4. 下面其余陆续发现了服务器客观下线的源2/3/n…Sentinel,也会执行这些动作,看谁先能获得半数以上的投票就会成为leader。当然也可能在给定的时间内,没有一个Sentinel被选举为领头Sentinel,那就会过一段时间后,再次进行选举,步骤相同。

8. 故障转移

 经过第7步,在选举出领头Sentinel后,领头Sentinel会对已下线的主服务器执行故障转移操作,这里面包包含三个步骤:

  1. 从主服务器的从服务器中选举出一个状态良好、数据完整的从服务器,然后向这个从服务器发送slave no one,于是此从服务器转换为主服务器(server2)。这里选举的规则是:
    • 优先选择优先级最高的从服务器;
    • 其次选择偏移量比较高的从服务器;
    • 再次会按照运行ID进行排序,选取最小运行ID的从服务器;
  2. 向已下线主服务器(server1)的其余从服务器发送slaveof的命令,实现更换其余从服务器复制的主服务器目标。
  3. 将已下线的主服务器(server1)设置为从服务器,当已下线的主服务器再次上线时,领头Sentinel就会向他发送slaveof的命令,使得server1成为server2的从服务器。

9. 总结

 以上就是哨兵机制的实现原理,我整理自《Redis设计与实现这本书》,如果您觉得有问题,就给我留言吧,感谢关注和点赞。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1357076.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

面试题:聊聊 SpringBoot 中的 SPI 机制

文章目录 简介Java SPI实现示例说明实现类1实现类2相关测试 源码分析Spring SPISpring 示例定义接口相关实现 相关测试类输出结果源码分析 总结 简介 SPI(Service Provider Interface)是JDK内置的一种服务提供发现机制,可以用来启用框架扩展和替换组件,主要用于框架…

灸哥问答:数据结构对软件开发的作用

在软件开发的浩瀚海洋中,数据结构如同一座坚固的灯塔,为开发者指明方向,确保他们在构建复杂系统时不会迷失。数据结构不仅仅是编程的基础,更是高效、稳定、可扩展软件的核心。 一、提升算法效率 数据结构与算法紧密相连&#xf…

linux 使用iniparser读取.ini文件的配置信息

为什么要用项目配置文件 对于很多程序中要用的参数如果是可变的,那么最好的处理方式就是通过main(int argc,char **argv) 函数参数传递,或者从别的地方去获取,这其中之一就是配置文件,但是在一个成熟和架构完善的系统&#xff0c…

Spring之强大的DefaultListableBeanFactory

系列文章目录 如何查看类继承结构参考这里 文章目录 系列文章目录一、DefaultListableBeanFactory的类继承实现结构二、实现接口 一、DefaultListableBeanFactory的类继承实现结构 二、实现接口 AliasRegistry:支持别名功能,一个名字可以对应多个别名B…

Leetcode2962. 统计最大元素出现至少 K 次的子数组

Every day a Leetcode 题目来源:2962. 统计最大元素出现至少 K 次的子数组 解法1:滑动窗口 算法如下: 设 mx max⁡(nums)。右端点 right 从左到右遍历 nums。遍历到元素 xnums[right] 时,如果 xmx,就把计数器 co…

qt源码阅读准备

qt源码阅读准备 阅读qt源码前先了解以下知识,对阅读qt源码有极大的好处。 D-pointer介绍 D-pointer介绍 d-pointer它可以把一个类库的实施细节对使用的用户隐藏, 而且对实施的更改不会打破二进制兼容。其基本贯穿qt所有类。 Qt类的的结构 我们以QO…

【unity】基于Obi的绳/杆蓝图、绳杆区别及其创建方法

绳索 是通过使用距离和弯曲约束将粒子连接起来而形成的。由于规则粒子没有方向(只有位置),因此无法模拟扭转效应(维基百科),绳子也无法保持其静止形状。然而,与杆不同的是,绳索可以被撕裂/劈开,并且可以在运行时改变其…

第3章 【例题】(完整版)

目录 前言 【例3.1】有关成绩结构体的例子 【例3.2】使用Score类的完整程序 【例 3.3】一个存在错误的程序 【例3.4】用对象赋值语句的例子 【例3.5】为类Score定义一个构造函数 【例3.6】建立对象的同时,用构造函数给数据成员赋初值 【例3.7】用成员初始…

智能手机2024:狂卷“微创新”后如何突破新机遇

文 | 智能相对论 作者 | 楷楷 2023年,智能手机市场终于开始展露曙光。Counterpoint Research数据显示,2023年10月全球智能手机销量同比增长5%,智能手机市场出货量在经历了连续27个月的同比下滑后,首次出现同比正增长。 特别是在…

IDEA卡在”正在解析Maven依赖项“的解决方法

修改Maven镜像,修改Maven镜像为阿里云镜像 1.文件路径 C:\Program Files\JetBrains\IntelliJ IDEA 2022.2.3\plugins 2.因为我使用的是InteliJ idea 自带的Maven,所以直接去idea 插件安装目录,找到Maven插件,找到setting.xml 文…

Linux第4步_安装VMwareTools

安装Ubuntu操作系统后,就可以安装VMwareTools了,目的是实现“电脑和虚拟机之间互相复制粘贴文件”。 1、双击桌面图标“VMware Workstation Pro”,然后点击下图中的“开机”,打开虚拟机电源。 2、双击下图中的用户名“zgq” 3、…

Ubuntu上使用node搭建本地静态http服务器

1.搭建步骤 1.安装Node.js。首先确保你的Ubuntu系统已经安装了Node.js。如果没有安装,可以通过以下命令进行安装: sudo apt-get update sudo apt-get install nodejs #安装nodejs 2.安装npm。npm是Node.js的包管理器,一般会随着Node.js一…

面试算法90:环形房屋偷盗

题目 一条环形街道上有若干房屋。输入一个数组表示该条街道上的房屋内财产的数量。如果这条街道上相邻的两幢房屋被盗就会自动触发报警系统。请计算小偷在这条街道上最多能偷取的财产的数量。例如,街道上5家的财产用数组[2,3,4,5…

【Filament】加载obj和fbx模型

1 前言 3D 模型的常用格式主要有 obj、fbx、gltf 等,Filament 中的 filamesh.exe 工具可以将 obj、fbx 格式转换为 filamesh 格式,然后再加载显示。对于 gltf 格式模型,可以通过 ModelViewer 加载显示,这不在本文的讨论范围内。 1…

【Java基础篇】常见的字符编码、以及它们的区别

常见的字符编码、以及它们的区别 ✔️ 解析✔️扩展知识仓✔️Unicode和UTF-8有啥关系?✔️有了UTF-8,为什么要出现GBK✔️为什么会出现乱码 ✔️ 解析 就像电报只能发出 ”滴” 和 ”答” 声一样,计算机只认识 0 和 1 两种字符,但是&#x…

Python从入门到网络爬虫(函数详解)

前言 函数是变成语言中最常见的语法,函数的本质就是功能的封装。使用函数可以大大提高编程效率与程序的可读性。函数是能够实现特定功能的计算机代码而已,他是一种特定的代码组结构。 函数的作用 1.提升代码的重复利用率,避免重复开发相同代…

ssm基于vue框架和elementui组件的手机官网论文

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本手机官网就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息&#x…

【UEFI基础】EDK网络框架(UNDI)

UNDI UNDI代码综述 UNDI全称Universal Network Driver Interface,它虽然属于UEFI网络框架的一部分,但是并没有在EDK开源代码中实现。不过目前主流网卡厂商都会提供UEFI下的网络驱动,并且大部分都实现了UNDI,这样BIOS下就可以通过…

鸿蒙APP上线注意事项

在将鸿蒙APP上线之前,开发者需要注意一些关键的事项,以确保应用的顺利发布和良好运营。以下是一些建议的注意事项,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1.遵循应用市…

【常用排序算法】冒泡排序

冒泡排序 冒泡排序基本思想:N 个数的数组,经过N-1轮排序。 升序 大的值下沉,小的值上浮。降序 小的值下沉,小的字上浮 import java.util.Arrays; public class BubbleSort {public static void main(String[] args) {int[] values…