Redis 分布式集群方案 Cluster

news2025/1/12 2:56:06

引言

相比于Codis,Redis Cluster是Redis官方提供的解决方案。相比于Codis的不同,他是去中心化的,如图所示,该集群有三个Redis节点组成,每个节点负责整个集群的一部分数据,每个节点负责的数据多少可能不一样。三个节点相互连接组成一个对等的集群,他们之间通过一种特殊的二进制协议(Gossip)相互交互集群信息
在这里插入图片描述

Redis Cluster 将所有数据划分成16384个slots,相比Codis的1024个槽划分的更为精细,每个节点负责其中一部分槽位。槽位的信息存储于每个节点中,他不像Codis,他不需要另外的分布式存储来存储节点槽位信息

当Redis Cluster的客户端来连接集群时,他也会得到一份集群的槽位配置信息。这样当客户端要查找某个key时,可以直接定位到目标节点。

槽位定位算法

Cluster默认会对key值使用crc32算法进行hash得到一个整数值,然后用这个整数值对16384进行取模来得到具体槽位。

跳转

当客户端向一个错误的节点发出了指令,该节点会发现指令的key所在的槽位并不归自己管理,这时他会向客户端发送一个特殊的跳转指令携带目标操作的节点地址,告诉客户端去连这个节点去获取数据。

Get x - MOVED 3999 127.0.0.1:6381

MOVED 指令的第一个参数3999 是key对应的槽位编号,后面是目标节点地址。
MOVED 前面有一个 - , 表示该指令是一个错误消息。

客户端收到MOVED指令后,会立即纠正本地的槽位映射表。后续所有key将使用新的槽位映射表。

迁移

迁移过程

在这里插入图片描述
Redis迁移单位是槽,Redis是一个槽一个槽进行迁移,当一个槽正在迁移时,这个槽就处于中间过渡状态。这个槽在原节点的状态为migrating,在目标节点的状态为importing,表示数据正在从源流向目标。

迁移工具redis-trib首先 1. 会在源和目标节点设置好中间过渡状态,然后 2. 一次性获取源节点槽位的所有key列表(keysinslot指令,可以部分获取),在挨个key进行迁移。每个key的迁移过程是以原节点作为目标节点的客户端。3. 原节点对当前的key执行dump指令得到序列化的内容,然后向目标节点发送指令restore携带序列化的内容作为参数,目标节点在进行反序列化就可以将内容恢复到目标节点的内存中4. 原节点收到目标节点的ok响应后就把当前节点的key删除掉就完成了单个key迁移的整个过程

从源节点获取内容 => 存到目标节点 => 从源节点删除内容

这里的迁移过程是同步的,在目标节点执行restore指令到原节点删除key之间,原节点的主线程会处于阻塞状态,直到key删除成功。

如果迁移过程中突然出现网络故障,整个slot的迁移只进行了一半,这时两个节点依旧处于中间过渡状态,待下一次迁移工具重新连上时,会继续进行迁移。

在迁移过程中,如果每个key的内容都很小,migrate指令执行会很快,就不会影响客户端的正常访问。如果key的内容很大,因为migrate指令是阻塞指令会同时导致原节点和目标节点卡顿,影响集群稳定性。所以 在集群环境下业务逻辑要尽可能避免大key的产生。

Asking

在迁移过程中,客户端访问的流程会有很大的变化。

首先新旧两个节点对应的槽位都存在部分key数据,客户端先尝试访问旧节点,如果对应得数据还在旧节点里面,那么旧节点正常处理。如果对应的数据不在旧节点里面,那么有两种可能,要么该数据在新节点里,要么根本不存在。旧节点不知道属于哪种情况,所以他会向客户端返回一个-ASK targetNodeAddr重定向指令,客户端收到这个重定向指令后,先向目标节点执行一个不带任何参数的asking指令,然后在目标节点在重新执行原先的操作指令。

容错

Redis Cluster可以为每个主节点设置若干个从节点,单主节点故障时,集群会自动将其中某个从节点提升为主节点。如果某个主节点没有从节点,那么当他发生故障时,集群将完全处于不可用状态。

网络抖动

Redis Cluster提供了一种选项 cluster-node-timeout,表示当某个节点持续timeout的时间失联时,才可以认定该节点出现故障,需要进行主从切换。如果没有这个选项,网络抖动会导致主从频繁切换。

可能下线与确定下线

因为Redis Cluster是去中心化的,一个节点认为某个节点失联了并不代表所有节点都认为他失联。所以集群还得经过一次协商的过程,只有当大多数节点都认定了某个节点失联了,集群才认为该节点需要进行主从切换来容错。

Redis集群节点采用Gossip协议来广播自己的状态以及自己对整个集群认知的改变。比如一个节点发现某个节点失联了,他会将这条信息向整个集群广播,其他节点也就可以收到这条失联信息。如果一个节点收到了某个节点失联的数量已经达到了集群的大多数,就可以标记该节点为确定下线状态,然后向整个集群广播,强迫其他节点也接受该节点已经下线的事实,并立即对该失联节点进行主从切换。

槽位迁移感知

如果Cluster中某个槽位正在迁移或者已经迁移完了,client如何能感知到槽位的变化?客户端保存了槽位和节点的映射关系表,他需要即时得到更新,才可以正常的将某条指令发到正确的节点中。

前面所述两个特殊的error指令,一个是moved一个是asking。

第一个moved是用来纠正槽位的,如果我们将指令发送到了错误的节点,该节点发现对应的指令槽位不归自己管理,就会将目标节点的地址随同moved指令回复给客户端通知客户端去目标节点去访问。这个时候客户端就会刷新自己的槽位关系表,然后重试指令,后续所有打在该槽位的指令都会转到目标节点。

第二个asking指令和moved不一样,他是用来临时纠正槽位的。如果当前槽位正处于迁移中,指令会先被发送到槽位所在的旧节点,如果旧节点存在数据,那就直接返回结果,如果不存在,那么他可能真的不存在也可能被迁移到其他节点上。所以旧节点会通知客户端去新节点尝试拿数据,看看新节点有没有,这时候就会给客户端返回一个asking error携带上目标节点的地址。客户端收到这个asking error后,就会去目标节点尝试,客户端不会刷新槽位映射关系表,因为他只是临时纠正该指令的槽位信息。

集群变更感知

当服务器节点变更时,客户端应该及时得到通知以实时刷新自己的节点关系表。客户端如何得到通知,需要分成以下2种情况

  • 目标节点挂掉了:客户端会抛出一个ConnectionError,紧接着会随机挑一个节点来重试,这时被重试的节点会通过moved error告知目标槽位被分配到的新的节点地址。

  • 运维手动修改了配置信息,将master切换到其他节点,并将旧的master移除集群。这时打在旧节点上的指令会收到一个ClusterDown的错误,告知当前节点所在集群不可用。这时客户端会关闭所有连接,清空槽位映射关系表,然后向上层抛出错误。待下一条指令过来时,就会重新尝试初始化节点信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1906757.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AutoCAD二次开发之objectArx开发:专栏内容介绍及目录

1、专栏介绍 1.1 ObjectARX介绍 ObjectARX是AutoDesk公司针对AutoCAD平台上的二次开发而推出的一个开发软件包,它提供了以C为基础的面向对象的开发环境及应用程序接口,能真正快速的访问AutoCAD图形数据库。 与以往的 AutoCAD 二次开发工具 AutoLISP 和A…

怎么样才能为公司申请OV证书?

OV证书,全称为组织验证型SSL证书(Organization Validation SSL Certificate),是一种高级别的SSL/TLS证书,用于加密网站通信并验证网站所属组织的合法身份。相比于基本的域名验证型证书(DV证书)&…

项目收获总结--MyBatis的知识收获

一、概述 最近几天公司项目开发上线完成,做个收获总结吧~ 今天记录MyBatis的收获和提升。 二、获取自动生成的(主)键值 insert 方法总是返回一个 int 值 ,这个值代表的是插入的行数。若表的主键id采用自增长策略,自动生成的键值在 insert…

虽然我不会,但不能没有

大家好,才是真的好。 众所周知,从Notes/Domino R9版本到12版本,增加了不少的新功能和新任务,例如备份还原、自动更新、AD目录同步、自动证书管理、Nomad等等……我这里都要快写不下了。 不过,这些新功能、新任务&…

《SoC设计方法与实现》:全面掌握系统芯片设计精髓(可下载)

SoC(System on Chip,系统级芯片)设计是一项复杂而精细的工程活动,它涉及到将一个完整的电子系统的所有组件集成到一个单一的芯片上,包括处理器核心、内存、输入/输出端口以及可能的其他功能模块。这种集成不仅要求设计…

uniapp/Android App上架三星市场需要下载所需要的SDK

只需添加以下一个权限在AndroidManifest.xml <uses-permission android:name"com.samsung.android.providers.context.permission.WRITE_USE_APP_FEATURE_SURVEY"/>uniapp开发的&#xff0c;需要在App权限配置中加入以上的额外权限&#xff1a;

基于大数据技术Hadoop的气象分析可视化大屏设计和实现

博主介绍&#xff1a;硕士研究生&#xff0c;专注于信息化技术领域开发与管理&#xff0c;会使用java、标准c/c等开发语言&#xff0c;以及毕业项目实战✌ 从事基于java BS架构、CS架构、c/c 编程工作近16年&#xff0c;拥有近12年的管理工作经验&#xff0c;拥有较丰富的技术架…

Django QuerySet对象,exclude()方法

模型参考上一章内容&#xff1a; Django QuerySet对象&#xff0c;filter()方法-CSDN博客 exclude()方法&#xff0c;用于排除符合条件的数据。 1&#xff0c;添加视图函数 Test/app11/views.py from django.shortcuts import render from .models import Postdef index(re…

智能遥测终端机RTU-精确监控 智能运维

智能遥测终端机RTU是物联网领域中一种重要的设备&#xff0c;它的出现无疑为远程监控和数据采集提供了强大的支持。计讯物联智能遥测终端机RTU具备数据采集、处理、通信和控制功能的设备&#xff0c;可以实现对远程设备的监控与控制。它在物联网系统中扮演着桥梁的角色&#xf…

单北斗定位智能终端提倡应用的重要性

单北斗定位智能终端的提倡应用具有重要意义&#xff0c;主要体现在以下几个方面&#xff1a; 一、国家安全与自主可控 自主可控&#xff1a;北斗卫星导航系统是我国自主研发的全球卫星导航系统&#xff0c;全面推广使用国产单北斗定位智能终端&#xff0c;意味着我们将更加依…

希亦、小吉、觉飞内衣洗衣机值得买吗?王牌对决测评还不来看看!

内衣洗衣机是近几年新兴的家电产品&#xff0c;以清洁效果好、除菌能力强&#xff0c;被很多人种草入手了&#xff01;但网上有不少人虽感兴趣&#xff0c;但不清楚如何选。担心买到质量差&#xff0c;清洗不干净的产品。所以为了帮助大家可以更好的了解哪个品牌的内衣洗衣机比…

bash: redi-cli: 未找到命令...

问题描述 在执行命令&#xff1a;redi-cli --bigkeys 提示&#xff1a;bash: redi-cli: 未找到命令... 确定服务器是否有Redis进程 ps -ef | grep redis查找Redis 文件信息 find / -name "redis-*"进入到当前目录 cd /usr/bin/再次执行命令 涉及redis-cli 连…

(三)前端javascript中的数据结构之链表上

在js中&#xff0c;没有为我们提供原生的数据结构支持的&#xff0c;但是在java中是有提供的。所以需要我们去模拟这种结构实现。 链表中最关键的一个元素&#xff0c;就是头节点&#xff0c;头节点不存储数据&#xff0c;指向第一个节点链表中几乎所有的操作都要从头结点开始。…

提高交易决策质量,Anzo Capital昂首资本只需两个交易策略

要想提高交易决策质量&#xff0c;其实很简单&#xff0c;Anzo Capital昂首资本只需两个交易策略&#xff0c;结合价格行为和VSA(成交量与价格分析)就可以达成我们的目的。首先&#xff0c;理解这两个概念&#xff1a; 1. 价格行为&#xff1a;价格行为是市场价格变动的方式&a…

js逆向研究【响应结果解密思路与案例实战】

什么是响应结果加密 我们在爬虫过程中&#xff0c;抓包之后&#xff0c;针对内容关键词搜索无法定位到数据接口&#xff0c;并在响应的接口内发现有编码/不可读的长字符串等&#xff0c;我们可以判定其为响应结果加密。 如何针对将响应结果还原为可读的数据 如果响应结果有特…

高中毕业生,学历低可以考PMP吗?

PMP认证与学历无关&#xff0c;但需要注意报考条件&#xff1a; 学历&#xff1a;满23周岁/高中毕业5年以上/大专毕业3年以上&#xff0c;满足其中一个即可&#xff1b; 证明&#xff1a;必须有35学时&#xff08;PDU&#xff09;证明&#xff0c;即项目管理培训或学习证明&a…

Java | Leetcode Java题解之第220题存在重复元素III

题目&#xff1a; 题解&#xff1a; class Solution {public boolean containsNearbyAlmostDuplicate(int[] nums, int k, int t) {int n nums.length;Map<Long, Long> map new HashMap<Long, Long>();long w (long) t 1;for (int i 0; i < n; i) {long i…

6、Redis系统-数据结构-04-Hash

四、哈希表&#xff08;Hashtable&#xff09; 哈希表是一种高效的键值对数据结构&#xff0c;通过散列函数将键映射到表中的位置&#xff0c;实现快速的插入、删除和查找操作。Redis 广泛使用哈希表来实现 Hash 对象和数据库的键值存储。以下将从结构设计、哈希冲突与链式哈希…

【学术会议征稿】第五届计算机工程与智能控制学术会议(ICCEIC 2024)

第五届计算机工程与智能控制学术会议&#xff08;ICCEIC 2024) 2024 5th International Conference on Computer Engineering and Intelligent Control 第五届计算机工程与智能控制学术会议&#xff08;ICCEIC 2024&#xff09;将于2024年10月18日至22日在广州举办&#xff0…

04-Haproxy搭建Web群集

理论讲解 Haproxy 是目前比较流行的一种群集调度工具&#xff0c;同类群集调度工具有很多&#xff0c;如LVS 和Nginx。相比较而言&#xff0c;LVS 性能最好&#xff0c;但是搭建相对复杂:Nginx的upstream模块支持群集功能&#xff0c;但是对群集节点健康检查功能不强&#xff…