Redis中数据分片与分片策略

news2024/9/22 15:50:49

概述

数据分片是一种将数据分割并存储在多个节点上的技术,可以有效提高系统的扩展性和性能。在Redis中,数据分片主要用于解决单个实例存储容量和性能瓶颈的问题。通过将数据分散存储到多个Redis节点中,可以将负载均衡到不同的服务器上,提高系统的吞吐量和响应速度。

数据分片的原理与实现方式

数据分片是一种将大规模数据分割并存储在多个节点上的技术,旨在提高系统的容量和性能。在Redis中,数据分片的实现方式和原理主要有两种:客户端分片和服务端分片。

客户端分片

客户端分片是指由客户端应用程序负责将数据分割并分配到不同的Redis节点上。具体步骤如下:

  1. 分片规则定义: 客户端根据一定的规则将数据进行分片,通常使用哈希函数或范围规则来确定数据应该存储在哪个节点上。

  2. 分片映射表维护: 客户端维护一个分片映射表,记录每个数据项对应的Redis节点信息,以便于后续的数据读写操作。

  3. 数据路由: 客户端根据分片规则选择合适的Redis节点进行数据操作,确保数据存储和读取的正确性和一致性。

客户端分片的优点是实现简单、灵活性高,但缺点是需要客户端维护分片映射表,并且可能会出现数据倾斜的情况。

服务端分片

服务端分片是指由Redis集群负责将数据分割并存储在多个节点上,客户端无需关心数据的具体分片情况,只需将请求发送到任意一个Redis节点即可。具体步骤如下:

  1. 分片规则定义: Redis集群定义了一套分片规则,用于确定数据应该存储在哪个节点上,通常使用哈希函数或一致性哈希算法来实现。

  2. 数据路由: 客户端将数据请求发送到任意一个Redis节点,集群会根据分片规则将请求路由到正确的节点上进行处理。

  3. 数据分发: Redis集群负责将数据按照分片规则分发到各个节点上进行存储和管理。

服务端分片的优点是实现简单、透明度高,客户端无需关心数据的具体分片情况,但缺点是集群规模的扩展和缩减可能会引起数据的迁移和重新分片,影响系统的稳定性和性能。

选择分片方式的考虑因素

在选择数据分片的方式时,需要考虑以下因素:

  • 系统复杂度: 客户端分片相对较为简单,适用于小规模系统;而服务端分片适用于大规模系统,但实现和维护的复杂度较高。

  • 数据一致性: 服务端分片能够保证数据的一致性和完整性,而客户端分片可能会出现数据不一致的情况。

  • 扩展性和灵活性: 客户端分片具有较高的灵活性,可以根据业务需求定制分片规则,但集群规模的扩展和缩减可能会受到限制;而服务端分片具有较好的扩展性和灵活性,但受制于集群规模的限制。

根据实际业务需求和系统规模,选择合适的数据分片方式是确保系统高效运行和稳定性的关键。

数据分片策略

数据分片是将大规模数据分割成多个部分,并分布存储在不同的节点上,以提高系统的容量和性能。在Redis中,实现数据分片的策略通常包括以下几种:

哈希分片

哈希分片是将数据的键通过哈希函数计算得到哈希值,然后根据哈希值的范围将数据分配到不同的节点上。常见的哈希函数有MD5、SHA1等,可以将数据均匀地分散到不同的节点上。哈希分片的特点是简单高效,但可能会出现数据倾斜的情况,即部分节点存储的数据量过大,而另一部分节点存储的数据量较小。

一致性哈希分片

一致性哈希分片是一种基于一致性哈希算法的数据分片策略,它将数据的键通过哈希函数计算得到哈希值,并将哈希值映射到一个环形的哈希空间中。每个节点在哈希空间中占据一个区域,数据的键根据其哈希值顺时针寻找下一个节点,直到找到一个节点为止。这样可以保证数据在节点之间均匀分布,且节点的增加和删除对数据的影响较小。

范围分片

范围分片是将数据的键按照一定的范围进行划分,并将不同范围的数据存储到不同的节点上。例如,可以根据数据的键的字母顺序或数字大小来划分范围,然后将相应范围内的数据存储到对应的节点上。范围分片的优点是可以根据业务需求灵活划分数据的范围,但可能会出现数据不均匀分布的情况。

混合分片

混合分片是将多种分片策略结合起来使用,以充分利用各种分片策略的优点,提高数据的均匀分布和系统的容错能力。例如,可以先使用一致性哈希分片将数据分配到不同的虚拟节点上,然后再使用范围分片将虚拟节点分配到不同的物理节点上,以实现数据的均匀分布和节点的负载均衡。

数据分片策略的选择

在选择数据分片策略时,需要考虑以下因素:

  • 数据均衡性: 数据分片策略应确保数据在各个节点上均匀分布,避免出现数据倾斜的情况。

  • 节点扩缩容: 数据分片策略应具备良好的扩缩容性能,当节点数量发生变化时,能够尽量减少数据迁移的成本。

  • 系统复杂度: 数据分片策略应尽量简单易实现,降低系统的复杂度和维护成本。

  • 数据一致性: 数据分片策略应保证数据的一致性和完整性,避免数据丢失或损坏的情况。

根据实际业务需求和系统规模,选择合适的数据分片策略是确保系统高效运行和稳定性的关键。

一致性哈希算法

  1. 首先求出服务器(节点)的哈希值,并将其配置到0~2^32的圆(continuum)上。

  2. 然后采用同样的方法求出存储数据的键的哈希值,并映射到相同的圆上。

  3. 然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器上。如果超过2^32仍然找不到服务器,就会保存到第一台服务器上。

Redis集群分片机制

Redis 集群没有使用一致性hash, 而是引入了哈希槽的概念。

Redis Cluster 采用虚拟哈希槽分区,所有的键根据哈希函数映射到 0 ~ 16383 整数槽内,每个key通过CRC16校验后对16384取模来决定放置哪个槽(Slot),每一个节点负责维护一部分槽以及槽所映射的键值数据。在Redis Cluster中,只有Master才拥有槽的所有权,如果是某个Master的slave,这个slave只负责槽的使用,但是没有所有权。计算公式:slot = CRC16(key) % 16383。

(1)假设主节点的数量为3,将16384个槽位按照用户自己的规则手动去分配这3个节点,16384除以3,那么每个节点大约得到5460个槽。(用户自定义分配的原因在于有些机器的配置高,有些机器的配置低,配置高的可以分配多一点槽位,配置低的可以分配少一点槽位)

图中定义的规则是平均分配槽位:

  1. 节点1的槽位区间范围为0-5460,

  2. 节点2的槽位区间范围为5461-10922

  3. 节点3的槽位区间范围为10923-16383

(2)存储数据时,对要存储的键进行crc16哈希运算,得到一个值,并取模16384,判断这个值在哪个节点的范围区间。

假设crc16(“test_key”)%16384=3345,

因为3345在区间0-5460之间,

所以test_key数据写入到节点1里面。

(3)查询数据时,对要查询的键进行crc16哈希运算,得到一个值,并取模16384,判断这个值在哪个节点的范围区间。

假设crc16(“test_key”)%16384=3345,

因为3345在区间0-5460之间,

所以test_key数据应该从节点1里面获取。

以上就是redis集群采用的虚拟哈希槽的原理和计算规则说明,是不是没有想象的那么复杂。

这种结构很容易添加或者删除节点,并且无论是添加删除或者修改某一个节点,都不会造成集群不可用的状态。使用哈希槽的好处就在于可以方便的添加或移除节点。

  1. 当需要增加节点时,只需要把其他节点的某些哈希槽挪到新节点就可以了。

  2. 当需要移除节点时,只需要把移除节点上的哈希槽挪到其他节点就可以了。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1932853.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

防火墙之双机热备篇

为什么要在防火墙上配置双机热备技术呢? 相信大家都知道,为了提高可靠性,避免单点故障 肯定有聪明的小伙伴会想到那为什么不直接多配置两台防火墙,然后再将他们进行线路冗余,不就完成备份了吗? 答案是不…

UDP客户端、服务端及简易聊天室实现 —— Java

UDP 协议(用户数据包协议) UDP 是无连接通信协议,即在数据传输时,数据的发送端和接收端不建立逻辑连接,简单来说,当客户端向接收端发送数据时,客户端不会确认接收端是否存在,就会发出…

【深度学习教程】

文章目录 pytorch官方教程知识蒸馏:https://pytorch.org/tutorials/beginner/knowledge_distillation_tutorial.html 李宏毅-机器学习/深度学习https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.phphttps://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.phphttp…

深入解析公有IP与私有IP:地址分配与使用限制

IP地址在网络基础设施的建设和维护过程中起着至关重要的作用。作为IP地址的两大类型,公有IP和私有IP各自具有独特的分配机制和使用限制。本文将详细分析两者之间的区别,以帮助读者更好地理解和使用IP地址。 1. 公有IP与私有IP概述 IP地址是网络中的唯一…

Spring Boot 中使用 Resilience4j 实现弹性微服务的简单了解

1. 引言 在微服务架构中,服务的弹性是非常重要的。Resilience4j 是一个轻量级的容错库,专为函数式编程设计,提供了断路器、重试、舱壁、限流器和限时器等功能。 这里不做过多演示,只是查看一下官方案例并换成maven构建相关展示&…

hexo搭建博客(github node git )(失败版本)

HexoGitHub搭建个人博客教程(2023最新版) 搭建失败了 是因为git命令一直报错 打算明天把git和node版本全部重新安装后再弄 同时回顾一下github git 和 node的基础知识 Github新手之路(全过程)(站在前辈的肩膀上的总…

使用 ABBYY FineReader PDF 15 在创建或转换 PDF 时自动生成书签

使用 ABBYY 为 PDF 文件添加书签,可以帮助快速定位文档中的主要内容,也能更方便的梳理出一份文档大纲。 有很多 PDF 文件在创建时并没有编辑书签,这里介绍使用 ABBYY FineReader PDF 15(Win 系统)在 PDF 中自动添加书…

两大国产多模态大模型推荐

GLM-4V 智谱AI 开放平台提供一系列具有不同功能和定价的大模型,包括通用大模型、超拟人大模型、图像大模型、向量大模型等,并且支持使用您的私有数据对模型进行微调。GLM-4V 就是在不牺牲任何NLP任务性能的情况下,实现了视觉语言特征的深度融…

网络编程-TCP/IP

网络概述 网络采用分而治之的方法设计,将网络的功能划分为不同的模块,以分层的形式有机组合在一起。 每层实现不同的功能,其内部实现方法对外部其他层次来说是透明的。每层向上层提供服务,同时使用下层提供的服务 网络体系结构…

【LeetCode】删除排序链表中的重复元素 II

目录 一、题目二、解法完整代码 一、题目 给定一个已排序的链表的头 head , 删除原始链表中所有重复数字的节点,只留下不同的数字 。返回 已排序的链表 。 示例 1: 输入:head [1,2,3,3,4,4,5] 输出:[1,2,5] 示例 …

WEB前端06-DOM对象

BOM浏览器对象模型 浏览器对象模型:将浏览器的各个组成部分封装成对象。是用于描述浏览器中对象与对象之间层次关系的模型,提供了独立于页面内容、并能够与浏览器窗口进行交互的对象结构。 组成部分 Window:浏览器窗口对象 Navigator&…

win11局域网共享打印机或者文件提示:\\计算机名 无法访问。你可没有权限使用网络资源。请与这台服务器的管理员联系以查明你是香有访问权限。网络不存在或尚未启动。解决方法

win11局域网共享打印机或者文件提示:\\计算机名 无法访问。你可没有权限使用网络资源。请与这台服务器的管理员联系以查明你是香有访问权限。网络不存在或尚未启动。 是因为win11更新会默认关闭不安全的SMB1协议,导致局域网共享不可用。既然这样&#xf…

Web开发:四角线框效果(HTML、CSS、JavaScript)

目录 一、实现效果 二、完整代码 三、页面准备 1、页面结构 2、初始样式 3、现有效果 三、线框实现 1、需求分析 2、线框结构 3、线框大小 4、线框位置 5、线框样式 6、移动线框 7、添加过渡效果 8、使用CSS变量 一、实现效果 如下图所示,当鼠标移动…

项目管理进阶之RACI矩阵

前言 项目管理进阶系列续新篇。 RACI?这个是什么矩阵,有什么用途? 在项目管理过程中,如Team规模超5以上时,则有必要采用科学的管理方式,满足工作需要。否则可能事倍功半。 Q:什么是RACI矩阵 …

SQL面试题练习 —— 查询每个用户最大连续登录天数

目录 1 题目2 建表语句3 题解 1 题目 查询每个用户最大连续登录天数 样例数据如下 login_log: 2 建表语句 --建表语句 create table if not exists login_log (user_id int comment 用户id,login_time date comment 登录时间 ); --数据插入 INSERT overwrit…

N Puzzle (数字推盘游戏)

N Puzzle [数字推盘游戏] 1. 15 Puzzle2. N PuzzleReferences puzzle /ˈpʌzl/:n. 谜,智力游戏,疑问,不解之谜,令人费解的事 vt. 迷惑,使困惑1. 15 Puzzle https://en.wikipedia.org/wiki/15_puzzle The…

Python 在Word表格中插入、删除行或列

Word文档中的表格可以用于组织和展示数据。在实际应用过程中,有时为了调整表格的结构或适应不同的数据展示需求,我们可能会需要插入、删除行或列。以下提供了几种使用Python在Word表格中插入或删除行、列的方法供参考: 文章目录 Python 在Wo…

Qt QProcess 进程间通信读写数据通信

本文介绍了如何使用Qt的QProcess 进行程序开发,包括启动进程间通信、设置环境变量、通用方法;方便在日常开发中使用; 1.使用Qt进行程序开发,可以通过QProcess类用于启动外部程序并与其进行通信.; 进程A(…

【时时三省】tessy 集成测试:小白入门指导手册

目录 1,创建集成测试模块且分析源文件 2,设置测试环境 3,TIE界面设置相关函数 4,SCE界面增加用例 5,编辑数据 6,用例所对应的测试函数序列 7,添加 work task 函数 8,为测试场景添加函数 9,为函数赋值 10,编辑时间序列的数值 11,执行用例 12,其他注意事项…

Hadoop3:MR程序的数据倾斜问题处理

一、数据倾斜 什么是数据倾斜? 学过Redis集群的都知道数据倾斜这个问题。 就是大量数据,分配不均匀的现象。 二、MR数据倾斜 1、怎么判断出现数据倾斜? 数据频率倾斜——某一个区域的数据量要远远大于其他区域。 数据大小倾斜——部分记…