09 Redis之分布式系统(数据分区算法 + 系统搭建与集群操作)

news2024/10/2 10:38:21

6 分布式系统

Redis 分布式系统,官方称为 Redis Cluster,Redis 集群,其是 Redis 3.0 开始推出的分布式解决方案。其可以很好地解决不同 Redis 节点存放不同数据,并将用户请求方便地路由到不同 Redis 的问题。

什么是分布式系统?
每个集群中存储的数据不一致, 但又都为同一个系统服务.

在这里插入图片描述

6.1 数据分区算法

常见的数据分区规则有两大类:顺序分区与哈希分区。

6.1.1 顺序分区

顺序分区规则可以将数据按照某种顺序平均分配到不同的节点。不同的顺序方式,产生了不同的分区算法。例如,轮询分区算法、时间片轮转分区算法、数据块分区算法、业务主题分区算法等。
这些算法都比较简单

6.1.1.1 轮询分区算法

每产生一个数据,就依次分配到不同的节点。该算法适合于数据问题不确定的场景。

在数据总量非常庞大的情况下,每个节点中数据是很平均的。但生产者与数据节点间的连接要长时间保持。

6.1.1.2 时间片轮转分区算法

在某人固定长度的时间片内的数据都会分配到一个节点。时间片结束,再产生的数据就会被分配到下一个节点。这些节点会被依次轮转分配数据。

该算法可能会出现节点数据不平均的情况(因为每个时间片内产生的数据量可能是不同的)。但生产者与节点间的连接只需占用当前正在使用的这个就可以,其它连接使用完毕后就立即释放。

6.1.1.2 数据块分区算法

该算法要求提前确定整体数据总量

根据各个节点的存储能力,提前安排将某一块数据放置于某一节点。

6.1.2 哈希分区算法

哈希分区规则是充分利用数据的哈希值来完成分配,对数据哈希值的不同使用方式产生
了不同的哈希分区算法。
哈希分区算法相对较复杂

6.1.2.1 节点取模分区算法

该算法的前提是,每个节点都已分配好了一个唯一序号,对于 N 个节点的分布式系统,其序号范围为[0, N-1]。然后选取数据本身或可以代表数据特征的数据的一部分作为 key,先计算key的哈希值为hash(key) , 再用hash(key)与节点数量 N 取模,该计算结果即为该数据的存储节点的序号。

该算法最大的优点是简单,但其也存在较严重的不足。如果分布式系统扩容或缩容,已经存储过的数据需要根据新的节点数量 N 进行数据迁移,否则用户根据 key 是无法再找到原来的数据的。

生产中扩容一般采用翻倍扩容方式,以减少扩容时数据迁移的比例。

6.1.2.2 一致性哈希分区算法

在这里插入图片描述

6.1.2.3 虚拟槽分区算法

该算法首先虚拟出一个固定数量的整数集合,该集合中的每个整数称为一个 slot 槽。这个槽的数量一般是远远大于节点数量的。然后再将所有 slot 槽平均映射到各个节点之上。

例如,Redis 分布式系统中共虚拟了 16384 个 slot 槽,其范围为[0, 16383]。假设共有 3 个节点,那么 slot 槽与节点间的映射关系如下图所示:
在这里插入图片描述
而数据只与 slot 槽有关系,与节点没有直接关系。数据只通过其 key 的 hash(key)映射到slot 槽:slot = hash(key) % slotNums。

这也是该算法的一个优点,解耦了数据与节点,客户端无需维护节点,只需维护与 slot 槽的关系即可。 并且支持了负载均衡

Redis 数据分区采用的就是该算法。其计算槽点的公式为:slot = CRC16(key) &16383。其中即位与位之间"与运算" , CRC16()是一种带有校验功能的、具有良好分散功能的、特殊的 hash 算法函数。

我们都知道取模符号是% , 即原本公式应为 :slot = CRC16(key) % 16384


若要计算 a % b,且 b 是 2 的整数次幂,那么 a % b = a & (b-1) ,而位运算明显更快, 因此Redis中采用取模运算.


6.2 分布式系统搭建与运行

6.2.1 系统搭建

6.2.1.1 系统架构

下面要搭建的 Redis 分布式系统由 6 个节点构成,这 6 个节点的地址及角色分别如下表所示。一个 master 配备一个 slave,不过 master 与 slave 的配对关系,在系统搭建成功后会自动分配。
在这里插入图片描述

6.2.1.2 删除持久化文件

先将之前“Redis 主从集群”中在 Redis 安装目录下生成的 RDB 持久化文件 dump638*.conf与 AOF 持久化文件删除。

因为 Redis 分布式系统要求创建在一个空的数据库之上。
在这里插入图片描述

6.2.1.3 创建公共conf和各自的conf
  1. 先在 Redis 安装目录中 mkdir 一个新的目录 cluster-dis,用作分布式系统的工作目录。

  2. 再复制 2 个配置文件, 即原先 cluster 目录中的 redis.conf 与 redis6380.conf

在这里插入图片描述

  1. 修改公共conf文件
    A、 dir
    指定工作目录为前面创建的 cluster-dis 目录。持久化文件、节点配置文件将来都会在工作目录中自动生成。
    在这里插入图片描述
    B、 cluster-enabled
    该属性用于开启 Redis 的集群模式。
    在这里插入图片描述
    C、 cluster-config-file
    该属性用于指定“集群节点”的配置文件。该文件会在第一次节点启动时自动生成,其
    生成的路径是在 dir 属性指定的工作目录中。在集群节点信息发生变化后(如节点下线、故障转移等),节点会自动将集群状态信息保存到该配置文件中。
    不过,该属性在这里仍保持注释状态。在后面的每个节点单独的配置文件中配置它。
    在这里插入图片描述
    D、 cluster-node-timeout
    用于指定“集群节点”间通信的超时时间阈值,单位毫秒。
    在这里插入图片描述

  2. 修改单独的6380conf
    指定节点配置文件名 , 集群中节点发生变化时, 例如某个节点下线了, 故障转移, 都会记录到该文件中.
    在这里插入图片描述

  3. 复制剩余5个单独的conf文件
    使用 redis6380.conf 复制出 5 个配置文件 redis6381.conf、redis6382.conf、redis6383.conf、 redis6384.conf、redis6385.conf。
    在这里插入图片描述

  4. 修改 5 个配置文件
    修改 5 个配置文件 redis6381.conf、redis6382.conf、redis6383.conf、redis6384.conf、 redis6385.conf 的内容,将其中所有涉及的端口号全部替换为当前文件名称中的端口号。例如,下面的是 redis6381.conf 的配置文件内容。
    在这里插入图片描述

6.2.2 系统的启动和关闭

6.2.2.0 启停脚本

启动和停止的有点复杂, 不如直接做成一个脚本

需要注意的是, 该脚本仅用于学习, 因为生产环境下不会像现在一样搭建伪集群

在redis715/cluster-dis中新建这两个脚本
并且注意, 编写完成后还要增加权限 chmod 755 start-redis-cluster.sh

#!/bin/bash
rm -rf dump638*.rdb
rm -rf appendonlydir
rm -rf nodes-638*.conf

redis-server redis6380.conf
redis-server redis6381.conf
redis-server redis6382.conf
redis-server redis6383.conf
redis-server redis6384.conf
redis-server redis6385.conf

redis-cli --cluster create --cluster-replicas 1 192.168.177.129:6380 192.168.177.129:6381 192.168.177.129:6382 192.168.177.129:6383 192.168.177.129:6384 192.168.177.129:6385

ps aux | grep redis
#!/bin/bash

redis-cli -p 6380 shutdown
redis-cli -p 6381 shutdown
redis-cli -p 6382 shutdown
redis-cli -p 6383 shutdown
redis-cli -p 6384 shutdown
redis-cli -p 6385 shutdown

ps aux | grep redis
6.2.2.1 启动

在这里插入图片描述在这里插入图片描述
在这里插入图片描述
第一部分: 已经使用虚拟槽分区算法进行数据分区
第二部分: 已为每一个master分配一个slave
第三部分: 三主三从redis的动态id/主机号端口号/槽分配/角色

在这里插入图片描述
在这里插入图片描述

6.2.2.2 关闭

对于分布式系统的关闭, 只需要逐个shutdown即可

在这里插入图片描述

6.3 集群操作

6.3.1 连接集群

在这里插入图片描述

6.3.2 写入数据

正常写入中, 限制一次只能为一个key, 但value不限

6.3.2.1 key单个写入

无论value 类型为String 还是List、Set 等集合类型,只要只有一个key , 那么在分布式系统中就没有问题。例如,

在这里插入图片描述

6.3.2.2 key批量操作

对一次写入多个 key 的操作,多个 key 会计算出多个 slot,多个 slot 可能会对应多个节点。

而由于一次只能写入一个节点,所以该操作会报错。

不过,系统也提供了一种对批量 key 的操作方案,为这些 key 指定一个统一的 group,让这个 group 作为计算 slot 的唯一值。
在这里插入图片描述

6.3.3 集群查询

在这里插入图片描述

6.3.4 故障转移

分布式系统中的某个 master 如果出现宕机,那么其相应的 slave 就会自动晋升为master。
如果原 master 又重新启动了,那么原 master 会自动变为新 master 的 slave。

6.3.4.1 模拟故障

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

6.3.4.2 故障服务能力

如果某 slot 范围对应节点的 master 与 slave 全部宕机,那么整个分布式系统是否还可以对外提供读服务,就取决于属性 cluster-require-full-coverage 的设置。
在这里插入图片描述

6.3.5 集群扩容

目标, 在原有系统的基础上, 在正在运行的分布式系统中添加两个新的节点:端口号为 6386 的节点为 master节点,其下会有一个端口号为 6387 的 slave 节点。

6.3.5.1 复制并修改两个单独的conf文件

使用 redis6380.conf 复制出 2 个配置文件 redis6386.conf 与 redis6387.conf,并修改其中的各处端口号为相应端口号,为集群扩容做前期准备。

6.3.5.2 启动系统与 2 个节点

在这里插入图片描述

6.3.5.3 添加master节点

在这里插入图片描述
在这里插入图片描述

6.3.5.4 分配slot

在这里插入图片描述
在这里插入图片描述
在QA交互中, 一共问了四个问题

  • 准备移动多少 slot?
  • 准备由谁来接收移动的 slot?
  • 选择要移动 slot 的源节点。
    有两种方案。
    A. 如果选择键入 all,则所有已存在 slot 的节点都将作为 slot 源节点,即该方案将进行一次 slot 全局大分配。
    B. 也可以选择其它部分节点作为 slot 源节点。此时将源节点的动态 ID 复制到这里,每个 ID 键入完毕后回车,然后再复制下一个 slot 源节点动态 ID,直至最后一个键入完毕回车后再键入 done。
    这里键入的是 all,进行全局大分配。
    在这里插入图片描述
    在这里插入图片描述
6.3.5.5 添加slave节点

在这里插入图片描述
在这里插入图片描述

6.3.6 集群缩容

对于缩容 , 删除master和slave的操作是不一样的.

下面要将 slave 节点 6387 与 master 节点 6386 从分布式系统中删除。
总体上分为三步

  1. 删除slave节点
  2. 处理master分配到的slot
  3. 删除master
6.3.6.1 删除slave节点

在这里插入图片描述

6.3.6.2 移除master节点所分配到的slot

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.3.6.3 删除master节点

在这里插入图片描述


6.4 分布式系统的限制

  • 仅支持 0 号数据库
  • 批量 key 操作支持有限
  • 分区仅限于 key
  • 事务支持有限
  • 不支持分级管理

6.5 Sentinel高可用集群启停脚本

上述都是演示普通的主从集群, 现在演示带有Sentinel的集群, 并且将启动和停止命令写入脚本

本示例采用三台Sentinel, 三台redis(一主两从)

bak是什么? 为什么要有bak?
之前演示Sentinel集群的时候看过, 只要一启动redis , 六台redis的conf文件就会多很多自动添加的内容, 但是这些内容的存在会导致下一次启动集群报错, 因此我们提前复制一份conf为conf.bak , 每次启动集群时都用conf.bak覆盖conf, 达到将conf文件复原的目的

然后再编写start-redis-sentinel脚本
在这里插入图片描述
不要忘了chmod

并且检查一下daemonsize为yes

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1472045.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

blender bvh显示关节名称

导入bvh,菜单选择布局,右边出现属性窗口, 在下图红色框依次点击选中,就可以查看bvh关节名称了。

如何保证档案室符合建设标准要求

保证档案室符合建设标准要求需要考虑以下几个方面: 1. 总体规划:合理规划档案室的布局和大小,确保能够满足现有和未来的档案存储需求。考虑档案室的空间利用率、通风、照明、安全出口等因素。 2. 档案室环境:档案室的环境应具备稳…

SQL Server 开发环境配置教程(SSMS+SQL Prompt)

背景 记录一下 SQL Server 常用开发软件 体验了各种数据库IDE(DBeaver、Navicat、DataGrip)之后综合下来还是感觉 SSMSSQL Prompt 对于 SQL Server 最好用,所以在此记录一下配置过程 数据库可视化管理工具SSMS 官方下载地址: https://learn.microsoft…

【Java程序设计】【C00317】基于Springboot的智慧社区居家养老健康管理系统(有论文)

基于Springboot的智慧社区居家养老健康管理系统(有论文) 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于Springboot的智慧社区居家养老健康管理系统设计与实现,本系统有管理员、社区工作人员、医生以及家属四种角色权限 管…

01|Mysql底层存储引擎

1. 聚集索引(聚簇)与非聚集索引 1.1 聚集索引 索引和数据存储在一起。叶子节点存储了完整的数据记录; 1.2 非聚集索引 MyISAM存储引擎就是非聚集索引,索引和数据文件是分开存储的。索引在MYI文件中,数据在MYD文件中…

Zoho ToDo 满足您的需求:任务管理满足隐私和安全要求

任务管理工具已经成为我们日常生活中不可或缺的一部分,它们帮助我们处理各种事务,从杂项和愿望清单到管理截止日期和资源。这些工具不仅仅是简单的任务列表,它们掌握了项目的蓝图、雄心勃勃的目标和完成的最后期限。然而随着这些工具的使用越…

装配制造业的MES系统种的物料齐套技术

装配是制造企业涉及产品生产加工最为普遍的一种模式,包括汽车、电子、电器、电气等行业。经研究表明,装配在整个产品制造总成本中所占比例超过了50%,所占用的总生产时间比例在40%-60%,直接影响着产品质量和成本。装配制造非常强调…

Arduino单片机基础介绍

(本文为简单介绍,内容源于网络和AI) Arduino单片机,自2005年诞生以来,已经成为全球爱好者和专业工程师们快速实现创意原型的重要工具。Arduino的普及不仅因其强大的功能和简易的操作,还在于其背后强大的社…

websocket入门及应用

websocket When to use a HTTP call instead of a WebSocket (or HTTP 2.0) WebSocket 是基于TCP/IP协议,独立于HTTP协议的通信协议。WebSocket 是双向通讯,有状态,客户端一(多)个与服务端一(多&#xff09…

7.(数据结构)堆

7.1 相关概念 堆(Heap)在计算机科学中是一种特殊的数据结构,它通常被实现为一个可以看作完全二叉树的数组对象。以下是一些关于堆的基本概念: 数据结构: 堆是一个优先队列的抽象数据类型实现,通过完全二叉树…

Oracle 基础表管理(Heap-Organized Table Management)

表是数据库中负责数据存储的对象,在RDBMS中,数据以行、列的形式存储在表中。Oracle中表有很多种类型,最基础且应用最常用的类型就是堆表(Heap-Organized Table),本文列举了Oracle堆表的常用管理操作。 一、…

【PX4-AutoPilot教程-仿真环境架构】梳理PX4GazeboMAVLinkMAVROSROSROS2之间的关系

梳理PX4&Gazebo&MAVLink&MAVROS&ROS&ROS2之间的关系 PX4与仿真器PX4支持的仿真器PX4与除Gazebo之外的仿真器的连接PX4与Gazebo仿真器的连接 PX4默认的MAVLink UDP端口PX4 SITL软件在环仿真的架构Gazebo仿真PX4启动仿真的launch文件ROS与PX4的关系 PX4与仿真…

LeetCode 0938.二叉搜索树的范围和:深度优先搜索(可中序遍历)

【LetMeFly】938.二叉搜索树的范围和:深度优先搜索(可中序遍历) 力扣题目链接:https://leetcode.cn/problems/range-sum-of-bst/ 给定二叉搜索树的根结点 root,返回值位于范围 [low, high] 之间的所有结点的值的和。…

《武汉市贯彻实施细则》解读房地产经纪活动时效性

时效性【当前有效】 为进一步规范我市房地产经纪活动,保护房地产交易和经纪活动当事人的合法权益,促进行业健康发展,制定《武汉市房地产经纪实施细则》(以下简称《实施细则》)。 (以下简称《实施细则》&am…

《Docker 简易速速上手小册》第5章 Docker Compose 与服务编排(2024 最新版)

文章目录 5.1 理解 Docker Compose5.1.1 重点基础知识5.1.2 重点案例:部署 Flask 应用和 Redis5.1.3 拓展案例 1:多服务协作5.1.4 拓展案例 2:使用自定义网络 5.2 编排多容器应用5.2.1 重点基础知识5.2.2 重点案例:部署 Flask 应用…

OpenCV开发笔记(七十五):相机标定矫正中使用remap重映射进行畸变矫正

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://blog.csdn.net/qq21497936/article/details/136293833 各位读者,知识无穷而人力有穷,要么改需求,要么找专业人士,要么自己研究 红胖子(红模仿…

用html编写的简易新闻页面

用html编写的简易新闻页面 相关代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document<…

信号完整性分析基本概念

“设计师可以分成两类&#xff0c;一类已经遇到了信号完整性问题&#xff0c;另一类即将遇到信号完不整性问题” 随着时钟频率的提高&#xff0c;发现并解决信号完整性问题成为产品开发的关键。因此需要精通信号完整性分析技术&#xff0c;并能采取高效设计过程以消除这些问题…

内网穿透的应用-如何在群晖配置WebDAV实现云同步Zotero科研文献与笔记【内网穿透】

文章目录 前言1. Docker 部署 Trfɪk2. 本地访问traefik测试3. Linux 安装cpolar4. 配置Traefik公网访问地址5. 公网远程访问Traefik6. 固定Traefik公网地址 前言 Trfɪk 是一个云原生的新型的 HTTP 反向代理、负载均衡软件&#xff0c;能轻易的部署微服务。它支持多种后端 (D…

Sentinel 动态规则扩展

一、规则 Sentinel 的理念是开发者只需要关注资源的定义&#xff0c;当资源定义成功后可以动态增加各种流控降级规则。Sentinel 提供两种方式修改规则&#xff1a; 通过 API 直接修改 (loadRules)通过 DataSource 适配不同数据源修改 手动通过 API 修改比较直观&#xff0c;…