Redis的数据复制

news2024/11/20 16:28:18

介绍 Redis 的复制

Redis 的复制功能分为同步(sync)和命令传播(command propagate)这两个操作

  • 同步操作用于,将从服务器的数据库状态更新至主服务器当前所处的数据库状态;
  • 命令传播操作用于,在主服务器的数据库状态被修改,导致主从服务器的数据库状态出现不一致时,让主从服务器的数据库重新回到一致状态。

如果主从服务器双方的数据库保存相同的数据,我们称主从服务器的数据库状态一致

当从服务器第一次连接主服务器时,Redis 使用全量复制进行数据同步。

当从服务器在断线后重新连接主服务器时,Redis 使用增量复制进行数据同步。

完整重同步

全量复制,也被称为完整重同步。

当客户端向从服务器发送 slaveof 命令,要求从服务器复制主服务器时,从服务器首先需要执行同步操作,将从服务器的数据库状态更新至主服务器当前所处的数据库状态。

从服务器对主服务器的完整重同步操作,需要通过向主服务器发送 psync 命令来完成。psync 的命令为:psync ? -1


psync 命令在完整重同步模式下的的执行步骤:让主服务器创建并发送 RDB 文件,以及主服务器向从服务器发送保存在缓冲区里面的写命令来进行同步。

  1. 从服务器向主服务器发送 psync 命令。
  2. 主服务器收到 psync 命令后,主服务器执行 bgsave 命令,在后台生成一个 RDB 文件,并使用一个缓冲区(replication buffer)记录从现在开始执行的所有写命令。
  3. 主服务器给从服务器同步数据:当主服务器的 bgsave 命令执行完毕时,主服务器会将 bgsave 命令生成的 RDB 文件发送给从服务器,从服务器接收并载入这个 RDB 文件,将自己的数据库状态更新至主服务器执行 bgsave 命令时的数据库状态。
  4. 主服务器给从服务器发送缓冲区里面的所有写命令:主服务器将记录在缓冲区里面的所有写命令发送给从服务器, 从服务器执行这些写命令,将自己的数据库状态更新至主服务器数据库当前所处的状态。

需要注意的是:

从库在开始和主库进行数据复制前,可能保存了其他数据。为了避免之前数据的影响,从库在收到主库发送的 RDB 文件后,会先把自己当前的数据库清空。

1660827427693-db712d00-f509-452b-b3b3-0ca7b62f920d.jpeg

介绍 偏移量 & 积压缓冲区 & 运行ID

部分重同步功能通过以下三个部分来实现:

  • 主服务器的复制偏移量 和 从服务器的复制偏移量(replication offset)
  • 主服务器的复制积压缓冲区(replication backlog buffer)
  • 服务器的运行 ID(run ID)

复制偏移量

主服务器和从服务器会分别维护一个复制偏移量:

  • 主服务器每次向从服务器传播 N 个字节的数据时,就将自己的复制偏移量的值加上 N。
  • 从服务器每次收到主服务器传播来的 N 个字节的数据时,就将自己的复制偏移量的值加上 N。

通过对比主从服务器的复制偏移量,程序可以很容易地知道主从服务器是否处于一致状态:

  • 如果主从服务器两者的偏移量总是相同,那么说明主从服务器处于一致状态。
  • 如果主从服务器两者的偏移量并不相同,那么说明主从服务器并未处于一致状态。

复制积压缓冲区

复制积压缓冲区(repl_backlog_buffer)是由主服务器维护的一个固定长度的先进先出(FIFO)队列。

固定指的是,当入队元素的数量大于队列长度时,最先入队的元素会被弹出,而新元素会被放入队列。或者理解复制积压缓冲区为一个环形缓冲区。


当主服务器进行命令传播时,它不仅会将写命令发送给所有从服务器,还会将写命令入队到复制积压缓冲区里面。

1666749197788-0b40c1d8-a332-4981-af8d-d5e1999e1c91.png


因此,主服务器的复制积压缓冲区里面会保存着一部分最近传播的写命令,并且复制积压缓冲区会为队列中的每个字节记录相应的复制偏移量。

1666749670434-061f6a1f-2d53-4eaf-ae6c-b4eb694ff613.png

当从服务器在断线后重新连接主服务器时,从服务器会通过 psync 命令将自己的复制偏移量 offset 发送给主服务器,主服务器会根据这个复制偏移量来决定对从服务器执行完整重同步还是部分重同步操作:

  • 如果 offset 偏移量之后的数据(也即是偏移量 offset+1 开始的数据)仍然存在于复制积压缓冲区里面,那么主服务器将对从服务器执行部分重同步操作。
  • 如果 offset 偏移量之后的数据已经不存在于复制积压缓冲区,那么主服务器将对从服务器执行完整重同步操作。

复制积压缓冲区的大小

Redis 为复制积压缓冲区设置的默认大小为 1MB,如果主服务器需要执行大量的写命令,又或者主从服务器断线后重连接所需的时间比较长,那么这个大小也许并不合适。我们可以通过 repl-backlog-size 选项修改复制积压缓冲区的大小。

如果复制积压缓冲区的大小设置得不恰当,那么 psync 命令的部分重同步复制就不能正常发挥作用。因此,正确估算和设置复制积压缓冲区的大小非常重要。

为了保证主从服务器断线并重连接后可以使用部分重同步功能,我们需要保证复制积压缓冲区的大小足够大。复制积压缓冲区的最小大小可以根据公式 second * write_size_per_second 来估算:

  • second 是从服务器断线后重新连接上主服务器所需的平均时间(以秒计算)。
  • write_size_per_second 是主服务器平均每秒产生的写命令数据量(协议格式的写命令的长度总和)。

例如,如果主服务器平均每秒产生1 MB的写数据,而从服务器断线之后平均要 5 秒才能重新连接上主服务器,那么复制积压缓冲区的大小就不能低于 5 MB。

为了安全起见,可以将复制积压缓冲区的大小设为: 2 * second * write_size_per_second,这样可以保证绝大部分断线情况都能用部分重同步来处理。

服务器运行 ID

每个 Redis 服务器,不论主服务器还是从服务,都会有自己的运行 ID。运行 ID 在服务器启动时自动生成,由 40 个随机的十六进制字符组成,例如:53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3。


当从服务器对主服务器进行初次复制时,主服务器会将自己的运行 ID 发送给从服务器,而从服务器会将主服务器的这个运行 ID 保存起来。 当从服务器断线并重新连上一个主服务器时,从服务器将向当前连接的主服务器发送之前保存的主服务器的运行 ID:

  • 如果从服务器保存的主服务器的运行 ID 和当前连接的主服务器的运行 ID 相同,那么说明从服务器断线之前复制的就是当前连接的这个主服务器, 主服务器可以继续尝试执行部分重同步操作。
  • 如果从服务器保存的主服务器的运行 ID 和当前连接的主服务器的运行 ID 并不相同,那么说明从服务器断线之前复制的主服务器并不是当前连接的这个主服务器,主服务器将对从服务器执行完整重同步操作。

部分重同步

增量复制,也被称为部分重同步。

在 Redis 中,从库对主库的复制可以分为以下两种情况:

  • 初次复制:从库以前没有复制过任何主库,或者从库当前要复制的主服务器和上一次复制的主服务器不同。
  • 网络断线重连后复制:处于命令传播阶段的主从库因为网络原因而中断了复制,但从库通过自动重连接重新连上了主库,并继续复制主服。

在 Redis 2.8 之前,如果主从库在命令传播时出现了网络中断,那么在断线重连后,从库会和主库重新进行一次全量复制,开销非常大。

从 2.8 版本开始,Redis 引入了部分重同步功能。部分重同步指的是,从服务器只同步主服务器的部分数据。当从服务器在断线后重新连接主服务器时,如果条件允许,主服务器可以将主从服务器连接断开期间执行的写命令发送给从服务器,从服务器只要接收并执行这些写命令,就可以将数据库更新至主服务器当前所处的状态。


执行部分重同步是有前提条件的。

  • offset 偏移量
  • 运行 ID

当从服务器对主服务器进行初次复制时,主服务器会将自己的运行 ID 发送给从服务器,而从服务器会将主服务器的这个运行 ID 保存起来。 当从服务器断线并重新连上一个主服务器时,从服务器会通过 psync 命令将自己的复制偏移量 offset 和 之前保存的主服务器的运行 ID 发送给主服务器。

主服务器会根据这个复制偏移量 和 运行ID 来决定对从服务器执行完整重同步还是部分重同步操作:

  • 如果从服务器保存的主服务器的运行 ID 和当前连接的主服务器的运行 ID 相同,那么说明从服务器断线之前复制的就是当前连接的这个主服务器, 主服务器可以继续尝试执行部分重同步操作。
  • 如果从服务器保存的主服务器的运行 ID 和当前连接的主服务器的运行 ID 并不相同,那么说明从服务器断线之前复制的主服务器并不是当前连接的这个主服务器,主服务器将对从服务器执行完整重同步操作。
  • 如果 offset 偏移量之后的数据(也即是偏移量 offset+1 开始的数据)仍然存在于复制积压缓冲区里面,那么主服务器将对从服务器执行部分重同步操作。
  • 如果 offset 偏移量之后的数据已经不存在于复制积压缓冲区,那么主服务器将对从服务器执行完整重同步操作。

从服务器对主服务器的部分重同步操作,需要通过向主服务器发送 psync 命令来完成。psync 命令为:psync < runID > < offset >

1666686614547-bc127175-8e4a-4715-a425-cbc4a6dda998.png

psync 命令

从服务器对主服务器的同步操作,需要通过向主服务器发送 psync 命令来完成。

psync 命令具有完整重同步(full resynchronization)和部分重同步 (partial resynchronization)两种模式:

  • 完整重同步用于,处理初次复制情况;
  • 部分重同步用于,处理断线后重复制情况:当从服务器在断线后重新连接主服务器时,如果条件允许,主服务器可以将主从服务器连 接断开期间执行的写命令发送给从服务器,从服务器只要接收并执行这 些写命令,就可以将数据库更新至主服务器当前所处的状态。

psync 命令的调用方法有两种:

  • 如果从服务器以前没有复制过任何主服务器,或者之前执行过 slaveof no one 命令,那么从服务器在开始一次新的复制时将向主服务器发送 psync ? -1 命令,主动请求主服务器进行完整重同步。
  • 如果从服务器已经复制过某个主服务器,那么从服务器在开始一次新的复制时将向主服务器发送 psync 命令:其中 runid 是上一次复制的主服务器的运行 ID,而 offset 则是从服务器当前的复制偏移量,接收到这个命令的主服务器会通过这两个参数来判断应该对从服务器执行哪种同步操作。

根据情况,接收到 psync 命令的主服务器会向从服务器返回以下三种回复的其中一种:

  • 如果主服务器返回 +fullresync 回复,那么表示主服务器将与从服务器执行完整重同步操作:其中 runid 是这个主服务器的运行 ID,从服务器会将这个 ID 保存起来,在下一次发送 psync 命令时使用;而 offset 则是主服务器当前的复制偏移量,从服务器会将这个值作为自己的初始化偏移量。
  • 如果主服务器返回 +continue 回复,那么表示主服务器将与从服务器执行部分重同步操作,从服务器只要等着主服务器将自己缺少的那部分数据发送过来就可以了。
  • 如果主服务器返回 -err 回复,那么表示主服务器的版本低于 Redis2.8,它识别不了 psync 命令,从服务器将向主服务器发送 sync 命令,并与主服务器执行完整同步操作。

命令传播

主服务器通过向从服务器传播命令来更新从服务器的状态,保持主从服务器一致。

当完成了同步之后, 主从服务器就会进入命令传播阶段, 这时主服务器只要一直将自己执行的写命令发送给从服务器, 而从服务器只要一直接收并执行主服务器发来的写命令, 就可以保证主从服务器一直保持一致了。

主服务器进行命令传播时,它不仅会将写命令发送给所有从服务器,还会将写命令入队到复制积压缓冲区里面。

心跳检测

从服务器通过向主服务器发送命令来进行心跳检测,以及命令丢失检测。

在命令传播阶段,从服务器默认会以每秒一次的频率,向主服务器发送命令:replconf ack <replication_offset>。其中 replication_offset 是从服务器当前的复制偏移量。

发送 replconf ack 命令对于主从服务器有三个作用:

  • 检测主从服务器的网络连接状态。
  • 辅助实现 min-slaves 选项。
  • 检测命令丢失。

检测主从服务器的网络连接状态。

主从服务器可以通过发送和接收 replconf ack 命令来检查两者之间的网络连接是否正常:如果主服务器超过一秒钟没有收到从服务器发来的 replconf ack 命令,那么主服务器就知道主从服务器之间的连接出现问题了。

通过向主服务器发送 info replication 命令,在列出的从服务器列表的 lag 一栏中,我们可以看到相应从服务器最后一次向主服务器发送 replconf ack 命令距离现在过了多少秒。在一般情况下,lag 的值应该在 0 秒或者 1 秒之间跳动,如果超过 1 秒的话,那么说明主从服务器之间的连接出现了故障。


辅助实现 min-slaves 选项。

Redis 的 min-slaves-to-write 和 min-slaves-max-lag 两个选项可以防止主服务器在不安全的情况下执行写命令。

举个例子,如果我们向主服务器提供以下设置:

  • min-slaves-to-write 3
  • min-slaves-max-lag 10

那么在从服务器的数量少于 3 个,或者 3 个从服务器的延迟(lag)值都 ≥ 10 秒时,主服务器将拒绝执行写命令,这里的延迟值就是上面提到的 info replication 命令的 lag 值。


检测命令丢失。

如果因为网络故障,主服务器传播给从服务器的写命令在半路丢失,那么当从服务器向主服务器发送 replconf ack 命令时,主服务器将发觉从服务器当前的复制偏移量少于自己的复制偏移量,然后主服务器就会根据从服务器提交的复制偏移量,在复制积压缓冲区里面找到从服务器缺少的数据,并将这些数据重新发送给从服务器。

参考资料

《Redis设计与实现》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/106395.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java基础1112_包机制_JavaDoc生成文档

目录包机制JavaDoc生成文档方法一方法二包机制 为了更好的组织类&#xff0c;Java提供了包机制&#xff0c;用于区别类名的命名空间&#xff1b; 包语句的语法格式为&#xff1a;package pkg1[. pkg2[. pkg3 …]]&#xff1b; 一般利用公司的域名倒置作为包名&#xff1b;com.b…

二进制搭建k8s集群——部署多master

二进制搭建k8s集群——部署多master二进制搭建k8s集群——部署多master部署master02 节点部署负载均衡在lb01、lb02节点上配置nginx和keepalived两台负载均衡器配置keepalived所有node节点修改配置文件在 master01 节点测试创建pod二进制搭建k8s集群——部署多master 架构说明&…

C~回调函数

还是c的学习啊 一、函数指针 在讲回调函数之前&#xff0c;我们需要了解函数指针。 我们都知道&#xff0c;C语言的灵魂是指针&#xff0c;我们经常使用整型指针&#xff0c;字符串指针&#xff0c;结构体指针等 int *p1; char *p2; STRUCT *p3; //STRUCT为我们定义的结构体…

win10下docker安装

业精于勤荒于嬉&#xff0c;总是与偷懒做斗争。 很多年了&#xff0c;一直不愿做事情&#xff0c;不愿意想事情。 1、安装 Docker Toolbox -- Install on Windows | Docker Documentation http://mirrors.aliyun.com/docker-toolbox/windows/docker-toolbox/DockerToolbox-…

今年你们赚到钱了吗?

峥嵘的2022年&#xff0c;各位程序员们&#xff0c;你们赚到钱了吗&#xff1f; 今天是2022年12月21日&#xff0c;眼看就快过年了&#xff01; 今年你们赚到钱了吗&#xff1f;对于我而言&#xff0c;又是一个"窘迫/囧迫"的穷年&#xff0c;有点心慌慌&#xff0c;有…

windows安装Elasticsearch

Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索&#xff0c;具有接近实时的搜索&#xff0c;并支持多租户。Elasticsearch是分布式的&#xff…

纷享销客《华东地区新增长专刊》重磅发布

增长&#xff0c;是企业发展永恒的主题。 纷享销客的使命是用创新科技和行业智慧赋能企业增长。在服务超过5000中大型客户的基础上&#xff0c;我们发现&#xff0c;各行各业从营销端到流通端&#xff0c;再到生产端&#xff0c;已然出现了全渠道、全场景、端到端、一体化融合…

【战“疫”案例展】壹点灵心理服务平台——携手抗疫,共克时艰“星光”同行公益项目...

‍网易云信战“疫”案例本项目由网易云信投递并参与“数据猿行业盘点季大型主题策划活动—— #榜样的力量# 《新冠战“疫”——中国数据智能产业最具社会责任感企业》榜单/奖项”评选。‍数据智能产业创新服务媒体——聚焦数智 改变商业自2019年底以来&#xff0c;人们的情绪持…

电脑垃圾站刚清空的文件怎么找回?总结了三种方法

当电脑上删除文件后会临时存放在电脑垃圾站中&#xff0c;如果还需要这些文件&#xff0c;还能有“后悔药”&#xff0c;直接在电脑垃圾站里面找到进行“还原”即可&#xff0c;但是当垃圾站的文件刚被清空了怎么办&#xff1f;如何找回文件呢&#xff1f;下面分享三种方法恢复…

赛狐ERP|假期模式补货建议,解决春节备货难题

马上就到春节假期了&#xff0c;有两个让亚马逊卖家特别头疼的难题&#xff1a; 工厂放假停工 拿不到货 尤其今年不同于往年&#xff0c;各种因素的影响让供应商的放假时间特别早&#xff0c;工厂放假停工以及年后生产排期的不确定性&#xff0c;会导致卖家很长一段时间都无法…

activemq安装windows环境,数据订阅与发布,生产者与消费者

官网下载&#xff0c;选择适合本地jdk编译环境的部署包 安装完成后解压到指定目录&#xff0c;目录不要包含中文&#xff0c;否则可能启动不成功。 解压完成后找到指定路径 双击即可运行 &#xff0c;见到如下界面启动成功 访问本地管理页面http://127.0.0.1:8161/ 输入账号…

SpringBoot全局异常处理

1、异常处理的种类 我大概把一次请求分成三个阶段&#xff0c;来分别进行全局的异常处理。 在进入Controller之前&#xff0c;譬如请求一个不存在的地址&#xff0c;404错误。在执行RequestMapping时&#xff0c;进入逻辑处理阶段前。譬如传的参数类型错误。以上都正常时&…

升级Win11系统卡在了35%怎么解决?

升级Win11系统卡在了35%怎么解决&#xff1f;Windows11是微软开发的电脑的最新操作系统&#xff0c;不少人都会选择更新到Windows11&#xff0c;但是进行更新安装对很多人来讲并不是一件很简单的事情&#xff0c;不少人都在抱怨安装时常常卡在35%或85%&#xff0c;并且带有一个…

Java.Util复习贴

参加了数次竞赛之后&#xff0c;我发现我的瓶颈所在——语法。于是今天来复习一下常用的Java库函数吧。 比赛中用java8还是10我就不care啦&#xff0c;我直看官方最新文档。地址在 https://docs.oracle.com/javase/10/docs/api/java/util/package-summary.html 首先看到java.…

排序——插入排序、希尔排序

目录 一.插入排序 1.实现 2.时间复杂度 二.希尔排序 2.预排序 (1).单次预排序的实现 (2).相对有序 2.代码 一.插入排序 1.实现 正如其名&#xff0c;是将第n1个数据插入到前面的n的升序&#xff08;降序&#xff09;数据中&#xff0c;形成一个n1大小的升序&#xff0…

用于宏观经济数据分析的神经网络(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 宏观经济时间序列的分析和预测是国家决策者非常感兴趣的因素。然而&#xff0c;由于缺乏精确的经济模型和外部因素&#xff08…

浏览器隐藏滚动条(不影响内容滚动)

系列文章目录 文章目录系列文章目录一、背景和效果图如下&#xff1a;1.背景2.设置属性前效果图&#xff1a;2.设置后效果图&#xff1a;二、直接通过CSS修改样式&#xff0c;保存滑动功能1.全局设置滚动条如下&#xff08;所有的都被隐藏&#xff09;Css代码如下效果图如下2.给…

DP1363F高度集成的非接触读写芯片 13.56M NFC/RFID读卡器芯片 兼容替代CLRC663

DP1363F高度集成的非接触读写芯片 13.56M NFC/RFID读卡器芯片 兼容替代CLRC663 DP1363F是一款高度集成的非接触读写芯片&#xff0c;集强大的多协议支持、最高射频输出功率&#xff0c;以及突破性技术低功耗卡片检测等优势于一身&#xff0c;满足市场对更高集成度、更小外壳和…

Mybatis 异常总结

java.sql.SQLSyntaxErrorException: #42000 一般发生在修改 删除中 原因可能是 传入的参数与 sql 语句不匹配 It’s likely that neither a Result Type nor a Result Map was specified 异常分析&#xff1a; 关键在第一段提示&#xff1a; It’s likely that neither a Re…

Yolov5移植树莓派4B问题总结

Hallo&#xff0c;大家好啊&#xff01;之前出过几篇文章关于Yolov5的&#xff0c;不得不说Yolov5的识别率真的很高&#xff0c;对个体检测很有帮助&#xff0c;如果大家训练完之后会发现获得一个pt文件&#xff0c;这就是训练好的模型。但是&#xff0c;这个模型只能够在自己的…