心跳机制Redis

news2025/7/7 23:17:06

 进入命令传播阶段候，master与slave间需要进行信息交换，使用心跳机制进行维护，实现双方连接保持在线

 master心跳：

 指令：PING

 周期：由repl-ping-slave-period决定，默认10秒

 作用：判断slave是否在线

 查询：INFO replication

获取slave最后一次连接时间间隔，lag项维持在0或1视为正常

 slave心跳任务

 指令：REPLCONF ACK {offset}

 周期：1秒

 作用1：汇报slave自己的复制偏移量，获取最新的数据变更指令

 作用2：判断master是否在线

心跳阶段注意事项

 当slave多数掉线，或延迟过高时，master为保障数据稳定性，将拒绝所有信息同步操作

slave数量少于2个，或者所有slave的延迟都大于等于10秒时，强制关闭master写功能，停止数据同步

 slave数量由slave发送REPLCONF ACK命令做确认

 slave延迟由slave发送REPLCONF ACK命令做确认

主从复制常见问题

频繁的全量复制（1）

伴随着系统的运行，master的数据量会越来越大，一旦master重启，runid将发生变化，会导致全部slave的全量复制操作

内部优化调整方案：

1. master内部创建master_replid变量，使用runid相同的策略生成，长度41位，并发送给所有slave

2. 在master关闭时执行命令 shutdown save，进行RDB持久化,将runid与offset保存到RDB文件中

 repl-id repl-offset

 通过redis-check-rdb命令可以查看该信息

3. master重启后加载RDB文件，恢复数据

重启后，将RDB文件中保存的repl-id与repl-offset加载到内存中

 master_repl_id = repl master_repl_offset = repl-offset

 通过info命令可以查看该信息

作用：

本机保存上次runid，重启后恢复该值，使所有slave认为还是之前的master

频繁的全量复制（2）

 问题现象

 网络环境不佳，出现网络中断，slave不提供服务

 问题原因

 复制缓冲区过小，断网后slave的offset越界，触发全量复制

 最终结果

 slave反复进行全量复制

 解决方案

 修改复制缓冲区大小

repl-backlog-size

 建议设置如下：

1. 测算从master到slave的重连平均时长second

2. 获取master平均每秒产生写命令数据总量write_size_per_second

3. 最优复制缓冲区空间 = 2 * second * write_size_per_second

频繁的网络中断（1）

 问题现象

 master的CPU占用过高或 slave频繁断开连接

 问题原因

 slave每1秒发送REPLCONF ACK命令到master

 当slave接到了慢查询时（keys * ，hgetall等），会大量占用CPU性能

 master每1秒调用复制定时函数replicationCron()，比对slave发现长时间没有进行响应

 最终结果

 master各种资源（输出缓冲区、带宽、连接等）被严重占用

 解决方案

 通过设置合理的超时时间，确认是否释放slave

repl-timeout

该参数定义了超时时间的阈值（默认60秒），超过该值，释放slave

频繁的网络中断（2）

 问题现象

 slave与master连接断开

 问题原因

 master发送ping指令频度较低

 master设定超时时间较短

 ping指令在网络中存在丢包

 解决方案

 提高ping指令发送的频度

repl-ping-slave-period

超时时间repl-time的时间至少是ping指令频度的5到10倍，否则slave很容易判定超时

数据不一致

 问题现象

 多个slave获取相同数据不同步

 问题原因

 网络信息不同步，数据发送有延迟

 解决方案

 优化主从间的网络环境，通常放置在同一个机房部署，如使用阿里云等云服务器时要注意此现象

 监控主从节点延迟（通过offset）判断，如果slave延迟过大，暂时屏蔽程序对该slave的数据访问

slave-serve-stale-data yes|no

开启后仅响应info、slaveof等少数命令（慎用，除非对数据一致性要求很高）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/358983.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

心跳机制Redis

心跳阶段注意事项

主从复制常见问题

频繁的全量复制（1）

频繁的全量复制（2）

频繁的网络中断（1）

频繁的网络中断（2）

数据不一致

相关文章

4｜无线传感器网络与应用｜无线传感器网络原理及方法-许毅版｜第3章：无线传感器网络通信-3.1协议结构 3.2物理层｜青岛科技大学｜课堂笔记

光谱实验反射、透射光谱测量

【Redis】数据结构：SDS、跳跃表等底层数据结构详解

从JDK源码来看XXE的触发原理和对应的防御手段

基础组件之内存池

光学分辨率光声显微镜中基于深度学习的运动校正算法

PYTHON爬虫基础

关于IDEA中Thread.activeCount()的问题记录

【FAQ】集成分析服务的常见问题及解决方案

kettle安装部署_简单认识_Spoon勺子界面---大数据之kettle工作笔记002

【代码随想录训练营】【Day19休息】【Day20】第六章｜二叉树｜654.最大二叉树｜617.合并二叉树｜700.二叉搜索树中的搜索｜98.验证二叉搜索树

计算机系统基础知识

12款适合小团队协作、任务管理和进度跟踪的在线任务管理的工具推荐？

web网页如何实现响应式导航栏--移动端导航栏

LabVIEW利用矢量量化直方图开发人脸识别

Prometheus之pushgateway

Teradata 离场，企业数据分析平台如何应对变革？

基于卷积神经网络图像风格迁移系统的设计与实现（flask系统）

数据库面试——锁的12连问，赶紧收藏！

从红队视角看AWD攻击