主从复制、哨兵以及Cluster集群

1.Redis高可用

2.Redis主从复制

2.1 主从复制的作用

2.2 主从复制流程

2.3 搭建Redis主从复制

2.3.1 修改Redis配置文件（Master节点操作）

2.3.2 修改Redis配置文件（Slave节点操作）

2.3.2 验证主从复制结果

3.Redis哨兵模式

3.1 哨兵模式概述

3.2 哨兵模式的作用

3.3 故障转移机制

3.4 主节点的选举

3.5 搭建Redis哨兵模式

4. Redis群集模式

4.1 Redis集群的数据分片

4.2 Redis集群的主从复制模型

4.3 搭建Redis群集模式

4.3.1 修改服务器配置

4.3.2 创建集群

4.3.3 集群测试

4.4 动态扩容

1.Redis高可用

在web服务器中，高可用是指服务器可以正常访问的时间，衡量的标准是在多长时间内可以提供正常服务（99.9%、99.99%、99.999%等等）。
但是在Redis语境中，高可用的含义似乎要宽泛一些，除了保证提供正常服务（如主从分离、快速容灾技术），还需要考虑数据容量的扩展、数据安全不会丢失等。
在Redis中，实现高可用的技术主要包括持久化、主从复制、哨兵和Cluster集群，下面分别说明它们的作用，以及解决了什么样的问题。

持久化：持久化是最简单的高可用方法(有时甚至不被归为高可用的手段)，主要作用是数据备份，即将数据存储在硬盘，保证数据不会因进程退出而丢失。
主从复制：主从复制是高可用Redis的基础，哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份，以及对于读操作的负载均衡和简单的故障恢复。缺陷：故障恢复无法自动化；写操作无法负载均衡；存储能力受到单机的限制。
哨兵：在主从复制的基础上，哨兵实现了自动化的故障恢复。缺陷：写操作无法负载均衡；存储能力受到单机的限制。
Cluster集群：通过集群，Redis解决了写操作无法负载均衡，以及存储能力受到单机限制的问题，实现了较为完善的高可用方案。

2.Redis主从复制

主从复制，是指将一台Redis服务器的数据，复制到其他的Redis服务器。前者称为主节点(Master)，后者称为从节点(Slave)；数据的复制是单向的，只能由主节点到从节点。

默认情况下，每台Redis服务器都是主节点；且一个主节点可以有多个从节点(或没有从节点)，但一个从节点只能有一个主节点。

2.1 主从复制的作用

数据冗余：主从复制实现了数据的热备份，是持久化之外的一种数据冗余方式。
故障恢复：当主节点出现问题时，可以由从节点提供服务，实现快速的故障恢复，实际上是一种服务的冗余。
负载均衡：在主从复制的基础上，配合读写分离，可以由主节点提供写服务，由从节点提供读服务（即写Redis数据时，应用连接主节点；读Redis数据时，应用连接从节点），分担服务器负载；尤其是在写少读多的场景下，通过多个从节点分担读负载，可以大大提高Redis服务器的并发量。
高可用基石：除了上述作用以外，主从复制还是哨兵和集群能够实施的基础，因此说主从复制是Redis高可用的基础。

2.2 主从复制流程

首次同步：当从节点要进行主从复制时，它会发送一个SYNC命令给主节点。主节点收到SYNC命令后，会执行BGSAVE命令来生成RDB快照文件，并在生成期间使用缓冲区记录所有写操作。
快照传输：当主节点完成BGSAVE命令并且快照文件准备好后，将快照文件传输给从节点。主节点将快照文件发送给从节点，并且在发送过程中，主节点会继续将新的写操作缓冲到内存中。
追赶复制：当从节点收到快照文件后，会加载快照文件并应用到自己的数据集中。一旦快照文件被加载，从节点会向主节点发送一个PSYNC命令，以便获取缓冲区中未发送的写操作。
增量复制：主节点收到PSYNC命令后，会将缓冲区中未发送的写操作发送给从节点，从节点会执行这些写操作，保证与主节点的数据一致性。此时，从节点已经追赶上了主节点的状态。
同步：从节点会继续监听主节点的命令，并及时执行主节点的写操作，以保持与主节点的数据同步。主节点会定期将自己的操作发送给从节点，以便从节点保持最新的数据状态.

注意:当slave首次同步或者宕机后恢复时，会全盘加载，以追赶上大部队，即全量复制

2.3 搭建Redis主从复制

准备三台redis服务器；192.168.9.140 master；192.168.9.112 slave1；192.168.9.113 slave2

2.3.1 修改Redis配置文件（Master节点操作）

vim /usr/local/redis/conf/redis.conf
bind 0.0.0.0									#87行，修改监听地址为0.0.0.0
protected-mode no								#111行，将本机访问保护模式设置no
port 6379										#138行，Redis默认的监听6379端口
tcp-backlog 20480                               #147行，修改参数为20480
daemonize yes									#309行，设置为守护进程，后台启动
pidfile /usr/local/redis/log/redis_6379.pid		#341行，指定 PID 文件
logfile "/usr/local/redis/log/redis_6379.log"	#354行，指定日志文件
dir /usr/local/redis/data						#504行，指定持久化文件所在目录
requirepass abc123								    #1037行，可选，设置redis密码
appendonly yes									#1380行，开启AOF
masterauth abc123								    #535行，可选，指定Master节点的密码，在Master节点设置requirepas时，此处才需要设置密码
systemctl restart redis-server.service

2.3.2 修改Redis配置文件（Slave节点操作）

vim /usr/local/redis/conf/redis.conf
bind 0.0.0.0									#87行，修改监听地址为0.0.0.0
protected-mode no								#111行，将本机访问保护模式设置no
port 6379										#138行，Redis默认的监听6379端口
tcp-backlog 20480                               #147行，修改参数为20480
daemonize yes									#309行，设置为守护进程，后台启动
pidfile /usr/local/redis/log/redis_6379.pid		#341行，指定 PID 文件
logfile "/usr/local/redis/log/redis_6379.log"	#354行，指定日志文件
dir /usr/local/redis/data						#504行，指定持久化文件所在目录
requirepass abc123								    #1037行，可选，设置redis密码
appendonly yes									#1380行，开启AOF
replicaof 192.168.9.140 6379					#528行，指定要同步的Master节点IP和端口
masterauth abc123								    #535行，可选，指定Master节点的密码，在Master节点设置requirepas时，此处才需要设置密码
systemctl restart redis-server.service

2.3.2 验证主从复制结果

redis-cli -h ip -p 6379 -a '密码'
info replication

master：

slave1：

slave2：

3.Redis哨兵模式

3.1 哨兵模式概述

主从切换技术的方法是：当服务器宕机后，需要手动一台从机切换为主机，这需要人工干预，不仅费时费力而且还会造成一段时间内服务不可用。为了解决主从复制的缺点，就有了哨兵机制。
哨兵的核心功能：在主从复制的基础上，哨兵引入了主节点的自动故障转移。

3.2 哨兵模式的作用

监控：哨兵会不断地检查主节点和从节点是否运作正常。
自动故障转移：当主节点不能正常工作时，哨兵会开始自动故障转移操作，它会将失效主节点的其中一个从节点升级为新的主节点，并让其它从节点改为复制新的主节点。
通知（提醒）：哨兵可以将故障转移的结果发送给客户端。

哨兵结构由两部分组成，哨兵节点和数据节点：

哨兵节点：哨兵系统由一个或多个哨兵节点组成，哨兵节点是特殊的redis节点，不存储数据。
数据节点：主节点和从节点都是数据节点。

3.3 故障转移机制

（1）由哨兵节点定期监控发现主节点是否出现了故障,每个哨兵节点每隔1秒会向主节点、从节点及其它哨兵节点发送一次ping命令做一次心跳检测。如果主节点在一定时间范围内不回复或者是回复一个错误消息，那么这个哨兵就会认为这个主节点主观下线了（单方面的）。当超过半数哨兵节点认为该主节点主观下线了，这样就客观下线了。

（2）当主节点出现故障，此时哨兵节点会通过Raft算法（选举算法），实现选举机制共同选举出一个哨兵节点为leader，来负责处理主节点的故障转移和通知。所以整个运行哨兵的集群的数量不得少于3个节点。

（3）由leader哨兵节点执行故障转移，过程如下：

将某一个从节点升级为新的主节点，让其它从节点指向新的主节点；
原主节点恢复也变成从节点，并指向新的主节点；
通知客户端主节点已经更换。

需要特别注意的是，客观下线是主节点才有的概念；如果从节点和哨兵节点发生故障，被哨兵主观下线后，不会再有后续的客观下线和故障转移操作。

3.4 主节点的选举

（1）过滤掉不健康的（已下线的），没有回复哨兵ping响应的从节点。
（2）选择配置文件中从节点优先级配置最高的。（replica-priority，默认值为100）
（3）选择复制偏移量最大，也就是复制最完整的从节点。

哨兵的启动依赖于主从模式，所以须把主从模式安装好的情况下再去做哨兵模式.

3.5 搭建Redis哨兵模式

注意： 哨兵节点既可以单独部署，也可以和数据节点部署在一台服务器上，视服务器的数量而定。
在主从复制基础上进行下面的哨兵模式实验：

三台redis服务器；192.168.9.140 master；192.168.9.112 slave1；192.168.9.113 slave2

（1）设置Redis哨兵模式配置文件的属组以及属主（master服务器）

cp /opt/redis-7.0.13/sentinel.conf /usr/local/redis/conf/
chown redis:redis /usr/local/redis/conf/sentinel.conf

（2）修改Redis哨兵模式的配置文件（master服务器）

vim /usr/local/redis/conf/sentinel.conf
protected-mode no									#6行，关闭保护模式
port 26379											#10行，Redis哨兵默认的监听端口
daemonize yes										#15行，指定sentinel为后台启动
pidfile /usr/local/redis/log/redis-sentinel.pid		#20行，指定PID文件
logfile "/usr/local/redis/log/sentinel.log"			#25行，指定日志存放路径
dir /usr/local/redis/data							#54行，指定数据库存放路径
sentinel monitor mymaster 192.168.9.140 6379 2		#73行，修改指定该哨兵节点监控192.168.9.140:6379这个主节点，该主节点的名称是mymaster，最后的2的含义与主节点的故障判定有关：至少需要2个哨兵节点同意，才能判定主节点故障并进行故障转移
sentinel auth-pass mymaster abc123					    #76行，可选，指定Master节点的密码，仅在Master节点设置了requirepass
sentinel down-after-milliseconds mymaster 3000		#114行，判定服务器down掉的时间周期，默认30000毫秒（30秒）
sentinel failover-timeout mymaster 180000			#214行，同一个sentinel对同一个master两次failover之间的间隔时间（180秒）
sentinel client-reconfig-script mymaster /usr/local/redis/conf/master_ip_failover.sh   #278行，指定故障漂移脚本路劲
-------------------------------------------------------------------------------------------
cd /usr/local/redis/conf
vim master_ip_failover.sh     #编写故障漂移脚本
-----
#!/bin/bash
#新master的ip
MASTER_IP=$6
#当前主机的ip
LOCAL_IP=$(ifconfig | awk 'NR==2 {print $2}')

VIP='192.168.9.99'

if [ "$MASTER_IP" == "$LOCAL_IP" ];then
    ifconfig ens33:1 $VIP/24
    exit 0
else
    ifconfig ens33:1 $VIP/24 down
    exit 0
fi
exit 1
-----
chmod +x master_ip_failover.sh  #给予可执行权限
systemctl restart redis-server.service
-------------------------------------------------------------------------------------------

###将修改好的redis的配置文件和故障切换脚本复制到另外两个从服务器
scp sentinel.conf master_ip_failover.sh 192.168.9.112:`pwd`
scp sentinel.conf master_ip_failover.sh 192.168.9.113:`pwd`

#master服务器
ifconfig ens33:1 192.168.9.99/24

（3）启动哨兵模式

###先启master，再启slave
cd /usr/local/redis/conf
redis-sentinel sentinel.conf &
netstat -lntp | grep 26379

（4）查看哨兵信息

###在主从节点上执行以下命令
redis-cli -p ip -h 26379
info sentinel

（5）关闭主节点进程，模拟故障切换

master服务器关闭redis：systemctl stop redis-server.service
打开slave服务器日志脚本进行监控

恢复192.168.9.140服务器redis：systemctl start redis-server.service

4. Redis群集模式

集群，即Redis Cluster，是Redis 3.0开始引入的分布式存储方案。

集群由多组节点(Node)组成，Redis的数据分布在这些节点中。集群中的节点分为主节点和从节点：只有主节点负责读写请求和集群信息的维护；从节点只进行主节点数据和状态信息的复制。

集群的作用，可以归纳为两点：

（1）高可用：集群支持主从复制和主节点的自动故障转移（与哨兵类似）；当任一节点发生故障时，集群仍然可以对外提供服务。

（2）数据分区：数据分区(或称数据分片)是集群最核心的功能。
集群将数据分散到多组节点，一方面突破了Redis单机内存大小的限制，存储容量大大增加；另一方面每个主节点都可以对外提供读服务和写服务，大大提高了集群的响应能力。
Redis单机内存大小受限问题，在介绍持久化和主从复制时都有提及；例如，如果单机内存太大，bgsave和bgrewriteaof的fork操作可能导致主进程阻塞，主从环境下主机切换时可能导致从节点长时间无法提供服务，全量复制阶段主节点的复制缓冲区可能溢出。

4.1 Redis集群的数据分片

Redis集群引入了哈希槽的概念
Redis集群有16384个哈希槽（编号0-16383）
集群的每组节点负责一部分哈希槽
每个Key通过CRC16校验后对16384取余来决定放置哪个哈希槽，通过这个值，去找到对应的插槽所对应的节点，然后直接自动跳转到这个对应的节点上进行存取操作

以3个节点组成的集群为例：

节点A包含0到5460号哈希槽
节点B包含5461到10922号哈希槽
节点C包含10923到16383号哈希槽

4.2 Redis集群的主从复制模型

集群中具有A、B、C三个节点，如果节点B失败了，整个集群就会因缺少5461-10922这个范围的槽而不可以用。
为每个节点添加一个从节点A1、B1、C1整个集群便有三个Master节点和三个slave节点组成，在节点B失败后，集群选举B1为新的主节点继续服务。当B和B1都失败后，集群将不可用。

4.3 搭建Redis群集模式

六台redis服务器；192.168.9.140；192.168.9.112；192.168.9.113

192.168.9.114；192.168.9.115；192.168.9.116

4.3.1 修改服务器配置

192.168.9.140服务器

cp /opt/redis-7.0.13/redis.conf /usr/local/redis/conf/
/usr/local/redis/conf
vim redis.conf
bind 0.0.0.0  #87行
protected-mode no  #第111行关闭保护模式
daemonize yes   #309行后台运行打开
pidfile /usr/local/redis/log/redis_6379.pid   #341行pid文件路径
logfile "/usr/local/redis/log/redis_6379.log"    #354日志文件路径
dir /usr/local/redis/data #504行
appendonly yes    #1379aof持久化打开
cluster-enabled yes   #1576打开注释
cluster-config-file nodes-6379.conf   #1584集群配置文件打开注释
cluster-node-timeout 15000     #1590打开注释
 ------------------------------------------------------------------------------------------

scp redis.conf 192.168.9.112:`pwd`
scp redis.conf 192.168.9.113:`pwd`
scp redis.conf 192.168.9.114:`pwd`
scp redis.conf 192.168.9.115:`pwd`
scp redis.conf 192.168.9.116:`pwd`
#将配置复制给其他服务器
systemctl restart redis-server.service   ####重启所有服务器

4.3.2 创建集群

所有服务器都执行

redis-cli --cluster create 192.168.9.140:6379 192.168.9.112:6379 192.168.9.113:6379 192.168.9.114:6379 192.168.9.115:6379 192.168.9.116:6379 --cluster-replicas 1
####创建集群

4.3.3 集群测试

4.4 动态扩容

六台redis服务器；192.168.9.140；192.168.9.112；192.168.9.113

192.168.9.114；192.168.9.115；192.168.9.116

增加两台无redis服务器：192.168.9.210；192.168.9.120

192.168.9.140服务器进行复制操作
cd /usr/local/redis/conf
scp redis.conf 192.168.9.120:`pwd`
scp redis.conf 192.168.9.210:`pwd`
------------------------------------------------------------------------------------------cd /usr/lib/systemd/system
scp redis-server.service 192.168.9.210:`pwd`
scp redis-server.service 192.168.9.120:`pwd`
启动文件复制到新添加的服务器中

192.168.9.210；192.168.9.120服务器

初始化操作
systemctl disable --now firewalld
-------------------------------------------------------------------------------------------
vim /etc/sysctl.conf
vm.overcommit_memory = 1
net.core.somaxconn = 20480
sysctl -p

192.168.9.140服务器复制配置

scp -rp redis/ 192.168.9.210:/usr/local
scp -rp redis/ 192.168.9.120:/usr/local

192.168.9.210；192.168.9.120服务器

useradd -M -s /sbin/nologin redis
rm -rf conf/*
rm -rf log/*
rm -rf data/*

192.168.9.140服务器复制配置

scp redis.conf 192.168.9.210:`pwd`
scp redis.conf 192.168.9.120:`pwd`

192.168.9.210；192.168.9.120服务器

chown -R redis:redis /usr/local/redis

192.168.9.140服务器启动文件配置

cd /usr/lib/systemd/system
scp redis-server.service 192.168.9.210:`pwd`
scp redis-server.service 192.168.9.120:`pwd`

192.168.9.210；192.168.9.120服务器

systemctl enable --now redis-server.service  #启动服务
vim /etc/profile
export PATH=$PATH:/usr/local/redis/bin
source /etc/profile

192.168.9.140服务器进行配置将两台服务器加入集群

redis-cli -h 192.168.9.140 -p 6379
cluster meet 192.168.9.210 6379
cluster meet 192.168.9.120 6379

192.168.9.120对192.168.9.210对接做主从复制

redis-cli -h 192.168.9.120 -p 6379
cluster replicate 0f3ffa68ab18469feb2d135313b6d141b15a998f

为192.168.9.120对192.168.9.210分配hash槽

192.168.9.210服务器
redis-cli -h 192.168.9.210 -p 6379 --cluster reshard 192.168.9.140:6379