特性 | 哨兵模式 | 集群模式 |
---|---|---|
高可用性 | 是 | 是 |
数据分片 | 否 | 是 |
水平扩展 | 否 | 是 |
配置复杂度 | 低 | 高 |
管理复杂度 | 低 | 高 |
多键操作支持 | 是 | 否(有限制) |
哨兵模式
原理:
Redis 哨兵模式是一种高可用性解决方案,它通过监控 Redis 主从架构,自动执行故障转移,从而确保服务的连续性。哨兵模式的核心组件包括哨兵(Sentinel)节点、主节点(Master)和从节点(Slave)。
1. 哨兵节点
哨兵节点是专门用于监控 Redis 主从架构的独立进程。哨兵节点会周期性地检查主从服务器的健康状况,并在主服务器宕机时进行自动故障转移。哨兵节点的功能包括:
-
监控:哨兵节点持续地向主从服务器发送 PING 请求,以确定它们的健康状况。如果服务器在指定时间内没有响应,就认为它已经失效。
-
通知:哨兵节点会将服务器的状态变化通知给管理员或其他应用程序。
-
自动故障转移:当检测到主服务器失效时,哨兵节点会从现有的从服务器中选举出一个新的主服务器,并将其他从服务器指向新的主服务器。
-
配置提供者:哨兵节点可以提供当前主服务器的地址给 Redis 客户端,以便客户端可以连接到正确的服务器。
2. 监控和故障检测
哨兵节点通过 PING 和 INFO 命令监控主从服务器的状态。如果一个服务器在 down-after-milliseconds
时间内没有响应,哨兵节点会认为它失效。为了避免误报,哨兵节点之间会相互通信,只有达到 quorum
个哨兵节点一致认为主服务器失效,才会进行故障转移。
3. 领导选举
当主服务器被确认失效后,哨兵节点会进行领导选举,以决定哪个哨兵节点负责故障转移。选举过程使用类 Raft 算法,确保在多个哨兵节点中选出一个领导者来执行故障转移操作。
4. 自动故障转移
领导哨兵节点从现有的从服务器中选举一个新的主服务器,并更新所有其他从服务器的配置,让它们开始复制新的主服务器。故障转移完成后,领导哨兵节点会通知其他哨兵节点和 Redis 客户端新的主服务器地址。
搭建哨兵模式:
1.环境准备:
IP地址 | 角色 | 操作系统 |
---|---|---|
99.99.10.30 | redis-master,sentinel | CentOS Linux release 7.9.2009 (Core) |
99.99.10.31 | redis-slave1,sentinel | CentOS Linux release 7.9.2009 (Core) |
99.99.10.32 | redis-slave2,sentinel | CentOS Linux release 7.9.2009 (Core) |
2.安装Redis
# 安装 C/C++ 环境,编译 Redis 安装包使用 yum -y install gcc gcc-c++ make # 切换软件安装目录 cd /usr/local/ # 新建 redis 安装目录 mkdir redis # 切换到 redis 安装目录 cd redis # 下载 redis 安装包 wget http://download.redis.io/releases/redis-6.2.5.tar.gz # 解压 redis 安装包 tar -zxvf redis-6.2.5.tar.gz # 进入解压后的 redis 目录 cd redis-6.2.5/ # 编译 make # 进入编译好的目录(编译成功后 src 目录下会出现编译后的 redis 服务程序 redis-server) cd src # 进入 Redis 的主目录 cd /usr/local/redis/redis-6.2.5 # 创建工作目录 tmp mkdir tmp # 创建日志目录 log mkdir log # 编辑 Redis 配置 vim redis.conf # 编辑哨兵配置 vim sentinel.conf
3.配置Redis
# 表示redis允许所有地址连接。默认127.0.0.1,仅允许本地连接。 bind 0.0.0.0 # 允许redis后台运行 daemonize yes # 设置redis日志存放路径 logfile "/usr/local/redis/redis-6.2.5/log/redis_6379.log" # 设置为no,允许外部网络访问 protected-mode no # 修改redis监听端口(可以自定义) port 6379 # pid存放目录 pidfile /var/run/redis_6379.pid # 工作目录,需要创建好目录,可自定义 dir /usr/local/redis/redis-6.2.5/tmp # 设置redis密码 requirepass 123456 # 主从同步master的密码 masterauth 123456
# 表示redis允许所有地址连接。默认127.0.0.1,仅允许本地连接。 bind 0.0.0.0 # 允许redis后台运行 daemonize yes # 设置redis日志存放路径 logfile "/usr/local/redis/redis-6.2.5/log/redis_6379.log" # 设置为no,允许外部网络访问 protected-mode no # 修改redis监听端口(可以自定义) port 6379 # pid存放目录 pidfile /var/run/redis_6379.pid # 工作目录,需要创建好目录,可自定义 dir /usr/local/redis/redis-6.2.5/tmp # 设置redis密码 requirepass 123456 # 主从同步master的密码 masterauth 123456
# 多了这一行,用于追随某个节点的redis,被追随的节点为主节点,追随的为从节点,Redis5.0前版本可使用slaveof replicaof 99.99.10.30 6379
从节点&哨兵sentinel.conf与主节点的sentinel.conf保持一致。
4.启动Redis
# 启动 redis 命令如下(从节点类似),下面这条命令执行后没有出错,一般就是启动成功了 /usr/local/redis/redis-6.2.5/src/redis-server /usr/local/redis/redis-6.2.5/redis.conf #查看启动是否成功 ps aux | grep redis ----------------------------------------- root 110885 0.0 0.1 162500 2884 ? Ssl 15:58 0:00 /usr/local/redis/redis-6.2.5/src/redis-server 0.0.0.0:6379 root 110950 0.0 0.0 112808 968 pts/1 R+ 15:58 0:00 grep --color=auto redis ----------------------------------------- #查看集群信息 #切换到主库目录下 /usr/local/redis/redis-6.2.5/src #连接redis ./redis-cli #验证密码 auth 123456 #查看集群 info replication ----------------------------------------- [root@redis-master src]# ./redis-cli 127.0.0.1:6379> auth 123456 OK 127.0.0.1:6379> info replication # Replication role:master connected_slaves:0 master_failover_state:no-failover master_replid:4d028dc9b02e861a7d2aa5e2cc779f24da0b4434 master_replid2:8ee54d1d08888609608c841507a08b4e53ab880b master_repl_offset:87976 second_repl_offset:83227 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:80121 repl_backlog_histlen:7856 -----------------------------------------
5.启动哨兵
# 启动 redis 命令如下(从节点类似),下面这条命令执行后没有出错,一般就是启动成功了 /usr/local/redis/redis-6.2.5/src/redis-sentinel /usr/local/redis/redis-6.2.5/sentinel.conf # 查看是否启动成功 ps aux | grep redis ----------------------------------------- [root@redis-master src]# ps aux | grep redis root 72040 0.5 0.1 162500 3052 ? Ssl 15:22 0:14 /usr/local/redis/redis-6.2.5/src/redis-sentinel *:26379 [sentinel] root 110885 0.1 0.1 240840 3124 ? Ssl 15:58 0:00 /usr/local/redis/redis-6.2.5/src/redis-server 0.0.0.0:6379 root 117591 0.0 0.0 112808 968 pts/1 S+ 16:05 0:00 grep --color=auto redis -----------------------------------------
6.进行测试
kill掉主节点的redis之后,在从节点查看redis信息,会发现选举了一个新的主节点。
哨兵的优缺点
优点:
-
提供高可用性和自动故障转移。
-
简单易用,适合小规模的 Redis 部署。
缺点:
-
不能水平扩展。
-
故障转移期间可能有短暂的不可用时间。
集群模式
原理:
Redis 集群模式是一种分布式解决方案,通过数据分片和多个节点来实现水平扩展和高可用性。集群模式的核心组件包括多个主节点(Master)和从节点(Slave),每个节点存储整个数据集的一部分。以下是集群模式的详细工作原理:
1. 数据分片
Redis 集群将整个键空间划分为 16384 个哈希槽(Hash Slots),每个键根据 CRC16 哈希算法被映射到一个哈希槽。每个主节点负责管理一部分哈希槽,从而实现数据的分布式存储。
2. 主从复制
每个主节点可以有一个或多个从节点,从节点用于数据的冗余备份和故障转移。当主节点失效时,集群会自动选举一个从节点作为新的主节点。
3. 节点通信
Redis 集群节点之间通过 Gossip 协议进行通信,定期交换状态信息。每个节点都了解集群中其他节点的状态和负责的哈希槽。
4. 故障检测和恢复
Redis 集群中的节点会监控彼此的健康状况。当检测到某个主节点失效时,集群中的其他节点会协同选举一个从节点作为新的主节点,确保数据的高可用性。
5. 客户端连接和重定向
Redis 客户端连接到集群中的任意一个节点进行操作。如果请求的键不在当前节点负责的哈希槽内,节点会返回一个 MOVED 响应,指示客户端重定向到正确的节点。
搭建Redis-cluster集群:
1.环境准备:
IP地址 | 角色 | 操作系统 |
---|---|---|
99.99.10.40:7001 | redis-master1 | CentOS Linux release 7.9.2009 (Core) |
99.99.10.40:7002 | redis-master2 | CentOS Linux release 7.9.2009 (Core) |
99.99.10.40:7003 | redis-master3 | CentOS Linux release 7.9.2009 (Core) |
99.99.10.40:7004 | redis-slave1 | CentOS Linux release 7.9.2009 (Core) |
99.99.10.40:7005 | redis-slave2 | CentOS Linux release 7.9.2009 (Core) |
99.99.10.40:7006 | redis-slave3 | CentOS Linux release 7.9.2009 (Core) |
2.安装Redis
# 安装 C/C++ 环境,编译 Redis 安装包使用 yum -y install gcc gcc-c++ make # 切换软件安装目录 cd /usr/local/ # 新建 redis 安装目录 mkdir redis # 切换到 redis 安装目录 cd redis # 下载 redis 安装包 wget http://download.redis.io/releases/redis-6.2.5.tar.gz # 解压 redis 安装包 tar -zxvf redis-6.2.5.tar.gz # 进入解压后的 redis 目录 cd redis-6.2.5/ # 编译 make # 进入编译好的目录(编译成功后 src 目录下会出现编译后的 redis 服务程序 redis-server) cd src
3.配置Redis
# 在/usr/local/redis下创建redis-cluster目录,在其下创建7001、7002......7006目录 mkdir -p /usr/local/redis/redis-cluster mkdir -v 7001 7002 7003 7004 7005 7006
# 将redis解压路径下的配置文件redis.conf,依次拷贝到每个700X目录内,并修改每个700X目录下的redis.conf配置文件: port 700X bind 99.99.10.40 cluster-enabled yes (启动redis-cluster集群模式) cluster-config-file nodes-700x.conf daemonized yes logfile /usr/local/redis/redis-cluster/700X/node.log
4.启动Redis
cd /usr/local/redis/redis/src ./redis-server /usr/local/redis/7001/redis.conf ./redis-server /usr/local/redis/7002/redis.conf ./redis-server /usr/local/redis/7003/redis.conf ./redis-server /usr/local/redis/7004/redis.conf ./redis-server /usr/local/redis/7005/redis.conf ./redis-server /usr/local/redis/7006/redis.conf ----------------------------------------- [root@redis-cluster src]# ps -ef | grep redis root 13793 1 0 09:14 ? 00:00:03 ./redis-server 99.99.10.40:7001 [cluster] root 31859 1 0 09:30 ? 00:00:02 ./redis-server 99.99.10.40:7002 [cluster] root 34685 1 0 09:32 ? 00:00:02 ./redis-server 99.99.10.40:7003 [cluster] root 34797 1 0 09:32 ? 00:00:02 ./redis-server 99.99.10.40:7004 [cluster] root 34828 1 0 09:32 ? 00:00:02 ./redis-server 99.99.10.40:7005 [cluster] root 34907 1 0 09:32 ? 00:00:02 ./redis-server 99.99.10.40:7006 [cluster] root 67927 3526 0 10:00 pts/0 00:00:00 grep --color=auto redis -----------------------------------------
5.创建集群
./redis-cli --cluster create 99.99.10.40:7001 99.99.10.40:7002 99.99.10.40:7003 99.99.10.40:7004 99.99.10.40:7005 99.99.10.40:7006 --cluster-replicas 1 ----------------------------------------- # 查看集群状态 [root@redis-cluster src]# ./redis-cli -h 99.99.10.40 -p 7001 99.99.10.40:7001> cluster info cluster_state:ok cluster_slots_assigned:16384 cluster_slots_ok:16384 cluster_slots_pfail:0 cluster_slots_fail:0 cluster_known_nodes:6 cluster_size:3 cluster_current_epoch:6 cluster_my_epoch:1 cluster_stats_messages_ping_sent:1651 cluster_stats_messages_pong_sent:1603 cluster_stats_messages_sent:3254 cluster_stats_messages_ping_received:1598 cluster_stats_messages_pong_received:1651 cluster_stats_messages_meet_received:5 cluster_stats_messages_received:3254 ----------------------------------------- 99.99.10.40:7001> cluster nodes ef8f95cec7e4ecdc53bf76d3c905fa60d6ee5202 99.99.10.40:7002@17002 master - 0 1719885779875 2 connected 5461-10922 786ace6e78fb2c78966befa242aaac6a6f1a13d4 99.99.10.40:7003@17003 master - 0 1719885780000 3 connected 10923-16383 aa831e1f7eb98a51f6e4782b08961e296c16b6d4 99.99.10.40:7004@17004 slave 627a959d0a9542ecef06f1363d7521e30c753295 0 1719885779000 1 connected 0174a8f28735d92789a55badf5819e1818596a04 99.99.10.40:7005@17005 slave ef8f95cec7e4ecdc53bf76d3c905fa60d6ee5202 0 1719885780886 2 connected b4b975788e013c8eb426a4db0526a664050576f6 99.99.10.40:7006@17006 slave 786ace6e78fb2c78966befa242aaac6a6f1a13d4 0 1719885780000 3 connected 627a959d0a9542ecef06f1363d7521e30c753295 99.99.10.40:7001@17001 myself,master - 0 1719885776000 1 connected 0-5460 -----------------------------------------
优缺点
优点:
-
支持数据的水平扩展,可以处理大规模数据。
-
提供高可用性,节点失效时能够自动进行故障转移。
-
高并发性能。
缺点:
-
配置和管理复杂度较高。
-
不支持多键操作,某些命令在集群模式下受到限制。
-
需要更多的资源和节点来维持高可用性和性能。