Redis主从结构有两种部署方式,如下:
一主多从的模式是使用最多的模式,通常搭建哨兵或者集群都采用这种方式,但是这种方式主节点复制压力较大,尤其是全量同步的时候。
级联结构使用情况相对较少,这种结构中间节点是从节点的同时,又是下级的父节点,缓解了主节点复制压力。
主从同步分为两种,一个是全量同步,一个是增量同步。
1、SYNC(全量同步)
从服务器向主服务器发送 sync 命令。
收到 sync 命令后,主服务器执行 bgsave 命令,用来生成 rdb 文件,并在一个缓冲区中记录从现在开始执行的写命令。
bgsave 执行完成后,将生成的 rdb 文件发送给从服务器,用来给从服务器更新数据。
主服务器再将缓冲区记录的写命令发送给从服务器,从服务器执行完这些写命令后,此时的数据库状态便和主服务器一致了。
SYNC同步过程其实是非常耗时的,耗费IO资源、网络资源。所以2.8版本之后,又新增了PSYNC方式。
2、PSYNC(增量同步)
PSYNC分为全量同步和部分同步两种。
如果是初次同步,那跟SYNC是一样的。但是对于断线重连的情况,满足条件的情况下,可以实现只同步断线期间的数据。
所以PSYNC的部分同步可以提高同步效率。
那么“满足条件”主要是指偏移量比较满足条件,下面对具体情况进行说明。
复制偏移量
执行复制的主从服务器都会分别维护各自的复制偏移量:
主服务器每次向从服务器传播 n 个字节数据时,都会将自己的复制偏移量加 n。
从服务器接受主服务器传来的数据时,也会将自己的复制偏移量加 n
举个例子:
若当前主服务器的复制偏移量为 10000,此时向从服务器传播 30 个字节数据,结束后复制偏移量为 10030。
这时,从服务器还没接收这 30 个字节数据就断线了,然后重新连接上之后,该从服务器的复制偏移量依旧为 10000,说明主从数据不一致,此时会向主服务器发送 psync 命令。
复制积压缓冲区
Redis复制积压缓冲区是一个固定长度的队列,默认1MB。
当主节点进行命令传播的时候,也会将数据保存至缓冲区一份,当空间用完后,那么最先保存的数据就会被丢弃。
当主节点接到从节点psync命令后,查看从节点的复制偏移量,例如当前主节点缓冲区存储的偏移量范围为1000到1200,如果从节点传过来的偏移量是1100,那么主节点就可以将1101到1200的数据同步至从节点;但是如果从节点传过来的偏移量是900,那么说明缓冲区的数据已经无法保证数据一致性了,此时需要进行全量数据同步。
RUN ID
run id意思是主节点运行时的id,当从节点连接到主节点后,主节点会将自己的运行id发送至从节点,从节点保存。
当主节点发现从节点传过来的run id与自己的id不一致时,说明从节点是从其他主节点切换过来的,那么也需要进行全量数据同步。
心跳检测
当完成了同步之后,从服务器会以每秒 1 次的频率,向主服务器发送命令:REPLCONF ACK <replication_offset>
其中 replication_offset 是从服务器当前的复制偏移量。以此来实现数据同步。