Redis持久化
RDB持久化
RDB: Redis数据备份文件。简单来说就是把内存中的所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。
主要流程
bgsave开始时会fork主进程得到子进程,子进程共享主进程的内存数据。完成fork后读取内存数据并写入RDB文件。fork采用的是copy-on-write技术:
- 当进程执行读操作时,访问共享内存;
- 当主进程执行写操作时,则会拷贝一份数据,执行写操作。
总结
- RDB方式bgsave的基本流程?
- fork主进程得到一个子进程,共享内存空间;
- 子进程读取内存数据并写入新的RDB文件;
- 用新RDB文件替换旧的RDB文件
- RDB会在什么时候执行?save 60 1000代表什么含义?
- 默认是服务停止时
- 代表60秒内至少执行1000次修改则触发RDB
- RDB的缺点?
- RDB执行间隔时间长,两次RDB之间写入数据有丢失的风险
- fork子进程、压缩、写出RDB文件都比较耗时
AOF持久化
AOF全称为 Append Only (追加文件)。Redis处理的每一个写命令都会记录在AOF文件,可以看做是命令日志文件
- AOF默认是关闭的,需要修改redis.conf配置文件来开启AOF:
- AOF的命令记录的频率也可以通过redis.conf文件来配
AOF
因为是记录命令,AOF文件会比RDB文件大的多。而且AOF会记录对同一个key的多次写操作,但只有最后一次写操作才有意义。通过执行bgrewriteaof命令,可以让AOF文件执行重写功能,用最少的命令达到相同效果
- Redis也会在触发阈值时自动去重写AOF文件。阈值也可以在redis.conf中配置。
AOF和RDB比较
Redis主从
主从数据同步原理
主从第一次同步是全量同步
- slave节点请求增量同步;
- master节点判断replid,发现不一致,拒绝增量同步;
- master将完整内存数据生成RDB,发送RDB到slave;
- slave清空本地数据,加载master的RDB;
- master将RDB期间的命令记录在repl_baklog,并持续将log中的命令发送给slave;
- slave执行接收到的命令,保持与master之间的同步
主从第一次同步是全量同步,但如果slave重启后同步,则执行增量同步
总结
简述全量同步和增量同步区别?
- 全量同步:master将完整内存数据生成RDB,发送RDB到slave。后续命令则记录在repl_baklog,逐个发送给slave。
- 增量同步:slave提交自己的offset到master,master获取repl_baklog中从offset之后的命令给slave
什么时候执行全量同步?
- slave节点第一次连接master节点时;
- slave节点断开时间太久,repl_baklog中的offset以及被覆盖时
什么时候执行增量同步?
- slave节点断开又恢复,并且在repl_baklog中能找到offset时