Redis的持久化
Redis 是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能!
RDB(Redis DataBase)
什么是RDB
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。
Fork
Fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量,环境变量,程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
Rdb 保存的是 dump.rdb 文件
配置位置及SNAPSHOTTING解析
这里的触发条件机制,我们可以修改测试一下:
save 120 10 # 120秒内修改10次则触发RDB
1分钟内改了1万次
5分钟内改了10次
15分钟内改了1次
如果想禁用RDB持久化的策略,只要不设置任何save指令,或者给save传入一个空字符串参数也可以。
若要修改完毕需要立马生效,可以手动使用 save 命令!立马生效 !
其余命令解析
Stop-writes-on-bgsave-error:如果配置为no,表示你不在乎数据不一致或者有其他的手段发现和控制,默认为yes。
rbdcompression:对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis会采用LZF算法进行压缩,如果你不想消耗CPU来进行压缩的话,可以设置为关闭此功能。
rdbchecksum:在存储快照后,还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。默认为yes。
如何触发RDB快照
- 配置文件中默认的快照配置,建议多用一台机子作为备份,复制一份 dump.rdb
- 命令save或者是bgsave
save 时只管保存,其他不管,全部阻塞
bgsave,Redis 会在后台异步进行快照操作,快照同时还可以响应客户端请求。可以通过lastsave
命令获取最后一次成功执行快照的时间。 - 执行flushall命令,也会产生 dump.rdb 文件,但里面是空的,无意义 !
- 退出的时候也会产生 dump.rdb 文件!
如何恢复
- 将备份文件(dump.rdb)移动到redis安装目录并启动服务即可
- CONFIG GET dir 获取目录 这是找到需要去恢复文件的地方而不是查找rdb文件在哪儿
127.0.0.1:6379> config get dir
dir
/usr/local/bin
优点和缺点
优点:
1、适合大规模的数据恢复
2、对数据完整性和一致性要求不高
缺点:
1、在一定间隔时间做一次备份,所以如果redis意外down掉的话,就会丢失最后一次快照后的所有修改
2、Fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑。
小结
疑难解答
问:
flushall和flushdb命令执行之后,确实可以触发快照机制生成一个dump.rdb文件,但是请注意这个dump.rdb文件是空的,因为快照是在flushall和flushdb命令执行之后生成的;
答:
正确,flushall和flushdb命令会清空Redis中的所有数据,然后触发快照机制生成一个新的dump.rdb文件。但是,由于数据已经被清空,因此dump.rdb文件中不会包含任何数据。如果在执行flushall和flushdb命令之前,Redis中已经存在数据,并且已经进行了持久化操作,那么之前的快照文件将包含这些数据。
问:
flushdb 只是当前数据库清空了,其他数据库的数据保存到rdb内了吧?
答:
是的,执行 FLUSHDB
命令只会清空当前选择的数据库中的所有数据,而其他数据库中的数据不会受到影响。同时,如果已经开启了持久化功能,执行 FLUSHDB
命令并不会影响 Redis 的持久化文件。因此,其他数据库中的数据依然会被保存到 RDB 文件中。