Redis 是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能!
一、RDB(Redis DataBase)
1.1 概念
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的 Snapshot 快照,它恢复时是将快照文件直接读到内存里。
Redis 会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何 IO 操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那 RDB 方式要比 AOF 方式更加的高效。RDB 的缺点是最后一次持久化后的数据可能丢失。 Redis 默认的就是 RDB,一般情况下不需要修改这个配置。
rdb 默认保存的文件就是 dump.rdb,都是在我们配置文件的快照部分配置的,如下所示:
1.2 手动配置
修改 redis.conf 配置文件,如下图所示:
记得输入 config.rewrite 命令重启下 redis 服务使配置文件更新
# 客户端1 先删除 dump.rdb 文件
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
[root@localhost bin]# rm -f dump.rdb
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
# 客户端2 执行 set 操作
127.0.0.1:6379> mset k1 v1 k2 v2 k3 v3 k4 v4 k5 v5
OK
# 等1分钟后,再次查看客户端1,发现自动生成了 rdb 文件
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
1.3 触发机制
1、 save 的规则满足的情况下,会自动触发 rdb 规则,产生 rdb 文件
# 客户端 1 查看
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
# 客户端 2 执行 save 命令
127.0.0.1:6379> save
OK
# 客户端 1 再次查看
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
2、执行 flushall 命令,会自动触发 rdb 规则,产生 rdb 文件
# 客户端 1 查看
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
# 客户端 2 执行 flushall 命令
127.0.0.1:6379> flushall
OK
# 客户端 1 再次查看
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
3、退出 redis,会自动触发 rdb 规则,产生 rdb 文件
# 客户端 1 查看
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
# 客户端 2 执行退出命令
127.0.0.1:6379> shutdown
not connected> exit
# 客户端 1 再次查看
[root@localhost bin]# ls
dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
1.4 恢复 rdb 文件
只需要将 rdb 文件放在我们 redis 启动目录即可,redis 启动的时候就会自动检查 dump.rdb恢复其中的数据,查看需要存在的位置命令:
127.0.0.1:6379> config get dir
1) "dir"
2) "/usr/local/bin" # 如果在这个目录下存在 dump.rdb 文件,启动就会自动恢复其中的数据
1.5 优点
1、适合大规模的数据恢复
2、对数据完整性和一致性要求不高
1.6 缺点
1、需要在一定间隔时间做一次备份,所以如果 redis 意外宕机了,就会丢失最后一次快照后的所有修改。
2、fork 进程的时候,会占用一定的内存空间。
二、AOF(Append Only File)
2.1 概念
以日志的形式来记录每个写操作,将 Redis 执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis 启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。
AOF 保存的是 appendonly.aof 文件
2.2 手动配置
默认是不开启的,需要我们手动进行配置,我们只需要将 appendonly 改为 yes 就开启了。
测试
# 客户端1查看当前目录的文件,如果存在 rdb 文件先删除就好了
[root@localhost bin]# ls
myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
# 客户端2启动 redis 服务
[root@localhost bin]# redis-server myredis/redis.conf
[root@localhost bin]# redis-cli -p 6379
127.0.0.1:6379>
# 客户端1再次查看当前目录的文件,发现生成了 appendonlydir 目录,并存储了相关的文件
[root@localhost bin]# ls
appendonlydir myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
[root@localhost bin]# cd appendonlydir/
[root@localhost appendonlydir]# ls
appendonly.aof.1.base.rdb appendonly.aof.1.incr.aof appendonly.aof.manifest
2.3 异常恢复
# 客户端1清空数据库,并重新赋值,然后退出 redis
127.0.0.1:6379> flushdb
OK
127.0.0.1:6379> set k1 v1
OK
127.0.0.1:6379> set k2 v2
OK
127.0.0.1:6379> set k3 v3
OK
127.0.0.1:6379> set k4 v4
OK
127.0.0.1:6379> set k5 v5
OK
127.0.0.1:6379> shutdown
not connected> exit
# 客户端2 首先删除dump.rdb 文件
[root@localhost bin]# ls
appendonlydir dump.rdb myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
[root@localhost bin]# rm -f dump.rdb
[root@localhost bin]# ls
appendonlydir myredis redis-benchmark redis-check-aof redis-check-rdb redis-cli redis-sentinel redis-server
# 修改我们的 aof 文件,舔些垃圾数据
[root@localhost bin]# cd appendonlydir/
[root@localhost appendonlydir]# vim appendonly.aof.1.incr.aof
[root@localhost appendonlydir]# cd ..
# 启动 redis 的服务端
[root@localhost bin]# redis-server myredis/redis.conf
58643:C 29 Aug 2023 20:14:27.081 # WARNING Memory overcommit must be enabled! Without it, a background save or replication may fail under low memory condition. Being disabled, it can also cause failures without low memory condition, see https://github.com/jemalloc/jemalloc/issues/1328. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.
# 启动 redis 的客户端,发现无法启动
[root@localhost bin]# redis-cli -p 6379
Could not connect to Redis at 127.0.0.1:6379: Connection refused
not connected>
可以使用 redis-check-aof 工具来修复
# 执行 redis-check-aof --fix 修复的文件名 来修复文件
[root@localhost bin]# redis-check-aof --fix appendonlydir/appendonly.aof.1.incr.aof
Start checking Old-Style AOF
0x 13e: Expected \r\n, got: 3131
AOF analyzed: filename=appendonlydir/appendonly.aof.1.incr.aof, size=353, ok_up_to=301, ok_up_to_line=76, diff=52
This will shrink the AOF appendonlydir/appendonly.aof.1.incr.aof from 353 bytes, with 52 bytes, to 301 bytes
Continue? [y/N]: y
Successfully truncated AOF appendonlydir/appendonly.aof.1.incr.aof
# 上面提示我们成功的修复了文件,再次重新启动下就可以了
[root@localhost bin]# redis-server myredis/redis.conf
[root@localhost bin]# redis-cli -p 6379
127.0.0.1:6379> mget k1 k2 k3 k4 k5
1) "v1"
2) "v2"
3) "v3"
4) "v4"
5) (nil)
优点
1、每一次修改都同步,文件的完整性会更加好
2、每秒同步一次,可能会丢失一秒的数据
3、从来都不需要同步,效率会比较高
缺点
1、相对于数据文件来说,aof 远远大于 rdb,修复的速度也比 rdb 慢
2、aof 的运行效率也要比 rdb 慢,所以我们 redis 默认的配置就是 rdb 持久化
三、总结
1、RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储。
2、AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF 命令以 Redis 协议追加保存每次写的操作到文件末尾,Redis 还能对 AOF 文件进行后台重写,使得 AOF 文件的体积不至于过大。
3、只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化
4、同时开启两种持久化方式
在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据,因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。
RDB 的数据不实时,同时使用两者时服务器重启也只会找 AOF 文件,那要不要只使用 AOF 呢?作者建议不要,因为 RDB 更适合用于备份数据库(AOF 在不断变化不好备份),快速重启,而且不会有 AOF 可能潜在的 Bug,留着作为一个万一的手段。
5、性能建议
因为 RDB 文件只用作后备用途,建议只在 Slave 上持久化 RDB 文件,而且只要15分钟备份一次就够了,只保留 save 900 1 这条规则。
如果 Enable AOF ,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只 load 自己的 AOF 文件就可以了,代价一是带来了持续的 IO,二是 AOF rewrite 的最后将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少 AOF rewrite 的频率,AOF 重写的基础大小默认值 64M 太小了,可以设到 5G 以上,默认超过原大小 100% 大小重写可以改到适当的数值。
如果不 Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔 IO,也减少了 rewrite 时带来的系统波动。代价是如果 Master/Slave 同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个 Master/Slave 中的 RDB 文件,载入较新的那个,微博就是这种架构。