Redis持久化 | 青训营笔记

72 阅读5分钟

前言

Redis 是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能 。

一. RDB(Redis DataBase)

①首先我们进入服务器找到dump.rdb文件:

image.png

②测试触发rdb操作:vim打开redis.conf配置文件

image.png

为了方便测试,将其改为:

save 60 5 #意思是在60秒内进行了5次操作,即写入rdb文件中进行持久化保存

如下图所示:
在这里插入图片描述
③触发机制:
1、save的规则满足的情况下,会自动触发rdb规则,测试如下:
先手动删除dump.rdb文件,实验触发规则!
在这里插入图片描述
在Redis中操作5次命令!
在这里插入图片描述
查看是否生成dump.rdb文件!
在这里插入图片描述
成功!

2、执行flushall命令,也会触发rdb规则 再次删除dump.rdb文件

image.png

执行flushall操作命令

image.png

正常生成成功

3、退出Redis,也会触发rdb规则

删除:

image.png

退出:

image.png

生成成功!

image.png

④恢复rdb文件 1、只需将备份的rdb文件放在我们的redis启动目录即可,Redis启动的时候会自动检查dump.rdb文件并恢复其中的数据!

2、查找文件位置的命令:

127.0.0.1:6379> config get dir

1) "dir"

2) "/usr/local/bin" # 如果在这个目录下存在 dump.rdb 文件,启动就会自动恢复其中的数据

⑤优缺点:

优点:

1、适合大规模的数据恢复

2、对数据的完整性要求不高

缺点:

1、需要一定的时间间隔进程操作,如果redis意外宕机了,这个最后一次修改数据就没有的了

2、fork进程的时候,会占用一定的内容空间

⑥总结:

Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的。

这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB,一般情况下不需要修改这个配置。

在生产环境我们会将这个文件进行备份

二. AOF(Append Only File)

①Redis默认使用的是RDB模式,所以需要手动开启AOF模式!
在这里插入图片描述
十分简单,将no改为yes即可

重启服务器 在这里插入图片描述

发现新文件appendonly.aof 在这里插入图片描述

②aof文件内容:
先进行一些添加的操作:
在这里插入图片描述

然后我们可以vim打开appendonly.aof文件看看里面是什么?
在这里插入图片描述

里面存储的就是我们先前操作的命令。

③优缺点

优点:

1、每一次修改都同步,文件的完整性会更加好

2、每秒同步一次,最多会丢失一秒的数据

3、从不同步,效率最高的

缺点:

1、相对于数据文件来说,aof远远大于 rdb,修复的速度也比 rdb慢

2、Aof 运行效率也要比 rdb 慢,所以我们redis默认的配置就是rdb持久化

⑥总结:

1、RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储

2、AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis 协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大。

3、只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化

4、同时开启两种持久化方式

在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。

RDB 的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段。

5、性能建议

因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留 save 900 1 这条规则。

如果Enable AOF ,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的IO,二是AOF rewrite 的最后将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值。

如果不Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个 Master/Slave 中的 RDB文件,载入较新的那个,微博就是这种架构。