Redis 持久化之 RDB

75 阅读4分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第4天,点击查看活动详情

Redis 持久化之 RDB

总体介绍

Redis 提供了 2 个不同形式的持久化方式:

  • RDB(Redis DataBase)
  • AOF(Append Of File)

RDB

简介

在指定的时间间隔内将内存中的数据集快照写入磁盘, 也就是行话讲的 Snapshot 快照,它恢复时是将快照文件直接读到内存里。

备份是如何执行的

Redis 会单独创建(fork)一个子进程来进行持久化,首先会将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何 IO 操作的,这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那 RDB 方式要比 AOF 方式更加的高效。RDB 的缺点是最后一次持久化后的数据可能丢失。

Fork

  • Fork 的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等) 数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
  • 在 Linux 程序中,fork () 会产生一个和父进程完全相同的子进程,但子进程在此后多会 exec 系统调用,出于效率考虑,Linux 中引入了 “写时复制技术”。
  • 一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。

RDB 持久化流程

bgsave的工作流程如下图所示,整体可以简述为:

  1. 主进程fork出一个子进程,这时候主进程会被阻塞
  2. 子进程创建完成后,redis客户端会输出Background saving started,这就意味子进程开始进行持久化操作了
  3. 子进程持久化完成后,会生成一个rdb文件,将本次的rdb文件通过原子替换的方式将上一次备份的rdb覆盖。
  4. 子进程发送信号通知父进程本次任务完成

图片.png

dump.rdb 文件

在 redis.conf 中配置文件名称,默认为 dump.rdb。

rdb 文件的保存路径,也可以修改。默认为 Redis 启动时命令行所在的目录下 “dir ./”

如何触发 RDB 快照保持策略

配置文件中默认的快照配置 snapshotting

# 配置redis在n秒内如果超过m个key则修改就自动致快照。
# snapshotting设置:
save 900 1 #900秒内如果超过1个key被修改则发起快照保存
save 300 10 #300秒内如果超过10个key被修改则发起快照保存
save 60 10000 #60秒内如果超过10000个key被修改则发起快照保存

命令 save VS bgsave

  • save :save 时只管保存,其它不管,全部阻塞。手动保存,不建议。
  • bgsave:Redis 会在后台异步进行快照操作, 快照同时还可以响应客户端请求。
  • 可以通过 lastsave 命令获取最后一次成功执行快照的时间。

flushall 命令

执行 flushall 命令,也会产生 dump.rdb 文件,但里面是空的,无意义。

优势

  • 适合大规模的数据恢复
  • 对数据完整性和一致性要求不高更适合使用
  • 节省磁盘空间
  • 恢复速度快

劣势

  • Fork 的时候,内存中的数据被克隆了一份,大致 2 倍的膨胀性需要考虑。
  • 虽然 Redis 在 fork 时使用了写时拷贝技术,但是如果数据庞大时还是比较消耗性能。
  • 在备份周期在一定间隔时间做一次备份,所以如果 Redis 意外 down 掉的话,就会丢失最后一次快照后的所有修改。

如何停止

动态停止 RDB:redis-cli config set save "" #save 后给空值,表示禁用保存策略。