跟我一起来学习Redis中的RDB持久化

296 阅读4分钟

这是我参与8月更文挑战的第11天,活动详情查看:8月更文挑战

一、为什么需要RDB持久化

  因为Redis是内存数据库,它将自己的数据库状态储存在内存里面,所以如果不想办法将储存在内存中的数据库状态保存到磁盘里面,那么一旦服务器进行退出,服务器中的数据库状态也会消失不见。

  为了解决这个问题,Redis提供了RDB持久化功能,这个功能可以将Redis在内存中的数据库状态保存到磁盘里面,避免数据库意外丢失。

  RDB持久化既可以手动执行,也可以根据服务器配置选项定期执行,该功能可以将某个时间点止的数据库状态保存到一个RDB文件中。
  RDB持久化功能所生成的RDB文件是一个经过压缩的二进制文件,通过该文件可以还原生成RDB文件时的数据库状态。

二、RDB文件的创建与载入

  有两个Redis命令可以用于生成RDB文件,一个是SAVE,另一个是BGSAVE。

  • SAVE命令会阻塞Redis服务器进程,直到RDB文件创建完毕为止,在服务器进程阻塞期间,服务器不能处理任何命令请求。
  • BGSAVE命令会派生出一个子进程,然后由子进程负责创建RDB文件,服务器进程(父进程)继续处理命令请求。

  创建RDB文件的实际工作由rdb.c/redbSave函数完成,SAVE命令和BGSAVE命令会以不同的方式调用这个函数,通过以下伪代码可以看出有明显的区别:

def SAVE():
    #创建RDB文件
    rdbSave()

def BGSAVE():
    # 创建子进程
    pid = fork()
    
    if pid == 0:
        # 子进程负责创建RDB文件
        rdbSave()
        #完成之后向父进程发送信号
        signal_parnet()
    elif pid > 0
        # 父进程继续处理命令请求,并通过轮询等待子进程的信号
        handle_request_and_wait_signal()
    else:
        # 处理出错情况
        handle_fork_error()

  RDB文件的载入工作是在服务器启动时自动执行的,所以Redis并没有专门用于载入RDB文件的命令,只要服务器启动时检测到RDB文件存在,就会自动载入RDB文件。

  另外注意的是,因为AOF文件的更新频率通常比RDB文件的更新频率高,所以:

  • 如果服务器开启了AOF持久化功能,那么服务器会优先使用AOF文件来还原数据库状态。
  • 只有在AOF持久化功能处于关闭状态时,服务器才会使用RDB文件来还原数据库状态。

  载入RDB文件的实际工作由rdb.c/rdbLoad函数完成,这个函数和rdbSave函数之间的关系可以用下图表示:

image.png

2.1 SAVE命令执行时的服务器状态

  当SAVE命令执行时,Redis服务器会被阻塞,所以当SAVE命令正在执行时,客户端发送的所有请求都会被阻塞。

2.2 BGSAVE命令执行时的服务器状态

  BGSAVE命令的保存工作是由子进程执行的,所以在子进程创建RDB文件的过程中,Redis服务器仍然可以继续处理客户端的命令请求,但是,在BGSAVE命令执行期间,服务器处理SAVE、BGSAVE、BGREWRITEAOF三个命令的方式会和平时有所不同。

  • 在BGSAVE命令执行期间,客户端发送的SAVE命令会被服务器拒绝,服务器禁止两个命令同时执行是为了避免父进程(服务器进程)和子进程同时执行两个rdbSave调用,防止产生竞争条件。
  • 在BGSAVE命令执行期间,客户端发送的BGSAVE命令会被服务器拒绝。
  • BGSAVE和BGREWRITEAOF两个命令也不能同时执行:
  • 如果BGSAVE命令正在执行,那么客户端发送的BGREWRITEAOF命令会被延迟到BGSAVE命令执行完毕之后执行。
  • 如果BGREWITEAOF命令正在执行,那么客户端发送的BGSAVE命令会被服务器拒绝。

2.3 RDB文件载入时的服务器状态

  服务器在载入RDB文件期间,会一直处于阻塞状态,直到载入工作完成为止。

三、RDB自动间隔性保存

  由于BGSAVE命令可以在不阻塞服务器进程的情况下执行,所以Redis允许用户通过设置服务器配置的save选项,让服务器每隔一段时间自动执行一次BGSAVE命令。
  用户可以通过save选项设置多个保存条件,但只要其中任意一个条件被满足,服务器就会执行BGSAVE命令。 例如,以下配置:

# 服务器在900秒之内,对数据库进行了至少一次修改
save 900 1
# 服务器在300秒之内,对数据库进行了至少10次修改
save 300 10
# 服务器在60秒之内,对数据库进行了至少10000次修改
save 60 10000