Redis持久化机制

227 阅读5分钟

Redis持久化

RDB快照(snapshot)

默认的持久化方式,Redis将内存的数据库快照保存在dump.rdb的二进制文件中

其保存策略 save n mn秒内至少m个key被修改则自动保存数据集,

比如说, save 60 1000 //关闭RDB只需要将所有的save保存策略注释掉即可

也可以手动执行命令生成RDB快照,进入redis-cli,执行save/bgsave则生成RDB快照,每次命令执行都会将所有redis内存快照到一个新的rdb文件里,并覆盖原有rdb快照文件。

bgsave的写时复制(COW)机制

Redis借助操作系统提供的写时复制技术(Copy-On-Write COW),在生成快照的同时,依然可以处理写命令。简单来说,bgsave子进程由主线程fork生成的,可以共享主线程的所有内存数据,bgsave子线程运行后,开始读取主线程的内存数据,并将其写入RDB文件。此时,如果主线程对这些数据也都是读操作,那么主线程和bgsave子进程互不影响。但是当主线程要修改一块数据,那么,这块数据就会被复制一份,生成该数据的副本。然后,bgsave子进程会把这个副本数据写入rdb文件,而在这个过程中,主线程仍然可以直接修改原来的数据。

save/bgsave的比较

image.png

配置自动生成rdb文件后台使用的是bgsave方式。

AOF(append-only file)

快照功能并不是非常耐久:如果Redis因为某些原因而造成停机故障,那么服务器将丢失最近写入、且未保存至快照中的那些数据,从1.1版本起,Redis增加了之中完全耐久的持久化方式:AOF持久化,将修改的每一条指令记录到文件appendonly.aof(先写入os的cache,每隔一段时间fsync到磁盘)

比如执行命令“set justin 666”,aof文件会记录如下数据

*3
$3
set
$6
justin
$3
666

这是一种resp协议格式数据,*后面的数字代表命令有多少个参数,$号后面的数字代表这个参数有几个字符

你可以通过修改配置文件来打开 AOF 功能:

# appendonly yes

从现在开始, 每当 Redis 执行一个改变数据集的命令时(比如 SET), 这个命令就会被追加到 AOF 文 件的末尾。

这样的话, 当 Redis 重新启动时, 程序就可以通过重新执行 AOF 文件中的命令来达到重建数据集的目的。

你可以配置 Redis 多久才将数据 fsync 到磁盘一次。

有三个选项:

1 appendfsync always:每次有新命令追加到 AOF 文件时就执行一次 fsync ,非常慢,也非常安全。

2 appendfsync everysec:每秒 fsync 一次,足够快,并且在故障时只会丢失 1 秒钟的数据。

3 appendfsync no:从不 fsync ,将数据交给操作系统来处理。更快,也更不安全的选择。

推荐(并且也是默认)的措施为每秒 fsync 一次, 这种 fsync 策略可以兼顾速度和安全性。

AOF重写

AOF文件里可能有太多没用指令,所以AOF会定期根据内存的最新数据生成aof文件

127.0.0.1:6379> set readcount 1
OK
127.0.0.1:6379> incr readcount
(integer) 2
127.0.0.1:6379> incr readcount
(integer) 3
127.0.0.1:6379> incr readcount
(integer) 4
127.0.0.1:6379> incr readcount
(integer) 5
127.0.0.1:6379> 

重写之前aof文件内容

*3
$3
set
$9
readcount
$1
1
*2
$4
incr
$9
readcount
*2
$4
incr
$9
readcount
*2
$4
incr
$9
readcount
*2
$4
incr
$9
readcount

手动执行BGREWRITEAOF命令重写aof,aof文件内容如下

REDIS0009	redis-ver6.0.9
redis-bits󿿀򳨭e-oused-me%
                       aof-preamble󿾁þ	readcount󿾆justinZÿpµ

因为我的Redis版本是6.0.9,6.0以上的版本默认开启了混合持久化方式,Redis4.0版本开始支持混合持久化

一旦开启AOF持久化,会根据配置的机制自动重写

1 # auto‐aof‐rewrite‐min‐size 64mb //aof文件至少要达到64M才会自动重写,文件太小恢复速度本来就
很快,重写的意义不大
2 # auto‐aof‐rewrite‐percentage 100 //aof文件自上一次重写后文件大小增长了100%则再次触发重写

RDB和AOF,我应该用哪一个?

image.png

redis启动时如果既有rdb文件又有aof文件则优先选择aof文件恢复数据,因为aof一般来说数据更全一点。

Redis4.0 混合持久化

重启 Redis 时,我们很少使用 RDB来恢复内存状态,因为会丢失大量数据。我们通常使用 AOF 日志重

放,但是重放 AOF 日志性能相对 RDB来说要慢很多,这样在 Redis 实例很大的情况下,启动需要花费很

长的时间。 Redis 4.0 为了解决这个问题,带来了一个新的持久化选项——混合持久化。

通过如下配置可以开启混合持久化(必须先开启aof):

# aof-use-rdb-preamble yes

如果开启了混合持久化,AOF在重写时,不再是单纯将内存数据转换为RESP命令写入AOF文件,而是将重写这一刻之前的内存做RDB快照处理,并且将RDB快照内容和增量的AOF修改内存数据的命令存在一起,都写入新的AOF文件,新的文件一开始不叫appendonly.aof,等到重写完新的AOF文件才会进行改名,覆盖原有的AOF文件,完成新旧两个AOF文件的替换。

于是在 Redis 重启的时候,可以先加载 RDB 的内容,然后再重放增量 AOF 日志就可以完全替代之前的 AOF 全量文件重放,因此重启效率大幅得到提升。

混合持久化AOF文件结构如下

image.png

Redis数据备份策略:

  1. 写crontab定时调度脚本,每小时都copy一份rdb或aof的备份到一个目录中去,仅仅保留最近48

小时的备份

  1. 每天都保留一份当日的数据备份到一个目录中去,可以保留最近1个月的备份

  2. 每次copy备份的时候,都把太旧的备份给删了

  3. 每天晚上将当前机器上的备份复制一份到其他机器上,以防机器损坏