redis持久化redis是内存数据库，数据基本都存放在内存中，面临的问题就是一旦服务器进程退出，服务器中的数据库状态也

redis持久化意义

redis是内存数据库，数据基本都存放在内存中，面临的问题就是一旦服务器进程退出，服务器中的数据库状态也会消失不见。所以需要将数据保存到磁盘中，甚至是远程云服务中，当需要数据恢复时，可以直接根据备份文件恢复数据。redis对于保存到磁盘的持久化提供了俩中方案：RDB和AOF。

RDB

RDB文件就是定期生成数据的快照文件。当redis进程重新启动时，会自动读取RDB文件实现数据还原。redis默认提供开启RDB文件的持久化方案。

RDB文件生成和载入

RDB文件生成

save：SAVE命令会阻塞Redis服务器进程，直到RDB文件创建完毕为止，在服务器进程阻塞期间，服务器不能处理任何命令请求
bgsave: BGSAVE命令会派生出一个子进程，然后由子进程负责创建RDB文件，服务器进程（父进程）继续处理命令请求

生成流程

redis根据配置自己尝试去生成rdb快照文件
fork一个子进程出来
子进程尝试将数据dump到临时的rdb快照文件中
完成rdb快照文件的生成之后，就替换之前的旧的快照文件

每次生成一个新的快照，都会覆盖之前的老快照

RDB文件载入

Redis并没有专门用于载入RDB文件的命令，只要Redis服务器在启动时检测到RDB文件存在，它就会自动载入RDB文件。并且服务器在载入RDB文件期间，会一直处于阻塞状态，直到载入工作完成为止。

配置

在redis.config文件中

// 默认配置
save 900 1
save 300 10
save 60 10000

save n m

服务器在n秒之内，对数据库进行了至少m次修改

可以手动调用save或者bgsave命令，同步或异步执行rdb快照生成。
save可以设置多个，就是多个snapshotting检查点，每到一个检查点，就会去check一下，是否有指定的key数量发生了变更，如果有，就生成一个新的dump.rdb文件。

原理

saveparams

当redis服务启动是时候会自动读取redis.config配置文件信息，将多个配置读取到一个saveparam的数组中。该数组为redisServer结构的saveparams属性对应的值。

dirty和lastsave

dirty计数器记录距离上一次成功执行SAVE命令或者BGSAVE命令之后，服务器对数据库状态（服务器中的所有数据库）进行了多少次修改（包括写入、删除、更新等操作）。当服务器成功执行一个数据库修改命令之后，程序就会对dirty计数器进行更新：命令修改了多少次数据库，dirty计数器的值就增加多少。
lastsave属性是一个UNIX时间戳，记录了服务器上一次成功执行SAVE命令或者BGSAVE命令的时间。

执行

Redis的服务器周期性操作函数serverCron默认每隔100毫秒就会执行一次，该函数用于对正在运行的服务器进行维护，它的其中一项工作就是检查save选项所设置的保存条件是否已经满足，如果满足的话，就执行BGSAVE命令。

流程：

计算当前时间和上次执行时间差。
遍历saveparams属性值数据，当满足其中一个条件执行RDB文件更新。
更新dirty和lastsave值。

RDB优缺点

优点

RDB会生成多个数据文件，每个数据文件都代表了某一个时刻中redis的数据，这种多个数据文件的方式，非常适合做冷备，可以将这种完整的数据文件发送到一些远程的安全存储上去，比如说Amazon的S3云服务上去，在国内可以是阿里云的ODPS分布式存储上，以预定好的备份策略来定期备份redis中的数据。
RDB对redis对外提供的读写服务，影响非常小，可以让redis保持高性能，因为redis主进程只需要fork一个子进程，让子进程执行磁盘IO操作来进行RDB持久化即可。
相对于AOF持久化机制来说，直接基于RDB数据文件来重启和恢复redis进程，更加快速。

缺点

如果想要在redis故障时，尽可能少的丢失数据，那么RDB没有AOF好。一般来说，RDB数据快照文件，都是每隔5分钟，或者更长时间生成一次，这个时候就得接受一旦redis进程宕机，那么会丢失最近5分钟的数据。
RDB每次在fork子进程来执行RDB快照数据文件生成的时候，如果数据文件特别大，可能会导致对客户端提供的服务暂停数毫秒，或者甚至数秒。

AOF

除了RDB持久化功能之外，Redis还提供了AOF（Append Only File）持久化功能.AOF持久化是通过保存Redis服务器所执行的写命令来记录数据库状态。

AOF持久化实现

对每一条写入命令作为日志，以append-only方式追加。

流程

redis每接受一条命令就会追加日志文件
将日志文件写入到OS cache缓存中
通过fsync将OS cache中的数据写入AOF文件

配置

AOF配置

appendonly yes

AOF持久化，默认是关闭的，默认是打开RDB持久化

appendonly yes，可以打开AOF持久化机制，在生产环境里面，一般来说AOF都是要打开的，除非你说随便丢个几分钟的数据也无所谓

AOF和RDB都开启了，redis重启的时候，也是优先通过AOF进行数据恢复的，因为aof数据比较完整

AOF的fsync策略配置

# appendfsync always
appendfsync everysec
# appendfsync no

always: 每次写入一条数据，立即将这个数据对应的写日志fsync到磁盘上去，性能非常非常差，吞吐量很低; 确保说redis里的数据一条都不丢，选择该策略.
everysec: 每秒将os cache中的数据fsync到磁盘，这个最常用的，生产环境一般都这么配置，性能很高，QPS还是可以上万.
no: 仅仅redis负责将数据写入os cache就撒手不管了，然后后面os自己会时不时有自己的策略将数据刷入磁盘，不可控了.

AOF的rewrite

AOF文件是追加写入命令方式实现持久化，随着redis的持续使用，AOF文件会越来越大。面对这个问题的解决方案是AOF文件的rewrite。

rewrite实现

流程

AOF文件膨胀到配置大小界限，触发AOF文件rewrite的命令BGREWEITEAOF。
redis进程fork一个子进程，基于redis当前的内存结构，构建新的AOF文件。
在构建新的AOF文件与旧的AOF文件没有任何关系，是基于当前redis内存数据结构，并且会对写入命令进程重构，如：多条同一个键的写入重构成一条命令。
在rewrite期间，redis会继续接受新的写入命令，并把他们缓存在重新缓存区中。
redis主进程收到rewrite写完信号后，把重新缓存池中的数据写入新的AOF文件，并用新的AOF文件替代旧的。删除旧的AOF文件。

rewrite相关配置

auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb

auto-aof-rewrite-percentage 100：比如说上一次AOFrewrite之后，是128mb然后就会接着128mb继续写AOF的日志，如果发现增长的比例，超过了之前的100%，256mb，就可能会去触发一次rewrite。
auto-aof-rewrite-min-size 64mb：达到第一个100%的条件之后，还要去跟min-size：64mb去比较，256mb > 64mb，才会去触发rewrite

AOF文件破损修复

redis-check-aof --fix命令来修复破损的AOF文件，一般会把有问题的写入命令删除。

实际使用

AOF和RDB

不要仅仅使用RDB，因为那样会导致你丢失很多数据。
也不要仅仅使用AOF，因为那样有两个问题，第一，你通过AOF做冷备，没有RDB做冷备，来的恢复速度更快; 第二，RDB每次简单粗暴生成数据快照，更加健壮，可以避免AOF这种复杂的备份和恢复机制的bug
综合使用AOF和RDB两种持久化机制，用AOF来保证数据不丢失，作为数据恢复的第一选择; 用RDB来做不同程度的冷备，在AOF文件都丢失或损坏不可用的时候，还可以使用RDB来进行快速的数据恢复

注意事项

默认开始RDB，AOF需要手动开启，俩者都开启，redis重启，数据恢复优先考虑AOF文件。
如果RDB在执行snapshotting操作，那么redis不会执行AOF rewrite; 如果redis再执行AOF rewrite，那么就不会执行RDB snapshotting。
如果RDB在执行snapshotting，此时用户执行BGREWRITEAOF命令，那么等RDB快照生成之后，才会去执行AOF rewrite。

配置

在企业中，RDB的生成策略，用默认的也差不多。save 60 10000：如果你希望尽可能确保说，RDB最多丢1分钟的数据，那么尽量就是每隔1分钟都生成一个快照，低峰期，数据量很少，也没必要。10000->生成RDB，1000->RDB，这个根据你自己的应用和业务的数据量，实际决定。
AOF一定要打开，fsync策略everysec。
auto-aof-rewrite-percentage 100: 就是当前AOF大小膨胀到超过上次100%，上次的两倍。

auto-aof-rewrite-min-size 64mb: 根据你的数据量来定，16mb，32mb。

数据备份方案

RDB非常适合做冷备，每次生成之后，就不会再有修改了。

写crontab定时调度脚本去做数据备份
每小时都copy一份rdb的备份，到一个目录中去，仅仅保留最近48小时的备份
每天都保留一份当日的rdb的备份，到一个目录中去，仅仅保留最近1个月的备份
每次copy备份的时候，都把太旧的备份给删了
每天晚上将当前服务器上所有的数据备份，发送一份到远程的云服务上去

脚本：

/usr/local/redis

每小时copy一次备份，删除48小时前的数据
crontab -e
0 * * * * sh /usr/local/redis/copy/redis_rdb_copy_hourly.sh

redis_rdb_copy_hourly.sh

\#!/bin/sh 
cur_date=`date +%Y%m%d%k`
rm -rf /usr/local/redis/snapshotting/$cur_date
mkdir /usr/local/redis/snapshotting/$cur_date
cp /var/redis/6379/dump.rdb /usr/local/redis/snapshotting/$cur_date
del_date=`date -d -48hour +%Y%m%d%k`
rm -rf /usr/local/redis/snapshotting/$del_date


每天copy一次备份
crontab -e
0 0 * * * sh /usr/local/redis/copy/redis_rdb_copy_daily.sh

redis_rdb_copy_daily.sh


\#!/bin/sh 

cur_date=`date +%Y%m%d`
rm -rf /usr/local/redis/snapshotting/$cur_date
mkdir /usr/local/redis/snapshotting/$cur_date
cp /var/redis/6379/dump.rdb /usr/local/redis/snapshotting/$cur_date
del_date=`date -d -1month +%Y%m%d`
rm -rf /usr/local/redis/snapshotting/$del_date

每天一次将所有数据上传一次到远程的云服务器上去

数据恢复方案

如果是redis进程挂掉，那么重启redis进程即可，直接基于AOF日志文件恢复数据，最多就丢一秒的数据。
如果是redis进程所在机器挂掉，那么重启机器后，尝试重启redis进程，尝试直接基于AOF日志文件进行数据恢复。AOF没有破损，也是可以直接基于AOF恢复的。如果AOF文件破损，那么用redis-check-aof fix方式修复破损文件。
如果redis当前最新的AOF和RDB文件出现了丢失/损坏，那么可以尝试基于该机器上当前的某个最新的RDB数据副本进行数据恢复
当前最新的AOF和RDB文件都出现了丢失/损坏到无法恢复，一般不是机器的故障，人为找到RDB最新的一份备份，小时级的备份可以了，小时级的肯定是最新的，copy到redis里面去，就可以恢复到某一个小时的数据。

参考：

redis设计与实现
中华石杉的亿级流量

本文使用 mdnice 排版