Redis迁移方法介绍

10,709 阅读6分钟

Redis迁移方法介绍

文章来源: 陶老师运维笔记- 微信公众号

redis

工作中有时会遇到需要把原Redis集群下线,迁移到另一个新的Redis集群的需求(如机房迁移,Redis上云等原因)。此时原Redis中的数据需要如何操作才可顺利迁移到一个新的Redis集群呢? 本节简单介绍相关方法及一些工具。

redis有主从架构及redis-cluster架构,架构不同,两者的迁移方法也是不相同的。

1. Redis主从迁移

若原来的redis集群为主从结构,则迁移工作是相当简单方便的。可使用slaveof迁移或aof/rdb迁移数据。

  • slaveof : 利用slaveof制作新的从库,从而达到数据迁移的目的。
  • aof迁移: 暂停写服务,把aof文件导出到新的redis机群中完成数据迁移。

1.1 slaveof同步数据

如下示例:将把原来redis_master 192.124.64.212:6379迁移到新redis_master 192.124.64.214:6380

#旧 redis_master 192.124.64.212:6379 --> 新redis_master 192.124.64.214:6380
1.数据同步
$redis-cli -h redis_master_new 6380 slaveof redis_master_old 6379
$redis-cli -h 192.124.64.214 6380 slaveof 192.124.64.212 6379

2.修改新read-only配置为no.

修改新redis的read-only配置为no,新的redis可以写数据。否则会出错.
$redis-cli -h 192.124.64.214 -p 6380 -a pwd123 set foo bar
(error) READONLY You can't write against a read only slave

查看当前slave-read-only配置
$redis-cli -h 192.124.64.214 -p 6380 -a pwd123 config  get slave-read-only
1) "slave-read-only"
2) "yes"

$redis-cli -h 192.124.64.214 6380 config set slave-read-only no
$redis-cli -h 192.124.64.214 6380 config get slave-read-only

3. 业务停止对原redis停写.

4. 业务变更redis配置,重启web服务
   业务修改redis配置为新的redis地址,并重启web服务。

5. 检查新/旧redis链接情况
旧redis:
redis-cli -h 192.124.64.212 -p 6379 -a pwd123 info clients
connected_clients:1
redis-cli -h 192.124.64.212 -p 6379 -a pwd123  client list
redis-cli -h 192.124.64.212 -p 6379 -a pwd123  client list  |awk -F'addr=' '{print $2}' | awk '{print $1}'|awk -F':' '{print $1}'|sort |uniq -c|sort -nr 
      1 192.124.64.214
新redis: 
redis-cli -h 192.124.64.214 -p 6380 -a pwd123 info clients
redis-cli -h 192.124.64.214 -p 6380 -a pwd123 dbsize

6.断开同步
redis-cli -h 192.124.64.214 -p 6380 info |grep role
redis-cli -h 192.124.64.214 -p 6380 slaveof NO ONE
OK
redis-cli -h 192.124.64.214 -p 6380 info |grep role
role:master

7. 测试业务情况(略)

1.2 aof同步数据

若是原来的redis可以暂停写操作,则咱们用aof来同步数据也很方便。

#旧redis导出aof文件
$redis-cli -h old_instance_ip -p old_instance_port config set appendonly yes
$redis-cli -h old_instance_ip -p old_instance_port configconfig get appendonly
1) "appendonly"
2) "yes"
#aof文件导入到新的redis
$redis-cli -h new_redis_instance_ip -p 6379 -a password --pipe < appendonly.aof
#导入完成后,关闭原redis AOF
$redis-cli -h old_instance_ip -p old_instance_port config set appendonly no

slaveof及aof迁移对比:

  • slaveof 会把目标redis库上当前的key全部清除,这点要注意。
  • 当redis数据量较大时使用slaveof xxx,会给master带来较大的压力。最好业务低峰时间处理。
  • aof迁移数据可以保留新redis上已存在的数据,这点不同于slaveof。
  • aof不能实时同步,所以迁移期间的redis增量数据不能同步,故常需要把原来的redis停写操作。

2. Redis集群迁移

2.1 Redis-cluster介绍

Redis-cluster是 redis 的一个分布式实现,cluster将数据存储到多个不同Redis实例中,解决了单机Redis容量有限的问题。并且Redis-cluster某个节点故障时,若此节点有可用的从库,则redis-cluster将可以继续处理请求,从而实现了redis的高可用。

redis-cluster

2.2 Redis-cluster迁移

方法1: 集群节点增删实现 把Redis新节点逐台加入当前集群,变成一个大的Redis集群。 然后进行手动failover,最后下线原主库节点。

说明: 要注意的是在需要故障转移的slave节点上执行,否则报错:(error) ERR You should send CLUSTER FAILOVER to a slave

#redis-cli -h 192.124.64.212 -p 6301 -a pwd123 -c cluster nodes |grep master  |sort -k 9n   
#redis-cli -h 192.124.64.212 -p 6301 -a pwd123 -c cluster nodes |grep slave  |sort -k 9n
#/usr/local/redis-5.0.6/bin/redis-cli --cluster info 192.124.64.212:6301 -a pwd123 
#/usr/local/redis-5.0.6/bin/redis-cli --cluster check 192.124.64.212:6301 -a pwd123

redis-cli -h 新加的从库节点 -p 6301 -a pwd123 cluster failover

方法2:迁移工具实现

若场景是希望原Redis集群暂时保留,即如下图,同时有两个独立的集群,则就无法使用迁移方法1。(如双机房Redis高可用场景)

Redis迁移
Redis-Cluster是由多个redis实例组成的集群,无法直接使用slave of 命令把redis-cluster-B变成redis-cluster-A的从库。

redis-cluster迁移:

  • 若是业务可以中断,可停止Cluster-A 写操作,把Redis rdb/aof文件传输到新的Cluster-B机群再重启服务。
  • 使用某些redis数据迁移工具来迁移redis-cluster数据。(推荐此方法)

3. Redis迁移工具

3.1 常见Redis迁移工具

常见redis迁移工具:

  • redis-dump: redis-dump 是一个将redis数据导入/导出为json格式数据的小工具。
  • redis-port : 最初是 codis 项目相关工具,支持实时同步 redis 数据到 codis/redis等中。
  • redis-migrate-tool: 是唯品会开源的redis数据迁移工具,可用于异构redis集群间的数据在线迁移。
  • redis-shake : 是阿里云的redis数据同步的工具。支持redis主从->redis-cluster,cluster-cluster等多种redis架构的数据同步。

redis-dump:

redis-dump可以方便的把一个redis实例的数据导出来(不是redis-cluster的数据)。redis-dump命令需要用到keys命令,若是rename此命令,则redis-dump将会出错。

#把192.124.64.212:6379 数据导到192.124.64.214:6380。 
$redis-dump -u :pwd123@192.124.64.212:6379 |  redis-load -u :pwd123@192.124.64.214:6380 
#
$redis-dump -u :pwd123@192.124.64.212:6379
{"db":0,"key":"foo","ttl":-1,"type":"string","value":"bar","size":3}
#keys不可用将出错
$redis-dump -u :pwd123@192.124.64.212:6379>redis_6379.json
ERR unknown command 'keys'

redis-port/redis-migrate-tool/ redis-shake : 这几个工具功能相近,可支持redis的实时数据同步。本文以redis-shake来重点介绍。

3.2 Redis-shake

3.2.1 Redis-shake简介

redis-shake是阿里云自研的开源工具,支持对Redis数据进行解析(decode)、恢复(restore)、备份(dump)、同步(sync/rump)。在sync模式下,redis-shake使用SYNC或PSYNC命令将数据从源端Redis同步到目的端Redis,支持全量数据同步和增量数据同步,增量同步在全量同步完成后自动开始。

功能介绍:

  • 备份dump:将源redis的全量数据通过RDB文件备份起来。
  • 解析decode:对RDB文件进行读取,并以json格式解析存储。
  • 恢复restore:将RDB文件恢复到目的redis数据库。
  • 同步sync: 支持源redis和目的redis的数据同步,支持全量和增量数据的迁移。支持单节点、主从版、集群版之间的互相同步。需要注意的是,如果源端是集群版,可以启动一个RedisShake,从不同的db结点进行拉取,同时源端不能开启move slot功能;对于目的端,如果是集群版,写入可以是1个或者多个db结点。
  • 同步rump:支持源redis和目的redis的数据同步,仅支持全量的迁移。采用scan和restore命令进行迁移,支持不同云厂商不同redis版本的迁移。

3.2.2 redis-shake迁移原理

redis-shake的基本原理就是模拟一个从节点加入源redis集群,首先进行全量拉取并回放,然后进行增量的拉取(通过psync命令)。如下图所示:

redis-shark原理
如果源端是集群模式,只需要启动一个redis-shake进行拉取,同时不能开启源端的move slot操作。如果目的端是集群模式,可以写入到一个结点,然后再进行slot的迁移,当然也可以多对多写入。

4. 环境准备

4.1 机器规划

本文进行Redis集群迁移测试,为了节约机器,目标集群复用了源Redis机器,只是修改了端口。 本文计划测试cluster_A---> cluster_B,及Cluster_A---> Redis_C主从的两种迁移场景。

redis-shake机器:

角色 版本 IP
redis-shake redis-shake-1.6.24 192.124.64.212

源Redis集群A:

角色 版本 IP port
node-1 redis-5.0.6 192.124.64.212 6301,7301
node-2 redis-5.0.6 192.124.64.213 6301,7301
node-3 redis-5.0.6 192.124.64.214 6301,7301

目标Redis集群B:

角色 版本 IP port
node-1 redis-5.0.6 192.124.64.212 6302,7302
node-2 redis-5.0.6 192.124.64.213 6302,7302
node-3 redis-5.0.6 192.124.64.214 6302,7302

目标Redis主从C:

角色 版本 IP port
node-1 redis-5.0.6 192.124.64.212 6303
node-2 redis-5.0.6 192.124.64.213 6303

4.2 Redis集群安装

目标Redis集群B安装:

#各节点启动6302,启动7302
/usr/local/redis/bin/redis-server  /data1/redis6302/conf/redis-cluster-6302.conf 
/usr/local/redis/bin/redis-server  /data1/redis7302/conf/redis-cluster-7302.conf 

#创建cluster, 3主3从
$ /usr/local/redis-5.0.6/bin/redis-cli --cluster create  192.124.64.212:6302 192.124.64.213:6302 192.124.64.214:6302 192.124.64.213:7302 192.124.64.214:7302 192.124.64.212:7302 \
--cluster-replicas 1 -a pwd123

#redis5.0.x命令,检查集群情况
$/usr/local/redis-5.0.6/bin/redis-cli --cluster info 192.124.64.212:6302 -a pwd123
$/usr/local/redis-5.0.6/bin/redis-cli --cluster check 192.124.64.212:6302 -a pwd123

目标Redis主从C安装:

#安装及启动redis服务  (212,213机器)
/usr/local/redis/bin/redis-server /data1/redis6303/conf/redis-6303.conf

#Redis主从搭建 (213机器)
$redis-cli -h 127.0.0.1 -p 6303 -a pwd123  slaveof 192.124.64.212 6303

5. 迁移实施

5.1 redis-shark安装

软件下载地址: github.com/alibaba/Red… 。软件解压缩后就可使用。

安装:

#安装redis-shake
$wget 'https://github.com/alibaba/RedisShake/releases/download/release-v1.6.24-20191220/redis-shake-1.6.24.tar.gz' .
$tar -zxvf redis-shake-1.6.24.tar.gz
$mv redis-shake-1.6.24 /usr/local/redis-shake
#环境变量
$echo 'export PATH=$PATH:/usr/local/redis-shake'>>/etc/profile
$source /etc/profile

#查看版本
$redis-shake.linux  --version

#目录中文件信息
$tree /usr/local/redis-shake
.
├── ChangeLog
├── redis-shake.conf
├── redis-shake.darwin
├── redis-shake.linux
├── redis-shake.windows
├── start.sh
└── stop.sh

启动:

#启动程序, xxx为sync, restore, dump, decode, rump之一
$redis-shake.linux -conf=redis-shake.conf -type=xxx 

redis-shake --conf={配置文件地址} --type={模式:sync/dump等} 模式需要与配置文件中的source target对应。 模式为sync, restore, dump, decode, rump其中之一,全量+增量同步请选择sync。 mac下请使用redis-shake.darwin,windows请用redis-shake.windows

redis-shake模式介绍:

  • dump模式 : 将云数据库Redis版实例中的数据备份到RDB文件中。
  • decode模式: decode实现对RDB文件进行读取,并以json格式解析存储。
  • restore模式: restore模式可将RDB文件恢复到目的redis数据库。
  • sync模式: sync模式将某Redis数据迁移至其它Redis集群。
  • rump模式: rump模式采用scan和restore命令进行迁移,支持不同云厂商不同redis版本的迁移。

5.2 redis-shake配置

5.2.1 sync模式参数

在sync模式下,redis-shake使用SYNC或PSYNC命令将数据从源端Redis同步到目的端Redis,支持全量数据同步和增量数据同步,增量同步在全量同步完成后自动开始。

sync模式参数说明:

参数 说明 示例
source.type 支持standalone,sentinel,cluster和proxy cluster
source.address 源Redis的连接地址与服务端口。 xxx.xxx.1.10:6379
source.password_raw 源Redis的连接密码。 SourcePass233
target.address 目的Redis的连接地址与服务端口。 xx.redis.rds.aliyuncs.com:6379
target.password_raw 目的Redis的连接密码。 TargetPass233
rewrite 如果目的Redis有相同的key,是否覆盖,可选值:true(覆盖);false(不覆盖)。 默认为true,为false且存在数据冲突则会出现异常提示。
target.db 待迁移的数据在目的Redis中的逻辑数据库名。当该值设置为-1时,源Redis和目的Redis中的名称相同 -1
parallel RDB文件同步中使用的并发线程数,用于提高同步性能。 最小值为1,推荐值为64。

5.3 执行迁移

分别演示下cluster_A---> cluster_B,及Cluster_A---> Redis_C主从的两种场景。

5.3.1 Redis-Cluster迁移到Redis-Cluster

源Redis集群A:

角色 版本 IP port
node-1 redis-5.0.6 192.124.64.212 6301,7301
node-2 redis-5.0.6 192.124.64.213 6301,7301
node-3 redis-5.0.6 192.124.64.214 6301,7301

目标Redis集群B:

角色 版本 IP port
node-1 redis-5.0.6 192.124.64.212 6302,7302
node-2 redis-5.0.6 192.124.64.213 6302,7302
node-3 redis-5.0.6 192.124.64.214 6302,7302

1)检查源/目标Redis信息

获取源端集群信息:
echo 'cluster nodes' | redis-cli -c -h 192.124.64.212  -p 6301 -a pwd123 | egrep master 
源端集群master: 192.124.64.212:6301;192.124.64.213:6301;192.124.64.214:6301

获取目标端集群信息:
echo 'cluster nodes' | redis-cli -c -h 192.124.64.212 -p 6302 -a pwd123 | egrep master 
目标集群master: 192.124.64.212:6302;192.124.64.213:6302; 192.124.64.214:6302

2)配置RedisShake

修改配置文件,重点是修改source.type,source.address,source.password_raw; target.type,target.address,target.password_raw。

which  redis-shake
/usr/local/redis-shake/redis-shake
  
$cd /usr/local/redis-shake/
$vim /usr/local/redis-shake/redis-shake-cluster.conf
#配置如下
# id唯一标识一次同步进程
id=redis-shake-cluster
log.file = /var/log/redis-shake.log
log.level = info
# 端口配置,默认
system_profile = 9310
http_profile = 9320
 
# source相关配置[cluster|standalone]
source.type = cluster
#source.addres,需要配置源端的所有集群中db节点列表以及目的端集群所有db节点列表
source.address = 192.124.64.212:6301;192.124.64.213:6301;192.124.64.214:6301
source.password_raw = pwd123
source.auth_type = auth
 
# Des相关配置
target.type= cluster
target.address = 192.124.64.212:6302;192.124.64.213:6302;192.124.64.214:6302
target.password_raw = pwd123

target.auth_type = auth
# all the data will be written into this db. < 0 means disable.
target.db = -1

# 过滤执行类型的key
# filter.key = QH;cn
# 在rdb全量同步阶段,如果目标redis已经存在对应的key时是否覆盖,如果为false就抛异常
rewrite = true
# 是否做metric统计,建议设置为true,如果设置为false,/metric中的部分参数的值就一直是0
metric = true

3)执行迁移 执行迁移,开启数据同步迁移。 若是数据量特别大,需要在压力低峰时,要后台执行迁移。

$redis-shake.linux -type sync -conf ./redis-shake-cluster.conf   

4)监控进度

查看日志:

查看同步日志确认同步状态,当出现sync rdb done时,全量同步已经完成,同步进入增量阶段。若**+forward=0,则此时源端没有新的数据写入,同步链路中没有增量数据正在传输**,您可以以此为依据选择适当的时机将业务切换到Cluster_B集群。

$tail -f /var/log/redis-shake.log 
2020/04/15 20:28:40 [INFO] dbSyncer[2] FlushEvent:IncrSyncStart Id:redis-shake-cluster
2020/04/15 20:28:40 [INFO] dbSyncer[1] total = 178B -         178B [100%]  entry=0
2020/04/15 20:28:40 [INFO] dbSyncer[1] sync rdb done
2020/04/15 20:28:40 [INFO] dbSyncer[1] FlushEvent:IncrSyncStart Id:redis-shake-cluster
2020/04/15 20:28:41 [INFO] dbSyncer[2] sync:  +forwardCommands=0      +filterCommands=0      +writeBytes=0
2020/04/15 20:28:41 [INFO] dbSyncer[0] sync:  +forwardCommands=0      +filterCommands=0      +writeBytes=0

监控状态:

$curl 127.0.0.1:9320/metric | python -m json.tool

5)检查验证 可以用scan命令来简单抽查数据同步的结果。也可以用redis-full-check进行数据校验,确保两端数据一致,详细步骤请参见校验迁移后的数据

测试写入数据:

#源Redis,写入测试数据
$redis-cli  -c -h 192.124.64.212 -p 6301 -a pwd123 
192.124.64.212:6301> set foo bar
192.124.64.214:6301> set foo1 bar1
192.124.64.214:6301> scan 0 match '*' count 1000 
1) "0"
2) 1) "foo"
   2) "foo1"

#目标Redis,用scan检查
$redis-cli  -c -h 192.124.64.212 -p 6302 -a pwd123  scan 0 match '*' count 1000  
1) "0"
2) 1) "foo"
   2) "foo1"

说明: scan命令只能对某一个redis节点scan,不支持对cluster scan。

检查keys数:

#源Redis
/usr/local/redis-5.0.6/bin/redis-cli --cluster info 192.124.64.212:6301 -a pwd123   
192.124.64.212:6301 (5e19efdd...) -> 2 keys | 6720 slots | 1 slaves.
192.124.64.213:6301 (8021b063...) -> 0 keys | 5462 slots | 1 slaves.
192.124.64.214:6301 (7f411012...) -> 2 keys | 4202 slots | 1 slaves.
[OK] 4 keys in 3 masters.

#目标Redis
/redis-cli -h 192.124.64.212 -p 6303 -a pwd123  scan 0 match '*' count 1000  
1) "0"
2) 1) "foo"
   2) "foo1"

可以看到源及目标redis集群,keys的数目是一致的。

5.3.2 Redis-Cluster迁移到Redis主从

源Redis集群A:

角色 版本 IP port
node-1 redis-5.0.6 192.124.64.212 6301,7301
node-2 redis-5.0.6 192.124.64.213 6301,7301
node-3 redis-5.0.6 192.124.64.214 6301,7301

目标Redis主从C:

角色 版本 IP port
node-1 redis-5.0.6 192.124.64.212 6303
node-2 redis-5.0.6 192.124.64.213 6303

1)配置RedisShake

修改配置文件,重点是修改source.type,source.address,source.password_raw; target.type,target.address,target.password_raw。

$vim ./redis-shake-standalone.conf 
source.type = cluster
#source.addres,需要配置源端的所有集群中db节点列表以及目的端集群所有db节点列表
source.address = 192.124.64.212:6301;192.124.64.213:6301;192.124.64.214:6301
source.password_raw = pwd123
source.auth_type = auth

# Des相关配置
target.type= standalone
target.address = 192.124.64.212:6303;192.124.64.213:6303
target.password_raw = pwd123

2)执行迁移

执行迁移,开启数据同步迁移。 若是数据量特别大,需要在压力低峰时,要后台执行迁移。

$redis-shake.linux -type sync -conf ./redis-shake-standalone.conf   

3)检查验证

检查日志:

$tail -f  /var/log/redis-shake.log 
2020/04/15 21:10:23 [INFO] dbSyncer[2] sync rdb done
2020/04/15 21:10:23 [INFO] dbSyncer[2] FlushEvent:IncrSyncStart Id:redis-shake-cluster
2020/04/15 21:10:23 [WARN] dbSyncer[2] GetFakeSlaveOffset not enable when psync == false
2020/04/15 21:10:24 [INFO] dbSyncer[1] sync:  +forwardCommands=0      +filterCommands=0      +writeBytes=0

检查数据:

#源Redis,写入数据
$redis-cli -c -h 192.124.64.212 -p 6301 -a pwd123 set hello hi
$redis-cli -c -h 192.124.64.212 -p 6301 -a pwd123 set foo barbar
$redis-cli -c -h 192.124.64.212 -p 6301 -a pwd123 set foo1 bar1bar1
#
$redis-cli --cluster info 192.124.64.212:6301 -a pwd123   
192.124.64.212:6301 (5e19efdd...) -> 1 keys | 6720 slots | 1 slaves.
192.124.64.213:6301 (8021b063...) -> 0 keys | 5462 slots | 1 slaves.
192.124.64.214:6301 (7f411012...) -> 2 keys | 4202 slots | 1 slaves.
[OK] 3 keys in 3 masters.

#目标Redis,查看数据
$redis-cli   -h 192.124.64.212 -p 6303 -a pwd123  scan 0 match '*' count 1000
1) "0"
2) 1) "hello"
   2) "foo"
   3) "foo1"

可以看到源及目标redis集群,keys的数目是一致的。

参考:


陶老师运维笔记