阅读 191

Redis主从复制架构搭建

这是我参与8月更文挑战的第7天,活动详情查看:8月更文挑战


Redis虽然拥有非常高的性能,但是在实际的生产环境中,使用单机模式还是会产生不少问题的,比如说容易出现单机故障,容量瓶颈,以及QPS瓶颈等问题。通常环境下,主从复制、哨兵模式、Redis Cluster是3种比较常见的解决方案,本文将通过实例演示如何搭建Redis主从复制环境,并对其原理进行分析。

一、搭建主从复制架构

1、创建3个目录redis8000,redis8001,redis8002目录下。将默认配置文件redis.conf拷贝到redis8000下,将redis8000指定为主机,修改以下参数:

bind 0.0.0.0
port 8000
pidfile /var/run/redis_8000.pid
logfile "redis8000.log"
#节省性能,关闭rdb持久化,注释以下配置
#save 900 1
#save 300 10
#save 60 10000
dbfilename dump8000.rdb
dir /home/hydra/files/redis/slave/redis8000/
requirepass 123456
复制代码

2、将修改后的redis.conf文件拷贝到redis8001和redis8002目录下,首先批量替换配置文件中的8000端口为自己的端口:

%s/8000/8001/g
复制代码

修改配置文件:

replicaof 127.0.0.1 8000
masterauth 123456
#从机开启aof持久化
appendonly yes 
复制代码

3、分别启动3个redis实例

./redis-5.0.4/src/redis-server  ./slave/redis8000/redis.conf
./redis-5.0.4/src/redis-server  ./slave/redis8001/redis.conf
./redis-5.0.4/src/redis-server  ./slave/redis8002/redis.conf
复制代码

查看进程,启动成功:

图片

4、通过redis客户端连接主机redis8000:

./redis-5.0.4/src/redis-cli  -p 8000 -a 123456
复制代码

登录成功后,使用指令查看主从架构:

info replication
复制代码

图片

可以看出,主机8000拥有两台从机,从机8001和8002连接成功。

5、通过redis客户端连接从机redis80001,同样通过指令查看主从状态:

图片

可以看出8001的角色为slave从机,并且可以查看主机8001的相关信息。

6、此外,还可以通过指令的模式动态分配主从。复制一个redis8000的配置文件至redis8003下,修改端口为8003,其他配置不做改动。使用redis客户端登录8003后,输入指令指定主机:

slaveof 127.0.0.1 8000
复制代码

动态指定主机后,如果主机设置了密码,还需要通过指令配置主机密码:

config set masterauth 123456
复制代码

配置完成后,查看8003从机状态:

图片

查看8000主机状态:

图片

新添加的从机8003已经被添加到8000的从机当中。

需要注意的是,使用命令动态指定的主从状态,在从机重启后会失效。首先使用kill命令杀死8003进程,然后查看主从状态:

图片

可以发现,现在从机只剩下两台,为8001和8002。然后重启8003并再次查看状态:

图片

仍然为8001和8002两台从机,证明了指令指定主从在重启后会失效。

7、进行读写测试,首先测试主机,读写均能正常:

图片

测试从机,发现可以正常读数据,但是写数据失败:

图片

这是因为在主从复制的架构下,只有主机能够写数据,从机为只读模式。这是在配置文件中指定的。在Redis2.6版本以后,默认从机为只读模式:

replica-read-only yes
复制代码

需要注意这里不能将这个配置改为no,因为主机不会监听到从机的写数据事件,因而造成主从数据的不一致。

二、全量复制

用于初次复制或其它无法进行部分复制的情况,将主节点中的所有数据都发送给从节点。当数据量过大的时候,会造成很大的网络开销。流程如下:

图片

1、从机发送:

psync ? -1
复制代码

这里的"?"是因为从机暂时不知道主机的runId, -1代表全量复制

2、主机发送指令,把自己的runid和offset传给从机:

fullresync{runid,offset}
复制代码

可以通过命令查看这两个参数:

#可以查看runid
info server 
#可以查看offset
info replication
复制代码

从机之后会上报自己的偏移量offset给主机,当主机的offset和从机的offset不一样时,说明数据不一致。

3、从机保存主机数据:

save master info
复制代码

4、主机执行bgsave,全量复制会触发rdb持久化。

bgsave
复制代码

主机在生成rdb文件时,可能会有新的数据写入。这时redis把新写入的数据写入一个缓冲区repl_back_buffer,默认大小1M。可以通过repl-backlog-size设置缓冲区大小

5、主机发送rdb给从机:

send rdb
复制代码

6、主机发送缓冲区数据给从机:

send buffer
复制代码

7、从机把从机本身上的数据清空:

flush old data
复制代码

8、从机加载主机发送过来的rdb和buffer数据:

load rdb&buffer
复制代码

在全量复制中,消耗的时间包括:

  • 执行bgsave进行持久化的时间
  • rdb文件网络传输时间
  • 从节点请求请求数据时间
  • 从机加载rdb的时间
  • 如果从节点开启了aof持久化,可能进行aof重写的时间

三、部分复制

部分复制主要是Redis针对全量复制过高的开销进行的一种优化措施。Redis 希望能够在主机出现抖动或连接断开的时候,可以通过部分复制机制将损失降低到最低。

图片

具体流程如下:

  1. 出现网络抖动,连接断开 connection lost
  2. 主机继续写复制缓冲区repl_back_buffer
  3. 从机继续尝试连接主机
  4. 从机slave 会把自己当前 runid 和偏移量传输给主机 master,并且执行 pysnc 命令同步
  5. 如果 master 发现偏移量是在缓冲区的范围内,就会返回 continue 命令
  6. 同步了 offset 的部分数据,所以部分复制的基础就是偏移量 offset。

那么在正常的情况下,Redis是如何决定全量复制还是部分复制的呢?从机将自己的offset发送给主机后,主机根据offset和缓冲区大小决定能否执行部分复制:

  • 如果offset偏移量之后的数据,仍然都在复制积压缓冲区里,则执行部分复制
  • 如果offset偏移量之后的数据已不在复制积压缓冲区中,则执行全量复制

四、主从复制架构缺点

1.由于所有的写操作都是先在主机上操作,然后同步更新到从机上,所以同步过程有一定的延迟,当系统很繁忙的时候,延迟问题会更加严重。从机数量增加时,会使这个问题更加严重。

2.当主机宕机之后,将不能进行写操作,需要手动将从机升级为主机,从机需要重新指定主机。

手动在一台从机上执行下面命令,将它升级为主机:

slave of no one
复制代码

再在其他从机上执行slave of指令,将自身变成新主机的从机:

slave of 192.168.0.1 800X
复制代码

可以看出这种情况下,当主机宕机后,后续的修复流程由人工操作,非常麻烦,因此在这种情况下Redis引入了哨兵模式,来完成主机宕机后的自动故障转移,之后文章我们具体来聊聊哨兵模式。

最后

如果觉得对您有所帮助,小伙伴们可以点赞、转发一下,非常感谢
公众号码农参上,来加个好友,做个点赞之交啊

文章分类
后端
文章标签