Redis高可用之主从复制、哨兵、cluster集群

130 阅读11分钟

Redis主从复制

主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(Master),后者称为从节点(slave);数据的复制是单向的,只能由主节点到从节点。

默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。

1.1 主从复制的作用

  • 数据冗余: 主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
  • 故障恢复: 当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
  • 负载均衡: 在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
  • 高可用基石: 除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。

QQ截图20221110211303.png

Redis主从架构可以解决单机的读写瓶颈问题,但是没有自动故障转移功能,不能解决master单点故障问题。

1.2 主从复制流程

(1)若启动一个slave机器进程,则它会向Master机器发送一个sync command命令,请求同步连接。

(2)无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作),同时Master还会记录修改数据的所有命令并缓存在数据文件中.

(3)后台进程完成缓存操作之后,Master机器就会向slave机器发送数据文件,slave端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给slave端机器。若slave出现故障导致宕机,则恢复正常后会自动重新连接。

(4)Master机器收到slave端机器的连接后,将其完整的数据文件发送给slave端机器,如果Mater同时收到多个slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的slave端机器,确保所有的slave端机器都正常。

小结:

  • 从节点向主节点发送请求同步命令。

  • 主节点启动后台进程,执行rdb操作,将内存数据快照保存硬盘文件中。主节点把数据文件发送到从节点,从节点将数据保存到硬盘上,然后加载到内存,进行读取复制。

  • 之后如果主节点还有数据改动,再将保存的数据文件发送给从节点,从节点再加载。

搭建Redis主从复制

2.1 环境准备:

主机类型IP地址
master节点192.168.85.60
slave1192.168.85.70
slave2192.168.85.80

软件包版本: redis-5.0.7.tar.gz

2.2 修改 Master、Slave1、Slave2 节点的主机名

 ##Master 节点##
 hostnamectl set-hostname mysql1
 su
 ​
 ##Slave1节点##
 hostnamectl set-hostname mysql2
 su
 ​
 ##Slave2节点##
 hostnamectl set-hostname mysql3
 su

2.3 实验步骤:

2.4 所有节点安装Redis

安装redis,在NoSQL之Redis配置及优化篇中有完整过程:NOSQL----Redis 配置与优化 - 掘金 (juejin.cn)

Master节点修改Redis配置文件

vim /etc/redis/6379.conf

QQ截图20221110220702.png QQ截图20221110220831.png QQ截图20221110220914.png QQ截图20221110220951.png QQ截图20221110221156.png QQ截图20221110222317.png QQ截图20221110222328.png

2.5 Slave节点修改Redis配置文件

QQ截图20221110222512.png QQ截图20221110222550.png QQ截图20221110222628.png QQ截图20221110222700.png QQ截图20221110222810.png QQ截图20221110222836.png QQ截图20221110222945.png QQ截图20221110223005.png

2.6 验证主从成果

在master节点上查看日志

tail /var/log/redis_6379.log

QQ截图20221110224324.png

在Master节点上验证从节点

QQ截图20221110224518.png

Redis哨兵模式

主从切换技术的方法是:当服务器宕机后,需要手动一台从机切换为主机,这需要人工干预,不仅费时费力而且还会造成一段时间内服务不可用。为了解决主从复制的缺点,就有了哨兵机制。

哨兵的核心功能: 在主从复制的基础上,哨兵引入了主节点的自动故障转移。

3.1 哨兵模式的作用

  • 监控: 哨兵会不断地检查主节点和从节点是否运作正常。

  • 自动故障转移: 当主节点不能正常工作时,哨兵会开始自动故障转移操,它会将失效主节点的其中一个从节点升级为新的主节点,并让其它从节点改为复制新的主节点。

  • 通知(提醒): 哨兵可以将故障转移的结果发送给客户端。

3.2 哨兵结构

哨兵节点:  哨兵系统由一个或多个哨兵节点组成,哨兵节点是特殊的redis节点,不存储数据

数据节点:  主节点和从节点都是数据节点。

3.3 故障转移机制

1、由哨兵节点定期监控发现主节点是否出现了故障

每个哨兵节点每隔1秒会问主节点、从节点及其它哨兵节点发送一次ping命令做一次心检测。如果主节点在一定时间范围内不回复或者是回复一个错误消息,那么这个哨兵就会认为这个主节点主观下线了(单方面的)。当超过半数哨兵节点认为该主节点主观下线了,这样就客观下线了。

2、当主节点出现故障,此时哨兵节点会通过Raft算法(选举算法)实现选举机制共同选举出一个哨兵节点为leader,来负责处理主节点的故障转移和通知。所以整个运行哨兵的集群的数量不得少于3个节点。

3、由leader哨兵节点执行故障转移,过程如下:

  • 将某一个从节点升级为新的主节点,让其它从节点指向新的主节点;
  • 若原主节点恢复也变成从节点,并指向新的主节点;
  • 通知客户端主节点已经更换。

需要特别注意的是,客观下线是主节点才有的概念;如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作

3.4 主节点的选举

1.过滤掉不健康的(己下线的),没有回复哨兵ping响应的从节点。

2.选择配置文件中从节点优先级配置最高的。(replica-priority,默认值为100)

3.选择复制偏移量最大,也就是复制最完整的从节点。

哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式。

搭建Redis哨兵模式

5.1 实验环境

主机类型IP地址
master节点192.168.85.60
slave1192.168.85.70
slave2192.168.85.80

5.2 操作过程

所有节点修改Redis哨兵模式配置文件

  • 将哨兵模式配置文件复制到/etc/redis目录下

QQ截图20221110225208.png

QQ截图20221110225254.png

5.3 修改配置文件

vim /etc/redis/sentinel.conf

QQ截图20221110231042.png

QQ截图20221110231119.png

QQ截图20221110231249.png

QQ截图20221110231406.png

QQ截图20221110231532.png

QQ截图20221110231957.png

QQ截图20221110232242.png

QQ截图20221110232437.png

5.4 启动哨兵模式,先启动master,再启动slave

QQ截图20221111221144.png 查看哨兵信息

QQ截图20221111221357.png

5.5 故障模拟

关闭主节点redis/etc/init.d/redis_6379 stop,或者用进程号kill掉redis

QQ截图20221111221554.png

如果kill掉之后要启动,需要先删掉/var/run/中的redis_6379.pid,然后再启动

QQ截图20221111221838.png

在哨兵上查看日志,验证master是否切换至从服务器

tail redis-sentinel.pid

QQ截图20221111224840.png 查看哨兵信息 QQ截图20221111222618.png

Redis 集群模式

集群,即Redis Cluster,是Redis3.0开始引入的分布式存储方案。

集群由多个节点(Node)组成,Redis的数据分布在这些节点中。集群中的节点分为主节点和从节点:只有主节点负责读写请求和集群信息的维护;从节点只进行主节点数据和状态信息的复制。

6.1 集群的作用

(1)数据分区: 数据分区(或称数据分片)是集群最核心的功能。

  • 集群将数据分散到多个节点,一方面突破了Redis单机内存大小的限制,存储容量大大增加;另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力。
  • Redis单机内存大小受限问题,在介绍持久化和主从复制时都有提及;例如,如果单机内存太大,bgsave和bgrewriteaof的fork操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出。

(2)高可用: 集群支持主从复制和主节点的自动故障转移(与哨兵类似);当任一节点发生故障时,集群仍然可以对外提供服务。

通过集群,Redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。

6.2 Redis集群的数据分片

Redis集群引入了哈希槽的概念。

Redis集群有16384个哈希槽(编号0-16383)。

集群的每个节点负责一部分哈希槽。

每个Key通过CRC16校验后对16384取余来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作。

以3个节点组成的集群为例:

  • 节点A包含0到5000号哈希槽
  • 节点B包含5001到10000号哈希槽
  • 节点c包含10001到16383号哈希槽

QQ截图20221111223716.png

6.3 集群模式的主从复制模型

  • 集群中具有A、B、C三个节点,如果节点B失败了,整个集群就会因缺少5461-10922这个范围的槽而不可以用。

  • 为每个节点添加一个从节点A1、B1、C1整个集群便有三个Master节点和三个slave节点组成,在节点B失败后,集群选举B1位为主节点继续服务。当B和B1都失败后,集群将不可用。

搭建 Redis 集群模式

7.1 实验环境

6台服务器,3主3从。

节点IP安装Redis
master1192.168.85.50redis-5.0.7.tar.gz
slave1192.168.85.60redis-5.0.7.tar.gz
master2192.168.85.70redis-5.0.7.tar.gz
slave2192.168.85.80redis-5.0.7.tar.gz
master3192.168.85.90redis-5.0.7.tar.gz
slave3192.168.85.100redis-5.0.7.tar.gz

7.2 所有机器部署Redis

上面有完整的安装步揍

master QQ截图20221111232811.png

slave

QQ截图20221111233706.png

QQ截图20221111233905.png

7.3 开启集群功能

vim /opt/redis-5.0.7 redis.conf

QQ截图20221111234607.png

QQ截图20221111234704.png

QQ截图20221111234800.png

QQ截图20221111234903.png

QQ截图20221111234943.png

QQ截图20221111235039.png

QQ截图20221111235143.png

QQ截图20221111235239.png

7.4 所有节点启动redis服务

QQ截图20221111235512.png

启动集群 报错解决

QQ截图20221112010107.png 如果启动报错请查看: 错误集(三主三从):redis群集启动失败([ERR] Node IP:端口 is not configured as a cluster node.) - 掘金 (juejin.cn)

8.1 启动集群

在任意一个节点启动集群即可。

六个主机分为三组,三主三从,前面的做主节点后面的做从节点下免交互的时候需要输入yes才可以创建 "-replicas 1"表示每个主节点有一个从节点 QQ截图20221112012220.png

QQ截图20221112012311.png

8.2  测试集群

加-c参数,节点之间就可以互相跳转

QQ截图20221112012954.png

QQ截图20221112013505.png

查看集群模式节点出状态

QQ截图20221112013612.png

总结

三种模式需要注意修改不同的配置文件。

主从复制:vim /etc/redis/6379.conf

哨兵模式:vim /opt/redis-5.0.7/sentinel.conf

cluster集群:vim /opt/redis-5.0.7/redis.conf

9.1 Redis哨兵模式

  • 优点:能够实现主从复制架构中的主节点的自动故障转移
  • 缺点:写操作无法负载均衡,存储能力收到单机限制,从节点无法自动故障转移

9.2 几个部分组成?

  1. 数据节点:
  • 主从复制架构中的主节点和从节点,存储数据的
  1. 哨兵节点:
  • 不存储数据,一个或多个(奇数个)哨兵节点组成。

  • 主要作用:

  1. 监控主从和其他哨兵节点,
  2. 主节点自动故障转移,
  3. 通知故障转移结果

9.3 端口号

  • 6379:redis端口号,客户端服务端数据通信,或者主从节点间数据通信

  • 16379:用于集群总线,这是一个用二 进制协议的点对点通信信道。这个集群总线(Cluster bus)用于节点的失败侦测、配置更新、故障转移授权,等等。

  • 26379:哨兵节点间通信

9.4 工作流程

  1. 每个哨兵节点会定期的给主从节点和其他哨兵节点发送心跳消息(ping),如果主节点在超时时间内没有回复或恢复错误信息,那么哨兵节点会认为改主节点为主管下线,当达到一定数量的哨兵节点认为该主节点主观下线,则该主节点则为客观下线
  2. 哨兵节点会通过算法选举处一个leader来负责主节点的故障转移通知
  3. leader会根据从节点的优先级设置或者偏移量挑选出一个从节点为新的主节点,并让其它从节点指向新的主节点做主从复制
  • 若原来的主节点恢复了,会变成从节点指向新的主节点

集群模式的Redis由多组(>=3组)节点组成,每组都有一个主节点和一个或者多个从节点。只有主节点负责数据的读写,从节点只进行数据的复制 集群总线端口 16379 高可用 主从 数据切片 哈希槽 16384(0-16383)对键名CRC16 取余