2021-09-01 redis 哨兵模式哨兵机制: 主从复制中当主节点宕机后,redis集群无法写操作的问题,也就是自

哨兵机制: 主从复制中当主节点宕机后,redis集群无法写操作的问题,也就是自动重新配置一个master出来,这样就不用人为配置了;

哨兵模式底层原理 :
哨兵机制每隔10s(此时间可以配置),都会访问master的服务器,然后每次info找到自己的从redis,然后继续通过递归的方式继续info,无论是网状,还是树状,都可以找到所有的从节点,找到整个 redis 的服务列表;

哨兵只会监听master,然后当有多个哨兵的时候,他们是如何形成一个群体的呢??
哨兵底层之间是类似于mq一样的通信机制,当多个哨兵都监听一个master,那么他们就会订阅同一个主题,都会发布消息,这样,他们都会接收到其他哨兵的关键链接信息,从而建立长连接;

一般哨兵集群数量与redis集群服务器数量一致(主+从),目的就是当master挂了,每个哨兵都会持有从节点的一票,为了公平选举;

那么master宕机之后,如何实现选举呢?
单个哨兵检测到之后,其他哨兵也会去检测,当哨兵检测master宕机的哨兵数量超过阈值之后(该阈值可配置),那么开始选举新的master;

配置文件demo:

# Example sentinel.conf  
  
# 哨兵sentinel实例运行的端口 默认26379  
port 26379  

protected-mode no       #关闭保护模式                                                                                                                                                                                 
daemonize yes             #使用后台模式启动     

# 哨兵sentinel的工作目录  
dir /tmp  
  
# 哨兵sentinel监控的redis主节点的 ip port   
# master-name  可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。  
# quorum 当这些quorum个数sentinel哨兵认为master主节点失联 那么这时 客观上认为主节点失联了  
# sentinel monitor <master-name> <ip> <redis-port> <quorum> quorum 超过几个哨兵确认master挂了的数量  
  sentinel monitor mymaster 127.0.0.1 6379 2  
  
# 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码  
# 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码  
# sentinel auth-pass <master-name> <password>  
sentinel auth-pass mymaster MySUPER--secret-0123passw0rd  
  
  
# 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒  
# sentinel down-after-milliseconds <master-name> <milliseconds>  
sentinel down-after-milliseconds mymaster 30000  
  
# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步，  
这个数字越小，完成failover所需的时间就越长，  
但是如果这个数字越大，就意味着越 多的slave因为replication而不可用。  
可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。  
# sentinel parallel-syncs <master-name> <numslaves>  
sentinel parallel-syncs mymaster 1  
  
  
  
# 故障转移的超时时间 failover-timeout 可以用在以下这些方面：   
#1. 同一个sentinel对同一个master两次failover之间的间隔时间。  
#2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。  
#3.当想要取消一个正在进行的failover所需要的时间。    
#4.当进行failover时，配置所有slaves指向新的master所需的最大时间。不过，即使过了这个超时，slaves依然会被正确配置为指向master，但是就不按parallel-syncs所配置的规则来了  
# 默认三分钟  
# sentinel failover-timeout <master-name> <milliseconds>  
sentinel failover-timeout mymaster 180000  
  
# SCRIPTS EXECUTION  
  
#配置当某一事件发生时所需要执行的脚本，可以通过脚本来通知管理员，例如当系统运行不正常时发邮件通知相关人员。  
#对于脚本的运行结果有以下规则：  
#若脚本执行后返回1，那么该脚本稍后将会被再次执行，重复次数目前默认为10  
#若脚本执行后返回2，或者比2更高的一个返回值，脚本将不会重复执行。  
#如果脚本在执行过程中由于收到系统中断信号被终止了，则同返回值为1时的行为相同。  
#一个脚本的最大执行时间为60s，如果超过这个时间，脚本将会被一个SIGKILL信号终止，之后重新执行。  
  
#通知型脚本:当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等)，将会去调用这个脚本，  
这时这个脚本应该通过邮件，SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时，将传给脚本两个参数，  
一个是事件的类型，  
一个是事件的描述。  
如果sentinel.conf配置文件中配置了这个脚本路径，那么必须保证这个脚本存在于这个路径，并且是可执行的，否则sentinel无法正常启动成功。  
#通知脚本  
# sentinel notification-script <master-name> <script-path>  
  
# 客户端重新配置主节点参数脚本  
# 当一个master由于failover而发生改变时，这个脚本将会被调用，通知相关的客户端关于master地址已经发生改变的信息。  
# 以下参数将会在调用脚本时传给脚本:  
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>  
# 目前<state>总是“failover”,  
# <role>是“leader”或者“observer”中的一个。   
# 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的  
# 这个脚本应该是通用的，能被多次调用，不是针对性的。  
# sentinel client-reconfig-script <master-name> <script-path>

配置开始:

打开到redis的bin目录下,然后创建一个sentinel.conf

sentinel monitor 改成自己的master配置
sentinel auth-pass mymaster 改成直接的redis密码

重启redis,这样哨兵模式就生效了,然后必须关闭防火墙!!!!!!!!!!!!!!!!

那么继续:
当 A 为master B C 为salve,且他门两个的master都为A; 三个redis都有哨兵的配置

现在A宕机了:
那么哨兵会在B/C之间选举一个成为master,这时候当B成为master之后,那么C会自动将配置文件的master配置指向B,也就是与B数据同步(认B做老大)

然后当再次启动A(以前的master) 会发生什么呢???

首先,选举出来的master不会改变!!!!!!!!即 B是master就是主节点,不会再被更改;A启动后会自动降级为salve从节点(由于哨兵之间的通信机制,会感知到当前的master节点);

其次,会有问题,由于宕机了,配置文件未被修改,此时B中的从节点中没有A,而且A不会与B数据同步!!!!!!!!! 由于A已经变成了一个从节点,那么他也不能做写操作,只能做读的操作;

最后,由于上面的问题,需要自行修改A的配置文件,将其master指向为B;

总结:
哨兵只解决master选举问题,不会解决主从复制同步的问题;

本文转自 jimolvxing.blog.csdn.net/article/det…，如有侵权，请联系删除。