redis面试篇03_哨兵原理

124 阅读2分钟

image.png

1、怎么去监测集群的健康状态?

Sentinel基于心跳机制监测服务状态,每隔1秒向集群的每个实例发送ping命令:

  • 主观下线:如果某sentinel节点发现某个实例未在规定时间响应,则认为该实例主观下线
  • 客观下线:若超过指定数量(quorum)的sentinel都认为该实例主观下线,则该实例则客观下线。quorum值最好超过sentinel实例数量的一半。

image.png

2、master故障后怎么选举新的master?

一旦发现master故障,sentinel需要在salve中选择一个作为新的master。

  • 首先会判断slave节点与master节点断开时间长短,如果超过指定值(down-after-milliseconds * 10)则会排除该slave节点
  • 然后判断slave节点的slave-priority值,越小优先级越高,如果是0则永不参与选举
  • 如果slave-prority一样,则判断slave节点的offset值,越大说明数据越新,优先级越高
  • 最后是判断slave节点的运行id大小,越小优先级越高。

3、sentinel如何实现故障转移?

当选中了其中一个slave为新的master后(例如slave1),故障的转移的步骤如下:

  • sentinel给备选的slave1节点发送slaveofnoone命令,让该节点成为master
  • sentinel给所有其它slave发送slaveof 192.168.150.101 7002命令,让这些slave成为新master的从节点,开始从新的master上同步数据。
  • 最后,sentinel将故障节点标记为slave,当故障节点恢复后会自动成为新的master的slave节点

image.png

总结

Sentinel的三个作用是什么?

监控、故障转移、通知

Sentinel如何判断一个redis实例是否健康?
  • 每隔1秒发送一次ping命令,如果超过一定时间没有相向则认为是主观下线
  • 如果大多数sentinel都认为实例主观下线,则判定服务下线
故障转移步骤有哪些?
  • 首先选定一个slave作为新的master,执行slaveofnoone
  • 然后让所有节点都执行slaveof 新master
  • 修改故障节点,执行slaveof 新master