一、Raft介绍
Raft是一种在分布式系统中解决集群中多节点之间数据一致性的算法,Paxos的简易版本。
核心思想
少数服从多数。
作用
集群节点数量超过 n/2+1 的还可以继续提供服务。
即使可能没有Leader,也可以通过再次选举产生。
二、Raft节点角色
- leader 领导者
- follower 跟随者
- candidate 候选者
Leader只有一个,其余全部都是Follower。
Follower只会响应Leader、Candidate的消息,或转发客户端请求给Leader。 Candidate是选举时的一种临时状态。
正常状态:
graph TB
leader(leader<br>领导者)
leader <--> f1(follower01<br>跟随者)
leader <--> f2(follower02<br>跟随者)
style leader fill:lightgreen
style f1 fill:lightgreen
style f2 fill:lightgreen
节点角色属性
Term: 任期,记录节点当Leader的计数。
超时时间: Follower等待Leader心跳的超时时间,每个超时时间是随机的、不一样。 (避免同一时间超时投票)
Leader超时:
graph TB
leader(leader<br>领导者<br>term:1)
leader x--超时200ms--x f1(follower01<br>跟随者<br>term:1<br>timeout : 150ms)
leader x--超时200ms--x f2(follower02<br>跟随者<br>term:1<br>timeout : 300ms)
style leader fill:red
style f1 fill:lightgreen
style f2 fill:lightgreen
三、投票机制
- 当Follower节点等待Leader领导心跳后,自身节点Term+1, --变成--> ,并向其他节点发送投票请求。
- 其他Follower节点收到投票请求,判断 的Term任期是否投过票,没投过就同意 的投票请求,并更新自身Term
- 收到大多数(n/2+1)投票后,自身成为Leader 。
Follower01投票请求:
graph TB
leader(leader<br>领导者<br>term:1\n失联)
f1(follower01->Candidate<br>跟随者->候选人<br>term:2<br>timeout : 150ms)
f2(follower02<br>跟随者<br>term:1<br>timeout : 300ms)
f1 --自身term+1, 发送投票申请--> f2
style leader fill:red
style f1 fill:lightgreen
style f2 fill:lightgreen
Follower02同意投票:
graph TB
leader(leader<br>领导者<br>term:1\n失联)
f1(Candidate -> Leader<br>候选人 -> 新领导<br>term:2<br>timeout : 150ms)
f2(follower02<br>跟随者<br>term:2<br>timeout : 300ms)
f2 --候选人符合投票条件,同意投票,<br> 更新自身term与候选人一致--> f1
style leader fill:red
style f1 fill:lightgreen
style f2 fill:lightgreen
旧Leader重连:
旧leader重连后,发现 自身term小于其他节点term ,会更新自身term,并变成 -->
心跳机制
- Leader向其他Follower发送心跳。
- Follower收到心跳,并响应给Leader。
相互告知节点是否存活。