青训营伴学笔记丨课程笔记丨Raft共识协议算法

2024-11-30 82 阅读3分钟

一、概述

Raft算法是一种为了管理复制日志而设计的共识算法，它通过选举机制来确保集群中的多个节点能够就日志内容达成一致。该算法旨在解决Paxos等传统共识算法难以理解和实现的问题。Raft算法的核心目标是易于理解，并且能够高效地在分布式系统中保证数据的一致性。

二、原理

领导选举：Raft将时间分割成一系列连续的任期（term），每个任期开始时都会进行一次领导选举。候选者向其他节点发送请求投票RPCs以争取选票；如果一个候选者获得超过半数的选票，则成为领导者。这种机制确保了任何时候最多只有一个领导者。
日志复制：一旦被选为领导者，它就开始接受客户端请求，并将这些请求作为新的条目追加到自己的日志中，然后并行地将这些条目复制给其他跟随者。当足够多的跟随者确认收到日志条目后，领导者会提交这条日志，并通知所有跟随者也进行提交。
安全性：Raft算法还包含一些规则来保障系统的安全性，比如只有当前任期内的领导者才能提交日志条目，以及限制了哪些类型的日志条目可以被添加到日志中等。

三、特点

可理解性：相比其他复杂的共识协议如Paxos，Raft的设计更加直观易懂。
强领导性：Raft采用单一领导者模型，在一个给定的任期内只允许存在一个活跃的领导者，这简化了系统状态的管理。
容错能力：只要大多数节点正常运行，Raft就能保证服务可用性和一致性。
分区容忍性：即使在网络分区的情况下，Raft也能继续工作，但可能需要等待网络恢复或重新选举领导者。

四、Raft 在工程常见优化

由于领导者选举是个低频操作，主要 IO 路径优化还是集中在日志同步流程上。

batch：Leader 每次攒一批再刷盘和对 Follower 进行同步。降低刷盘和 RPC 开销。
pipeline：每次发送日志时类似 TCP 的“停-等”协议，收到 Follower 确认后才更新 nextIndex，发送后面日志。其实可以改成流水线式的，不等前面日志确认就更新 nextIndex 继续发后面的。当然，如果后面发现之前日志同步出错，就要回退 nextIndex 重发之前日志——而原始版本 nextIndex 在同步阶段是单调递增的。
并行 append：Leader 在 append 日志到本地前，就先发送日志给所有 Follower。

五、应用案例

分布式数据库：许多现代的分布式数据库系统使用Raft算法来保证数据的一致性和高可用性，例如TiDB、CockroachDB等。
配置管理系统：Consul利用Raft算法维护服务发现和配置信息的一致性。
消息队列服务：Kafka在其控制器节点之间使用类似于Raft的方法来保证元数据的一致性。
微服务架构：在微服务体系结构中，Raft可用于构建可靠的注册中心和服务发现组件。

五、总结

Raft算法以其简洁明了的设计理念解决了分布式系统中常见的复杂问题，如数据一致性与容错处理。尽管相对年轻，但它已经广泛应用于各种实际场景中，证明了其有效性和可靠性。对于希望快速开发稳定可靠分布式应用程序的开发者来说，Raft提供了一个很好的选择。