分布式架构|青训营笔记这是我参与「第五届青训营」伴学笔记创作活动的第 8 天系统模型故障模型拜占庭将军问题共识

这是我参与「第五届青训营」伴学笔记创作活动的第 8 天

课中

什么是分布式？
- 分布式系统定义：跨多个节点的计算机程序的集合
- 使用分布式系统的五大优势：去中心化、低成本、弹性、资源共享、可靠性高
- 分布式系统的挑战：故障、网络、环境、安全
Why-How-What
- 使用者视角：大规模计算存储的述求
- 学习者视角：后端开发必备技能
常见的分布式系统
- 分布式存储：GFS、Ceph、HDFS、Zookeeper
- 分布式数据库：Spanner、TiDB、HBase、MangoDB
- 分布式计算：Hadoop、YARN、Spark

两将军问题
- 定义：
  - 两支军队的将军只能派信使穿越敌方领土互相通信，以此约定进攻时间。该问题希望求解如何在两名将军派出的任何信使都可能被俘虏的情况下，就进攻时间达成共识
- 结论：
  - 两将军问题是被证实无解的电脑通信问题，两支军队理论上永远无法达成共识
- TCP是两将军问题的一个工程解
三将军问题：
- 两个“忠将”A和B，一个“叛徒”C，互相传递消息，消息可能丢失，也可能被篡改，当有一个将军是“叛徒”（即出现拜占庭故障）时，整个系统无法达成一致。
- 由于“叛徒”C的存在，将军A和将军B获得不同的信息。这样将军A获得2票进攻1票撤退的信息，将军B获得1票进攻2票撤退的信息，产生了不一致
四将军问题：
- 将军D作为消息分发中枢，约定如果没收到消息则执行撤退
- 步骤：
  - 如果D为“叛徒”，ABC无论收到任何消息，总能达成一致
  - D为“忠将”，ABC有2人将D的消息进行正确的传递，同样能保证最终决策符合大多数。
- 进而能够证明，当有3m+1个将军，m个“叛徒”时，可以进行m轮协商，最终达成一致

1978年Leslie Lamport发表《Time, Clocks, and the Ordering of Events in a Distributed System》
- 定义了计算机系统中的时间和事件顺序，引入happened before和并发的定义，可以以此对分布式系统中的事件进行推导
- 根据上述推导，创造了Lamport逻辑时钟的概念，这个概念在分布式理论中具有革命性的意义，帮助我们在一系列分布式事件当中梳理出逻辑的先后关系。利用逻辑时钟，我们可以对整个系统中的事件进行全序排序

CAP的定义，分别代表一致性、可用性、分区容错性。三者无法同时达到
CAP诞生了三类系统：
- CA系统：传统数据库的代表
- AP系统：放弃强一致性，保证高可用，不少nosql存储系统采用
- CP系统：放弃可用性，保证数据一致性
举例说明两个分布式进程之间同步数据，当出现故障的时候，如何选择不同的CAP系统，以及带来的影响
- CP系统：故障发生时，为了避免读到不一致的数据，可能拒绝访问
- AP系统：故障发生时，为了保证可用性，允许不同进程读到不同的数据
针对故障场景，可以通过故障转移的方式，做一个相对较优的解决方式：
- 允许一个进程作为Master，其他进程作为Backup，当故障时将请求转移给Backup进行处理

数据格式
- 语言特定格式：例如 java.io.Serializable
- 文本格式：例如 JSON、XML、CSV 等
- 二进制编码：常见有 Thrift 的 BinaryProtocol，Protobuf，实现可以有多种形式，例如 TLV 编码和 Varint 编码

以 Thrift 的 THeader 协议为例
LENGTH 字段 32bits，包括数据包剩余部分的字节大小，不包含 LENGTH 自身长度 - HEADER MAGIC 字段16bits，值为：0x1000，用于标识协议版本信息，协议解析的时候可以快速校验 - FLAGS 字段 16bits，为预留字段，暂未使用，默认值为 0x0000 - SEQUENCE NUMBER 字段 32bits，表示数据包的 seqId，可用于多路复用，最好确保单个连接内递增 - HEADER SIZE 字段 16bits，等于头部长度字节数/4，头部长度计算从第14个字节开始计算，一直到 PAYLOAD 前（备注：header 的最大长度为 64K） - PROTOCOL ID 字段 uint8 编码，取值有： - ProtocolIDBinary = 0 - ProtocolIDCompact = 2 - NUM TRANSFORMS 字段 uint8 编码，表示 TRANSFORM 个数 - TRANSFORM ID 字段 uint8 编码，表示压缩方式 zlib or snappy - INFO ID 字段 uint8 编码，具体取值参考下文，用于传递一些定制的 meta 信息 - PAYLOAD 消息内容