这是我参与「第五届青训营 」伴学笔记创作活动的第 8 天
分布式概述
分布式系统是计算机程序的集合,这些程序利用跨多个独立计算节点的计算资源来实现共同的目标。可以分为分布式计算、分布式存储、分布式数据库等
优势:
- 去中心化
- 低成本
- 弹性
- 资源共享
挑战:
- 普遍的节点故障
- 不可靠的网络
- 异构的机器与硬件环境
- 安全
- 可靠性高
常见的分布式系统
系统模型
故障模型
- Byzantine failure: 节点可以任意篡改发送给其他节点的数据
- Authentication detectable byzantine failure(ADB): Byzantine failure的特例;节点可以篡改数据但不能伪造其他节点的数据
- Performance failure: 节点未在特定时间段内收到数据,即时间太早或太晚
- Omission failure: 节点收到数据的时间无限晚,即收不到数据
- Crash failure: 在omission failure的基础上,增加了节点停止响应的假设,也即持续性地omission failure
- Fail-stop failure: 在Crash failure的基础上增加了错误可检测的假设
拜占庭将军问题
达成共识问题
两支军队的将军只能派信使穿越敌方领土互相通信,以此约定进攻时间。该问题希望求解如何在两名将军派出的任何信使都可能被俘虏的情况下,就进攻时间达成共识。
结论是,两将军问题是被证实无解的电脑通信问题,两支军队理论上永远无法达成共识。
方案一: 同时发送N个信使,任何一个达到对方军队,都算成功
方案二: 设置超时时间,发送后未在一定时间返回,则加派信使 √
共识与消息传递的不同: 即使保证了消息传递成功,也不能保证达成共识
篡改信息问题
3个将军ABC互相传递消息消(即出现拜占息可能丢失,也可能被篡改,当有一个将军是“叛徒"庭故障)时,整个系统无法达成一致
考虑当4个将军,只有1个叛徒的场景。
将军D作为消息分发中枢,约定如果没收到消息则执行撤退。
如果D为“叛徒”,ABC无论收到任何消息,总能达成一致D为“忠将”,ABC有2人将D的消息进行正确的传递,同样能保证最终决策符合大多数。
进而能够证明,当有3m+1个将军,其中m个“叛徒”时,可以增加m轮协商,最终达成一致
共识和一致性
当客户端A读到更新的版本x=1后,及时将消息同步给其他客户端,这样其他客户端立即能获取到x=1。我们称这样的一致性为Linearizability (线性一致性)
如果要保证“线性”一致性,多个节点间势必需要进行协商,以寻求一致。这样增加了延迟,系统可用性便会受损
一旦某个读获取到新值,所有客户端都必须返回新值
时间和事件顺序
我们定义“happened before”关系,记为"->"。其满足如下三个条件:
- 如果 a 和 b 是在相同节点上的两个事件,a 在 b 之前发生,则定义:a -> b
- 如果事件 a 表示某个节点发送某条消息,b 是另一个节点接受这条消息则有 a -> b
- 如果有 a -> b 且 b -> c,则有 a -> c
当且仅当 aAb 且 b+a 时,我们称两个事件为并发的(concurrent)。
我们不难在图中找到若干满足条件的事件对,例如 p1 -> r4,其由p1 -> q2 -> q4 -> r3 -> r4 推导而来
Lamport逻辑时钟
对于每一个节点 Pi 我们定义时钟 Ci 为一个函数,它为任意的事件 a 赋值编号为 Ci(a)
- 如果 a 和 b 是在相同节点 P 上的两个事件,a 在 b 之前发生,则有Ci(a)<Ci(b)
- 如果事件 a 表示节点 Pi 发送某条消息,b 表示节点 P 接受这条消息,则有 Ci(a)<Cj(b)
于是我们可以在时空图中加入类似右图虚线所示的“tick line
在同一节点内的连续两个事件之间,至少要有一条 tick line
利用逻辑时钟,我们可以对整个系统中的事件进行全序排序
理论基础
CAP 理论
CAP理论往往运用于数据库领域,同样可以适用于分布式存储方向
CA: 放弃分区容错性,加强一致性和可用性,其实就是传统的单机数据库的逆择
AP: 放弃一致性 (这里说的一致性是强一致性),追求分区容错性和可用性例如一些注重用户体验的系统
CP:放弃可用性,追求一致性和分区容错性,例如与钱财安全相关的系统
ACID理论
事务是数据库系统中非常重要的概念,它是数据库管理系统执行过程中的一个逻辑单元 ,它能够保证一个事务中的所有操作要么全部执行,要么全都不执行。
数据库事务拥有四个特性ACID:
原子性 (A):原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚
一致性(C):一致性是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之 后都必须处于一致性状态
隔离性(I):隔离性是当多个用户发访问数据库时,数据库为每一个用户开启的事务,不能被其他事务的操作所干扰,多个 并发事务之间要相互隔离
持久性(D):持久性是指一个事务一旦被提交了,那么对数据库中的数据的改变就是永久性的,即便是在数据库系统遇到故障的情况下也不会丢失提交事务的操作
BASE 理论
Base 理论是对 CAP 中一致性和可用性权衡的结果,其来源于对大型与联网分布式实践的总结,是基于 CAP 定理逐步演化而来的。其核心思想是:
Basically Available(基本可用):假设系统,出现了不可预知的故,但还是能用,相比较正常的系统而言: 响应时间上的损失或功能上的损失
soft state(软状态):允许系统中的数据存在中间状态,并认为该状态不影响系统的整体可用性,即允许系统在多个不同节点的数据副本存在数据延时。
Eventualy consistent (最终一致性):系统能够保证在没有其他新的更新操作的情况下,数据最终一定能够达到一致的状态因此所有客户端对系统的数据访问最终都能够获取到最新的值
分布式事务
二阶段提交
二阶段提交(Two-phase Commit): 为了使基于分布式系统架构下的所有节点在进行事务提交时保持一致性而设计的-种演算法
三个假设
- 引入协调者 (Coordinator) 和参与者 (Participants) ,百相进行网络通信
- 所有节点都采用预写式日志,且日志被写入后即被保持在可靠的存储设备上
- 所有节点不会永久性损坏,即使损坏后仍然可以恢复