分布式理论 | 青训营笔记

75 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 12 天

一、分布式概述

分布式系统是计算机程序的集合,这些程序利用跨多个独立计算节点的计算资源来实现共同的目标。可以分为分布式计算、分布式存储、分布式数据库等。

二、系统模型

拜占庭将军问题

两将军问题(Two Generals'Problem):两支军队的将军只能派信使穿越敌方领土互相通信,以此约定进攻时间。该问题希望求解如何在两名将军派出的任何信使都可能被俘虏的情况下,就进攻时间达成共识。

结论是,两将军问题是被证实无解的电脑通信问题,两支军队理论上永远无法达成共识。

TCP三次握手是两将军问题的一个工程解

一致性

一致性分为:

  • 最终一致性
  • 线性一致性

截图_20230208010049.png

三、理论基础

CAP理论

截图_20230208010546.png

ACID理论

事务是数据库系统中非常重要的概念,它是数据库管理系统执行过程中的一个逻辑单元,它能够保证一个事务中的所有操作要么全部执行,要么全都不执行。

数据库事务拥有四个特性ACID,即分别是:

  • 原子性(Atomicity)原子性是指事务包含的所有操作要么全部成功,要么全部失败回滚。
  • 一致性(Consistency)一致性是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之后都必须处于一致性状态。
  • 隔离性(Isolation)隔离性是当多个用户并发访问数据库时,数据库为每一个用户开启的事务,不能被其他事务的操作所干扰,多个并发事务之间要相互隔离。
  • 持久性(Durability)持久性是指一个事务一旦被提交了,那么对数据库中的数据的改变就是永久性的,即便是在数据库系统遇到故障的情况下也不会丢失提交事务的操作。

BASE理论

Base理论是对CAP中一致性和可用性权衡的结果,其核心思想是:

  • Basically Available(基本可用):即使系统出现了不可预知的故障还是能用,相比较正常的系统而言:响应时间上的损失,或功能上的损失。
  • Soft state(软状态):允许系统中的数据存在中间状态,并认为该状态不影响系统的整体可用性,即允许系统在多个不同节点的数据副本存在数据延时。
  • Eventually consistent(最终一致性):系统能够保证在没有其他新的更新操作的情况下,数据最终一定能够达到一致的状态,因此所有客户端对系统的数据访问最终都能够获取到最新的值。

四、分布式事务

  • 二阶段提交:prepare阶段 + commit阶段
  • 三阶段提交:CanCommit阶段 + PreCommit阶段 + DoCommit阶段
    (将两阶段提交中的Prepare阶段,拆成两部分:CanCommit和PreCommiti机制)

MVCC

MVCC是一种并发控制的方法,维持一个数据的多个版本使读写操作没有冲突。所以既不会阻塞写,也不阻塞读。MVCC为每个修改保存一个版本,和事务的时间戳相关联。可以提高并发性能,解决脏读的问题。

截图_20230208013732.png

五、共识协议

  • Quorum NWR模型
  • RAFT协议
  • Paxos协议