分布式| 青训营笔记

56 阅读2分钟

这是我参与「第五届青训营」伴学笔记创作活动的第17天

主要内容

    1. 什么是分布式事务
    1. 分布式的具体实践
    1. 分布式的共识协议

分布式事务

分布式事务又具体分为二阶段提交三阶段提交

二阶段提交

  • 二阶段提交(two-phase Commit):是一种基于分布式系统架构的算法,其设计目的是让所有节点在事务提交时保持一致性。
两阶段提交需解决的问题:
  • 性能问题

需要多次网络通信,资源需要等待并锁定

  • Commit阶段网络分区带来的数据不一致

非所有节点都收到Commit请求

  • 新协调者

如何确定状态选出新协调者

三阶段提交

概念:为了补充两阶段提交,两阶段提交的Prepare阶段分为两个部分:CanCommitPreCommit机制

  • 解决了以下问题

    • 超时机制
    • 阻塞问题
    • 单点故障问题

具体实践

MapReduce

  • mapper:将输入分解为多个任务进行并行处理。彼此几乎没有依赖关系
  • shuffler:混合maper结果,防止数据倾斜
  • reducer:对map阶段的结果进行全局统计

容灾

参数错误,中央节点重新开始调度,新参数重新开始工作

重新启动reducer故障的mapper,费用很高

9cb79badf2f1437cbfb05c2ba0439c9e_tplv-k3u1fbpfcp-zoom-in-crop-mark_4536_0_0_0.webp

共识协议

NWR模型:

-   N:分布式存储备份数据的份数
-  W:表示一次成功的更新动作至少需要写入W条数据。
-  R:每读取一次数据,至少需要读取R个数据。
- 为了保证这里的一致性,需要保证W+R>N。

Quorum NWR模型是一致性模型的简化版本,它将CAP的选择交给用户

RAFT协议

  • Raft协议是一种分布式一致性算法(共识算法),即使出现部分节点故障和网络延迟也不影响节点,从而提高了系统的整体可用性
  • Raft是一种广泛使用的分布式协议。
  • 在某种程度上,Raft协议也使用Quorum

总结

分布式是当前比较热门的一个方向,主要作用是把一个非常庞大的功能体分割成许多小的部分,然后再讲这些小的部分分配的一个过程,最后合并起来得到最终的结果。这种知识不能光靠我们看和理解,要实践到一个完整的项目上,才能获得真证的理解和领悟。