【分布式】两阶段提交这是我参与11月更文挑战的第8天，活动详情查看：2021最后一次更文挑战. 参考：《数据库系统概念》

这是我参与11月更文挑战的第8天，活动详情查看：2021最后一次更文挑战.

参考：《数据库系统概念》19.3，19.4

概念

分布式事务由一个站点发起，多个站点参与。事务必须保证要么在所有站点上都提交，要么在所有站点上都中止。

两阶段提交（Two-Phase Commit，2PC）协议是最简单且使用最广泛的提交协议之一。

考虑一个例子，站点 $S_0$ 发起了事务 $T$ ，用 $S_i$ 来表示各个参与执行事务的站点。

当所有 $S_i$ 都通知 $S_0$ 完成了 $T$ 的执行时， $S_0$ 启动 $2PC$ 协议。

阶段1

$S_0$ 在稳定存储器上记录日志 <prepare T>，然后给 $S_i$ 发送消息 prepare T.
$S_i$ 收到消息，确认是否愿意提交。
1. 如果选择不提交，就记录日志 <abort T>，然后向 $S_0$ 发送消息 abort T.
2. 如果选择提交，就记录日志 <ready T>，并将所有与 $T$ 相关的日志写入稳定存储器中，然后向 $S_0$ 发送消息 ready T.

阶段2

如果 $S_0$ 收到所有 $S_i$ 的 ready T 消息，就将日志 <commit T> 写入稳定存储器中，然后向 $S_i$ 发送消息 commit T.
如果 $S_0$ 收到至少一个 abort T 或者间隔一段时间后没有收到全部消息，就将日志 <abort T> 写入稳定存储器中，然后向 $S_i$ 发送消息 abort T.
当 $S_i$ 收到消息后，将消息记录到日志中。

$S_0$ 和 $S_i$ 发生故障有不同的处理方式。

$S_0$ 的行动

$S_i$ 恢复措施

当 $S_i$ 从故障中恢复时，检查它的日志以判断应该做什么。

对疑问事务的处理可能导致一直询问且影响其它事务进行，一个简单的改进是， $S_i$ 在记录 <ready T> 日志时，将 $T$ 所使用的锁记录下来。等站点恢复后，将这些锁重新申请，这样就不会阻塞与这些锁无关的事务。

当 $S_0$ 发生故障时， $S_i$ 通过检查自己或其它 $S_i$ 的日志以做出决定。

日志中存在 <commit T>，此时应执行 $redo(T)$ .
日志中存在 <abort T>，此时应执行 $undo(T)$ .
所有 $S_i$ 的日志中都是仅存在 <ready T>，此时所有 $S_i$ 必须等待 $S_0$ 恢复后才能得到答案。如果 $T$ 持有 $S_i$ 上的锁，那么 $S_i$ 的其它事务也会收到影响，称作阻塞（blocking)。
某些 $S_i$ 的日志不存在 <ready T>，说明它们没有向 $S_0$ 发送过 ready T，此时直接执行 $undo(T)$ .

$2PC$ 的主要缺陷在于协调器故障可能会导致阻塞。

概念基本理解了，想找个成型的代码实例学习一下。

本文也发表于我的 csdn 博客中。