Exactly Once语义在Flink中的实现 | 青训营笔记这是我参与「第四届青训营」笔记创作活动的第2天。重点：

这是我参与「第四届青训营」笔记创作活动的第2天

引言

结构图.png 重点：

传统SQL和流处理比较：传统 SQL和流处理比较.png

数据流和动态表转换：数据流和动态表转换.png

流->表：流到表.png 动态表:与表示批处理数据的静态表不同，动态表是随时间变化的。可以像查询静态批处理表一样查询它们。数据库表是INSERT、UPDATE和DELETE DML语句的stream的结果，通常称为changelog stream。

动态表->动态表：

连续查询（查询从不终止，查询结果会不断更新，产生一个新的动态表）特点：在任何时候，连续查询的结果在语义上与以批处理模式在输入表快照上执行的相同查询的结果相同。
查询产生仅追加数据的动态表特点：连续查询更新先前输出的结果，即定义结果表的changelog流包含INSERT和UPDATE操作；追加查询只附加到结果表，即结果表的changelog流只包含INSERT操作。

Retract消息的产生： Retract消息的产生.png 撤回机制对于Flink来说是一个很重要的特性，在其中retract是一个不可或缺的环节，撤回流（同时包含 INSERT 消息和 DELETE 消息）。

不同数据处理保证的语义：语义.png

制作快照的时间点：时间点.png 状态恢复的时间点:需要等待所有处理逻辑消费完成source保留状态及之前的数据。
一个简单的快照制作算法:

Chandy-Lamport算法实现： Chandy-Lamport算法.png

快照制作的开始
每一个source算子都接收到JM发送的Checkpoint Barrier标识状态快照制作的开始。
Source算子的处理
各个source保存自己状态后，向所有连接的下游继续发送Checkpoint Barrier，同时告知JM自己状态已经制作完成。
Barrier Allignment
算子会等待所有上游的barrier 到达后才开始快照的制作；已经制作完成的上游算子会继续处理数据，并不会被下游算子制作快照的过程阻塞。
快照制作和处理数据的解耦
checkpoint的结束
所有算子都告知JM状态制作完成后，整个Checkpoint就结束了。

Checkpoint对作业性能的影响：

两阶段提交协议: 两阶段提交协议.png 在多个节点参与执行的分布式系统中，为了协调每个节点都能同时执行或者回滚某个事务性的操作，引入了一个中心节点来统一处理所有节点的执行逻辑，这个中心节点叫做协作者(coordinator)被中心节点调度的其他业务节点叫做参与者(participant)。

预提交阶段
1. 协作者向所有参与者发送一个commit消息；
2. 每个参与的协作者收到消息后，执行事务，但是不真正提交；
3. 若事务成功执行完成，发送一个成功的消息(vote yes)；执行失败，则发送一个失败的消息(vote no)。
提交阶段
若协作者成功接收到所有的参与者vote yes的消息:
1. 协作者向所有参与者发送一个commit 消息；
2. 每个收到commit消息的参与者释放执行事务所需的资源，并结束这次事务的执行；
3. 完成步骤2后，参与者发送一个ack消息给协作者；
4. 协作者收到所有参与者的ack消息后，标识该事务执行完成。
若协作者有收到参与者vote no的消息（或者发生等待超时):
1. 协作者向所有参与者发送一个rollback消息；
2. 每个收到rollback消息的参与者回滚事务的执行操作，并释放事务所占资源；
3. 完成步骤2后，参与者发送一个ack消息给协作者；
4. 协作者收到所有参与者的ack消息后，标识该事务成功完成回滚。

Flink中2PC Sink：两阶段提交总结：

事务开启:在sink task向下游写数据之前，均会开启一个事务，后续所有写数据的操作均在这个事务中执行，事务未提交前，事务写入的数据下游不可读；
预提交阶段: JobManager开始下发Checkpoint Barrier，当各个处理逻辑接收到barrier后停止处理后续数据，对当前状态制作快照，此时sink 也不在当前事务下继续处理数据（处理后续的数据需要新打开下一个事务)。状态制作成功则向JM成功的消息，失败则发送失败的消息;
提交阶段:若JM收到所有预提交成功的消息，则向所有处理逻辑(包括sink)发送可以提交此次事务的消息，sink接收到此消息后，则完成此次事务的提交，此时下游可以读到这次事务写入的数据;若JM有收到预提交失败的消息，则通知所有处理逻辑回滚这次事务的操作，此时sink则丢弃这次事务提交的数据下。

账单计算服务
从 Kafka中读取账单消息，进行处理后写入到MySQL中。账单计算服务.png

执行步骤:

存在的问题:

非严格意义上的端到端的Exactly-Once语义:若该批数据处理完成后，在写入MySQL中发生异常，则存在部分数据写入的情况，下次作业启动后，这部分数据仍然会重复写入；
去重能力有限:只能在当前处理的一批数据内进行去重，无法在批与批之间进行去重。

当使用Exactly-once 2PC模式（优势）：