Exactly Once语义在Flink中的实现 | 青训营笔记这是我参与「第四届青训营」笔记创作活动的第三天数据流

这是我参与「第四届青训营」笔记创作活动的第三天

数据流->动态表->连续查询->动态表->数据流

动态表：随时间变化的表，因为数据是源源不断的输入的，所以表也一直在增长

需要存储的每个用户的URL计数，以便能够增加该计数并在输入表接收新行时发送新结果

不同数据处理保证的语义
- At-most-once：出现故障的时候啥也不做，数据处理不保证任何语义，处理时延低
- At-least-once：保证每条数据均至少被处理一次，一条数据可能存在重复消费
- Exactly-once：最严格的处理语义，从输出结果来看，每条数据均被消费且仅被消费一次，仿佛故障没有发生

制作快照的时间点
- 状态恢复的时间点：需要等待所有处理逻辑消费完成，source保留状态及之前的数据
对状态恢复的时间点有要求的原因：例：source读到5了，偶数累加器加到6，奇数累加器如果还没有把5加进去，和还是4.如果从这里保存节点，等到恢复的时候，奇数累加器还是4，并不是我们想要的9。
- 一个简单的快照制作算法
  1. 暂停处理输入的数据
  2. 等待所以算子消费完当前输入的数据
  3. 第二步结束后，所有算子复制自己当前状态，并保存到远端可靠存储
  4. 恢复对输入数据的处理
Chandy-Lamport算法
checkpoint对作业性能的影响
- 每个算子完成状态快照之后就可以正常处理数据了，不用等下游算子制作完成快照
- 在快照制作和Barrier Alignment过程仍需暂停处理数据，仍会增加延迟
- 快照保存到远端，可能会耗时

严格意义的端到端的Exactly-Once需要特殊的sink算子实现

概念：在多个节点参与执行的分布式系统中，为了协调每个节点都能同时执行或回滚某个事务性操作，（要么全做完要么全不做），引入了一个中心节点来统一处理所有节点的执行逻辑。这个中心节点叫做协作者（Coordinator），被中心节点调度的其他业务节点叫做参与者（Participant）

阶段

1.协作者向所有参与者发送一条commit消息

2.所有协作者收到消息之后，执行事物，但不真正提交

3.若事物成功执行完成，发送一个成功的消息（vote yes），反之，发送失败消息（vote no）

提交阶段分为两种情况

账单计算服务