1. 数据流和动态表

连续查询查询产生仅追加数据的动态表两个连续查询对比 Retract消息的产生

状态

查询初显故障的办法：

2. Exactly-Once和Checkpoint

状态恢复的时间点：需要等待所有处理逻辑消费完成source保留状态及之前的数据 一个简单的快照只做算法

Chandy-Lamport算法

每一个Source算子接收到JM发送的Checkpoint Barrier 吊事状态快照制作的开始

各个Source保存自己状态后，向所有连接的下游继续发送Checkpoint Barrier ，同时告知JM自己状态已经制作完成

快照制作和处理数据的解耦

Checkpoint的结束： 所有算子都告知JM状态制作完成后，整个Checkpoint就结束 Checkpoint对作业性能的影响:

在多个节点参与执行的分布式系统中，为了协调每个节点都嗯呢该同时执行或回滚某个事务性操作，引入了一个中心节点来统一处理所有节点的执行逻辑，这个中心节点叫做协作者（coordinator），被中心节点调度的其他业务叫做参与者（participant）

如果协作者成功接收到所有的参与者的vote yes的消息

JM传送个barrier给Data Source

Data Source 传送barrier给WIndow 将快照传送给flink后端

window传输barrier给Data Sink window和Data SInk快照传输到Flink后端内存中预提交处理给kafuka

提交阶段JM给每个节点返回ack后做提交处理

事务开启：在sink task向下游写数据之前，均会开启一个事务，后续所有写数据的操作均在这个事务中执行，事务未提前，事务写入的数据下游不可读
预提交阶段：JM开始下发Checkpoint Barrier，当各个处理逻辑接收到Barrier后停止处理后续数据，对当前状态制作快照，此时sink也不在当前事务下继续处理数据（处理后续的数据需要新打开下一个事务）。状态制作成功后则向JM成功的消息，失败则发送失败的消息
提交阶段：若JM收到所有预提交成功的消息，则向所有处理逻辑（包括Sink）发送可以提交此事务的消息，sink接收到此消息后，则完成此次事务的提交，此时下游可以读到这次事务写入数据，若JM收到的预提交失败，则回滚这次事务，此时sink则丢弃这次事务提交的数据下。