这是我参与「第四届青训营」笔记创作活动的的第3天

Exactly—Once和Checkpoint

1. 状态快照与恢复

定期保存和恢复，与电脑差不对的思路

如果时间选择不够好，可能存在丢失数据的情况

每一个source算子都接收JM发送的Checkpoint Barrier标识状态快照制作的开始

各个source保存自己状态，向所有连接的下游继续发送Checkpoint Barrier,同时的告知JM自己状态已经制作完成

所有算子都告知JM状态制作完成后，整个Checkpoint就结束了

解耦了快照制作和数据处理过程，各个算子制作完成状态快照后就可以正常处理数据，不用等下游算子制作完成快照；

在快照制作和Barrier Alignment过程中需要暂停处理数据，仍然会增加数据处理延迟；

快照保存到远端也有可能极为耗时