Flink概述|青训营笔记这是我参与【第四届青训营】笔记创作活动的第二天。在今天早上，我通过录播课，对于流批一体，流计算

这是我参与【第四届青训营】笔记创作活动的第二天。在今天早上，我通过录播课，对于流批一体，流计算的特点，Flink的运用与现状有了更深的了解，并且结合学员手册，我对Flink的整体介绍做了以下总结：

Storm:
1. Storm API 的 low-level 以及开发效率低下；
2. 一致性问题：Storm 更多考虑到实时流计算的处理时延而非数据的一致性保证；
Spark Streaming：
1. Spark Streaming 相比于 Storm 的低阶 API 以及无法正确性语义保证，Spark 是流处理的分水岭：第一个广泛使用的大规模流处理引擎，既提供较为高阶的 API 抽象，同时提供流式处理正确性保证。
Flink：
1. 完全一次保证：故障后应正确恢复有状态运算符中的状态；
2. 低延迟：越低越好。许多应用程序需要亚秒级延迟；
3. 高吞吐量：随着数据速率的增长，通过管道推送大量数据至关重要；
4. 强大的计算模型：框架应该提供一种编程模型，该模型不限制用户并允许各种各样的应用程序在没有故障的情况下，容错机制的开销很低；
5. 流量控制：来自慢速算子的反压应该由系统和数据源自然吸收，以避免因消费者缓慢而导致崩溃或降低性能；
6. 乱序数据的支持：支持由于其他原因导致的数据乱序达到、延迟到达后，计算出正确的结果；
7. 完备的流式语义：支持窗口等现代流式处理语义抽象；
8. Google Dataflow Model 的开源引擎实现。

Apache Flink 在开源生态上的能力比较强大，可以支持：

Flink概述|青训营笔记