这是我参与11月更文挑战的第1天,活动详情查看:2021最后一次更文挑战」 Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。 Apache Flink 功能强大,支持开发和运行多种不同种类的应用程序。它的主要特性包括:批流一体化、精密的状态管理、事件时间支持以及精确一次的状态一致性保障等。
Flink官网很多东西都写得的很详细:flink.apache.org/
1.Flink需要你提前按装好,Java环境(8,或者11)
sudo yum install java-11-openjdk -y
[root@VM-8-16-centos app]# java -version
openjdk version "11.0.12" 2021-07-20 LTS
OpenJDK Runtime Environment 18.9 (build 11.0.12+7-LTS)
OpenJDK 64-Bit Server VM 18.9 (build 11.0.12+7-LTS, mixed mode, sharing)
2.下载安装包:flink.apache.org/zh/download…
scala 2.11或者 scala 2.12都是 ok的
3.下载好之后对安装包进行解压
$ tar -xzf flink-1.14.0-bin-scala_2.11.tgz
$ cd flink-1.14.0-bin-scala_2.11
结果
就类似这种
但是接下来官网介绍的就太简单了,只有启动flink以及执行一个作业,然后就关掉。
详细的执行流程在这里:nightlies.apache.org/flink/flink…
这个部分教给我们如何配置 高可用( High-Availability) 以及如何搭建集群
# we assume to be in the root directory of the unzipped Flink distribution
# (1) Start Cluster
$ ./bin/start-cluster.sh
# (2) You can now access the Flink Web Interface on http://localhost:8081
# (3) Submit example job
$ ./bin/flink run ./examples/streaming/TopSpeedWindowing.jar
# (4) Stop the cluster again
$ ./bin/stop-cluster.sh