开源大数据流水线系统PiflowX本地开发调试## 1.代码获取关注公众号`PiflowX`，发送“`源码`”获取gi

1.代码获取

关注公众号PiflowX，发送“源码”获取github地址。

2.环境准备

说明：本文档基于windows11操作系统，flink和hdfs基于虚拟机centos启动。

2.1 本地flink环境

Flink >= 1.12, 只需要从Flink官网下载解压即可。演示中我下载的是[flink-1.18.0](Apache Archive Distribution Directory)

解压到指定目录，如d:\env\flink ![在这里插入图片描述](i-blog.csdnimg.cn/direct/e586…

2.2 本地hadoop环境

由于是windows系统，可以从[github](GitHub - s911415/apache-hadoop-3.1.0-winutils: HADOOP 3.1.0 winutils)下载wintutils。具体步骤可参考文章Windows环境下安装Hadoop3.1.0全过程（超详细手把手一条龙教学）_windows安装hadoop-CSDN博客在这里插入图片描述

3.后端本地开发

3.1前提条件

java 1.8+
maven
hdfs
flink

3.2项目编译

切换到dev-flow分支。

mvn clean package -DskipTests

3.3解压压缩包

编译完成后，找到streampark-console-service模块target目录下压缩包apache-streampark-2.2.0-SNAPSHOT-incubating-bin.tar.gz，解压到指定目录。

cd ./streampark-console-service/target tar -zxvf apache-streampark-2.2.0-SNAPSHOT-incubating-bin.tar.gz

在这里插入图片描述

3.4启动后台服务

找到 streampark-console/streampark-console-service/src/main/java/org/apache/streampark/console/StreamParkConsoleBootstrap.java

修改启动配置

勾选Add VM options，填写参数-Dapp.home=$path，$path是我们刚刚复制的路径

4.PiflowX后端启动

启动服务

找到 piflowx/piflow-server/src/main/scala/cn/piflow/api/HTTPServer.scala，

运行main方法。

启动完成，会在项目下生成一个server.ip文件，文件内容为当前机器ip。

修改streampark-console-service服务baseConfig.properties配置文件，piflowx.server.ip为上述server.ip 在这里插入图片描述

重启streampark-console-service服务。

5.前端本地开发

前提条件

Note

如果你遇到依赖下载缓慢需要配置 npm 镜像源,方法为在用户文件夹下找到 .npmrc 将以下内容写入：

strict-peer-dependencies=false save-workspace-protocol = rolling registry = 'http://registry.npmmirror.com'

构建并运行

安装依赖：

cd ../streampark-console/streampark-console-webapp

pnpm install

如果运行失败，执行以下命令：

pnpm install --ignore-scripts

运行：

pnpm serve

打包

pnpm build

浏览器支持

本地开发推荐使用Chrome 80+ 浏览器，支持现代浏览器, 不支持 IE。

6.flink流水线任务示例

浏览器输入http://localhost:10001/登陆系统。点击登陆进入首页。

在这里插入图片描述配置flink home

flink home为2.1节flink解压目录（如d:\env\flink）

在这里插入图片描述配置flink cluster 上传flink流水线依赖包

在资源管理中，上传piflowx/piflow-server/target下piflow-server.jar。Program main填写cn.piflow.launcher.flink.StartFlinkFlowMain。在这里插入图片描述创建作业选择Flink Pipeline作业类型创建流水线任务