基于 kettle 的可视化数据集成平台

91 阅读5分钟

前言

数据驱动的时代,数据的高效集成与管理成为企业竞争力的关键。今天推荐一个基于Kettle的可视化、可拖拽的数据集成平台,它可以提供一个直观、易用的数据集成解决方案,帮助企业轻松实现数据的采集、转换、加载与监控。

项目介绍

一个基于Kettle的Web版数据集成平台,通过可视化拖拽的方式,无需编写复杂代码即可完成数据集成任务的设计与执行。

平台支持多种数据源接入,包括关系型数据库、非关系型数据库、文件系统等,并提供丰富的数据处理组件,满足用户多样化的数据处理需求。

项目不仅拥有完整的数据集成功能,还集成数据源管理、元数据管理、数据标准管理、数据仓库管理、数据质量、数据指标、数据标签、数据安全、数据生命周期、数据服务、数据资产、数据可视化、数据运维及系统日志等全方位的数据管理功能。

项目功能

1、数据源管理

支持各类关系型数据库、非关系型数据库。

2、元数据管理

元模型、最新元数据、定版元数据、数据全景图、数据血缘、数据影响分析、多版本元数据对比。

3、数据标准管理

标准词根、标准字典、数据元、标准模型、发布、多版本维护、数据标准核对。

4、数据仓库管理

支持主题域、主题、数仓集群、维度建模、模型运维、模型审计、模型数据查看。

5、数据质量

规则定义、任务执行、结果查看、统计分析、质量问题修复日志。

6、数据指标

数据指标在线开发、数据指标地图。

7、数据标签

标签对象、标签管理、置标任务、标签圈群、标签画像。

8、数据安全

分级分类、数据脱敏、分级分类授权。

9、数据生命周期

数据归档、数据恢复。

10、数据服务

接口在线开发(支持通过JS脚本对数据进行处理后返回,支持动态SQL)、API注册、接口测试、接口发布、应用管理、应用授权。

11、数据资产

数据资产标签、数据资产目录、数据资产门户、数据资产申请试用。

12、数据集成/开发

实时开发(支持CDC)、离线开发(支持数据库、CSV、Excel、接口、FTP、Kafka、MQTT、MongoDB等数据源接入),在线拖拉拽生成数据集成任务。

13、数据可视化

数据集、报表管理、报表设计、报表查看、知识图谱构建、知识图谱查看。

14、数据运维

微服务监控、中间件监控、服务器监控、数据仓库定时备份恢复、数据服务接口监控。

15、系统日志

syslog查询、syslog实时查看、登录日志、审计日志。

16、主数据

主数据模型管理、自动生成代码码段管理、主数据管理、主数据分发。

项目架构

系统架构图

项目技术

技术栈

类别技术栈
后端技术Java、Spring Boot 2.7、Spring Cloud/Alibaba、MyBatis Plus、Hutool 等
前端技术Vue、Element UI、Vite 等
中间件Doris、MySQL、Redis、RabbitMQ、MinIO、ZooKeeper

项目使用

快速体验本系统可通过 Docker 部署

详细步骤请参考官方文档

www.young-datafan.com/docs-data-i…

如需本地运行,请按以下简化流程操作

1、环境准备

  • JDK 1.8
  • MySQL 5.7 或更高版本
  • Consul
  • Redis

2、数据库初始化

创建数据库:dataintegration

导入SQL文件:项目目录下 /install/sql/dataintegration.sql

3、项目打包

在项目根目录执行

mvn -B clean compile install -Prelease -Dmaven.test.skip=true -Dcheckstyle.skip=true

4、服务配置与启动

依次启动以下微服务模块(如使用 IntelliJ IDEA):

  • dataintegration-gateway(网关)
  • dataintegration-sys(系统管理)
  • dataintegration-sso(单点登录)
  • dataintegration-group(分组管理)
  • dataintegration-project(脚本管理)
  • dataintegration-run(运行模块)
  • dataintegration-model(模型管理)
  • dataintegration-file-management(文件管理)

每个模块启动前,请修改其 application-local.yaml 配置文件中的以下项:

spring:
  cloud:
    consul:
      host: 127.0.0.1    # 改为 Consul 实际IP
      port: 8500         # 改为 Consul 实际端口
  datasource:
    url: jdbc:mysql://127.0.0.1:3306/dataintegration  # 改为 MySQL 实际地址
    username: root       # 改为 MySQL 账号
    password: 123456     # 改为 MySQL 密码

5、启动前端

进入前端目录并启动

cd dataintegration-ui
npm install
npm run dev

6、访问系统

打开浏览器 http://127.0.0.1:8081/dataintegration-ui/#/

账号信息:admin/123456

项目效果

系统主页

数据集成工具

项目源码

项目提供完整的源码,方便用户进行二次开发或定制。大家可以通过商业版获得完整的中台功能源码,或参考开源版本进行学习和研究。

Gitee:gitee.com/fhs-opensou…

总结

基于Kettle的可视化数据集成平台是一个功能强大、易于使用的数据集成解决方案。

它采用现代前后端技术栈,支持多种数据源接入和丰富的数据处理组件,能够满足企业多样化的数据处理需求。同时,平台还提供全方位的数据管理功能,帮助企业实现数据的全生命周期管理。

关键词

Kettle、数据集成、可视化、SpringCloud、Vue、数据仓库、数据质量、数据安全、源码、Docker

最后

如果你觉得这篇文章对你有帮助,不妨点个赞支持一下!你的支持是我继续分享知识的动力。如果有任何疑问或需要进一步的帮助,欢迎随时留言。

也可以加入微信公众号 [DotNet技术匠] 社区,与其他热爱技术的同行一起交流心得,共同成长!

优秀是一种习惯,欢迎大家留言学习!