初试Kettle.

372 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

简介:

kettle是开源的java开发的etl工具,官网为:Home - Hitachi Vantara从官网下载后解压后点击Spoon.bat即可运行. 如果要连接mysql.MongoDB等数据库则需要下载相关驱动.

Win10环境演示:

例1:

kettle的运行模式是先设置转换模式,然后运行转换. 首先点击主对象树的转换,然后在转换中点击核心对象.

image.png
然后在输入中找到文本文件输入

image.png双击后即可将其添加到页面中. 然后在核心对象的流程中找到过滤记录.将其添加.之后再将输出中的Excel输出添加.
如下图所示:

image.png (当按住shift时点击模块可以添加模块与模块之间的连接,右键点击连接可以使其失效或删除.)
然后双击文本文件输入,将想要处理的文件添加.

image.png

image.png 然后再字段中点击获取字段结果如下(获取字段时kettle会自动分析文件的内容从而自动添加字段,当然也可以手动输入设置字段):

image.png 例如文件内容如下图: image.png 然后双击过滤记录: 把条件设置如下 image.png
然后双击Excel输出设置输出文件位置和字段:

image.png 所有的都设置完成后点击运行转换:

image.png

image.png 可以在相应的路径去查看转换信息或直接右键单击Excel输出点击preview去查看. 当然在设置转换路径的时候也可以不加过滤模块或是使其失效,直接进行转换.

image.png

image.png

例2:

将Excel表转换到MySQL数据库中: 首先在主对象中点击db连接找到mysql数据库然后填入相关的库和用户信息:

image.png
然后点击测试如果成功了点击确定. 然后在核心对象中分别找到Excel输入和表输出.

image.png
表输入的设置和例1相似,也是设置路径和字段.表输出的设置需要输入连接名和库名以及表名:

image.png然后点击运行转换即可.

image.png