上篇文章回顾:
上篇文章主要讲解了如何搭建kettle的使用环境,如何编写和运行第一个转换,并在最后通过两种方式查看运行结果,第一种是通过debug的形式,第二种是通过日志节点进行展示。当然,第二种形式并没有进行详细的讲解,希望大家自行完成。本篇将把第二种展示方式进行讲解,并通过讲解节点使大家对节点感兴趣,自行去挖掘各种节点的使用;除此之外,本章还将讲述如何编写第一个作业;使大家掌握编写作业的能力。
日志方式:
如上篇所述,日志展示方式的最终结果如下图所示:
下面展示创建方式:
第一步:搜索“写日志”节点,并“写日志”节点拖拽到工作区“随机数”节点的后面,如下图所示:
第二步:首先鼠标左键选中“生成随机数”节点(不要松开),然后按着shirft键,拖动鼠标箭头从“生成随机数”节点到“写日志”节点,然后松开鼠标左键;最后如下图所示:
第三步:双击“写日志”节点,打开如下对话框,点击获取字段,此时“num”字段就已经展示出来了,如下图,点击确定。
第四步:保存文件(ctrl+s),点击三角形按钮(运行按钮),运行结束后,可以在执行结果中的日志选项卡下面看到 “num=0.2”的日志,当然每次运行的结果都不一样,你的可能是0.1,0.3等等。
第一个作业(job):
第一步:新建一个转换(文件——》新建——》作业——》并命名为 first-job),并拖拽一下节点(START节点和转换节点)到工作区;如下图:
第二步:配置节点。“START”节点配置如下信息:允许重复,每2秒钟执行一次;“转换”节点配置如下信息:转换文件选中第一个转换(日志形式查看结果)的源文件;如下图所示:
第三步:用"hop"(连接箭头),连接“START”节点和“转换”节点;箭头中间带有一个锁标志(代表是作业,不必在意);
第四步:执行作业;点击执行按钮(三角形按钮);执行结果:可以看到是每隔2秒钟执行一次转换,分别打印了num=0.8 和num=0.1;
第五步:关闭执行;上述作业是在每2秒执行一次(并没有结束条件判断,是不会结束的),所以需要手动停止;点击左上角的正方形按钮(停止按钮);
总结
本篇文章讲解了上篇文章遗留的问题(转换采用日志输出方式查看结果),重点讲述了如何编写第一个job,通过记录下详细的操作步骤,使读者能够自行完成所有的流程。当然,源文件如果需要的话,可以加我的qq号进行获取。下篇文章,准备介绍一些常用节点的使用,如:post节点,数据库查询节点等,为后面讲解一个数据迁移场景做铺垫。
相信大家能够按照上面的步骤实现整个流程,源码文件如果有需要,可以添加我的qq:893393953,进行获取;