数据抽取工具 kettle查询控件

101 阅读1分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第2天,点击查看活动详情

概述

查询是转换里面的第九个分类,查询控件是用来查询数据源里面的数据,并合并到主数据流中。

数据库查询

数据库查询就是从数据库里面查询出数据,然后跟数据流中的数据进行左连接的一个过程。左连接的意思是数据流中原本的数据全部有,但是数据库查询控件查询出来的数据不一定全部会列出,只能按照输入的匹配条件来进行关联。

image.png 1. 选择合适的数据库链接

2. 输入要去数据库里面查询的表名

3. 输入两个表进行左连接的连接条件

4. 获取返回字段,得到查询表返回的值

本章节任务:利用表输入控件获取到staff表的数据,然后利用数据库查询控件查询到department表的数据,然后对两个表按照dept_id字段进行左连接,并预览数据。

image.png

流查询

流查询控件就是查询两条数据流中的数据,然后按照指定的字段做等值匹配。注意:流查询在查询前把数据都加载到内存中,并且只能进行等值查询。

image.png 1. 输入查询的数据流

2. 输入两个流进行匹配的字段(等值匹配)

3. 输入查询出的字段

本章节任务:用流查询控件,将staff和department的数据按照dept_id字段进行关联起来。

image.png