Talend使用

1,207 阅读2分钟

Talend安装配置和基本组件用法。

1、安装配置

java 下载并配置环境变量

www.oracle.com/technetwork…

mysql 下载

www.mysql.com/downloads/

Talend Open Studio 下载地址

www.talend.com/download/

2、认识Open Studio

存储库:集中显示了设计作业所使用的的技术项的相关数据,管理元数据和作业。

设计工作区:展示并设计作业。

组件面板:可用于构建您作业的不同的技术组件,一个组件就是一个预先配置的连接器,可用于执行特定的数据集成操作。组件能够最大程度减少处理多个异构数据源所需的手动编码量。

3、Palette

tMsgBox : (Misc)显示提示信息。

tFileInputDelimited : (File/input)逐行读取文件,并根据分隔符拆分成字段,通过连接将Schema 中定义的字段发送到下一个作业组件。

tLogRow :(Logs & Errors) 在运行控制台中显示数据或结果,用于查看处理的数据。

tMap :(Processing) 将数据从单个或多个源转换并路由到单个或多个目标。

tAggregateRow :(Processing)接收流并基于一列或多列聚合它。 对于每个输出行,提供聚合键和设置操作的相关结果(min,max,sum ...),有助于根据值或计算结果提供一组指标。

4、构建第一个Job

1、首先创建一个作业:右键作业设计,选择创建作业。

2、将数据导入到存储库中:元数据中右键分割文件,创建文件分割,导入本地文件。

3、设置确认数据Schema

4、在设计工作区设计作业流,将分割文件作为tFileInputDelimited组件拖动到设计工作区,将数据导入工作区,找到tLogRow拖动到设计工作区,添加tMap组件并将tFileInputDelimited组件和tLogRow组件连接,如果内容有中文,编辑tFileInputDelimited组件的编码格式。

5、配置tMap组件,双击tMap组件,显示输入和输出表,将两个表的列链接在一起,可以自动映射也可以手动拖动,完成后,点击运行,数据就可以显示出来。