kettle使用详解(配置以及创建一个简单的转换)
开篇:其实在很久之前,就有想写博客的想法,鉴于种种原因一直也没有开始下笔。总结真的是一门学问,既能提高自己,又能惠及他人,何乐而不为。 所以笔者决定通过一系列的原创博文,来为需要使用相同技术的同学提供一条捷径,让大家能避过一些坑,旨在共同提高。 此系列为kettle的使用第一篇文章,接下来会从基础配置,简单抽取一直到复杂的数据库转换为大家讲解kettle的使用。 每日一言:生活总是这样,不能叫人处处都满意。但我们还要热情的活下去。人活一生,值得爱的东西很多,不要因为一个不满意,就灰心。 ----路遥《人生》
kettle的配置以及创建一个简单的转换
由于kettle是java编写的数据抽取转换工具,所以启动kettle必须要有java环境支持,并且各个版本所对应的java版本有一定的要求,为了避免这写环境因素造成大家测试出现问题,下面列出本次demo的环境。 本地机器环境:
- 电脑系统 :winds10 64位 专业版;
- Java版本 :jdk1.8;
- kettle版本 :解压版 pdi-ce-6.1.0.1-196.zip;
- 数据库版本 :mysql 5.7
配置启动
保证机器配置好java环境变量(如果不会请自行百度java环境变量配置)。解压kettle压缩包,找到启动软件的批处理文件Spoon.bat,双击启动。
-
Java环境变量配置有误。
-
可能是Java版本太低了,jdk1.6以上版本才行,具体的可以查看spoon.bat配置文件。
-
Java环境配置对了,但是启动不了spoon.bat,双击闪退 使用cmd启动spoon.bat查看报错, could not create the java virtual machine。
java虚拟内存不足。 用编辑器打开spoon.bat 找到 if "%PENTAHO_DI_JAVA_OPTIONS%" == "" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m" 为kettle设置的默认JVM内存。 解决办法: 将其改小为if "%PENTAHO_DI_JAVA_OPTIONS%" == "" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx512m" "-XX:MaxPermSize=256m".
启动成功截图:
自此kettle配置启动完毕!
创建一个简单的转换
首先介绍一下转换的工作流程,转换的流程是kettle从一个DB连接中的某个数据库中抽取出数据,经过加工后,按照指定的规则插入到另一个指定的数据库中,可以是同一个连接也可以是不同的连接。
启动成功后点击 文件>新建>转换,新建一个转换。