KETTLE——(二)数据抽取
2016-02-14 09:21
281 查看
过了个春节,好长时间没有更新了,今天接着写第二部分——数据抽取。
进入界面以后会发现左侧菜单有两个东西:转换和作业;简单说一下,转换是单次的转换,不可重复,但可重复利用;作业是汇聚了其他操作和多次(可单次)转换,可定时触发,可定时循环。集体情况后面方便再说。
![](https://img-blog.csdn.net/20160214092805195?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
KETTLE支持很多的种形式的数据输入,总体上分三种方式:第一种数据库数据输入(支持多种数据库关系和非关系型数据库);第二种文本数据输入(常见的多种文本,txt,xml等),第三种,有系统自动生成的的数据(包括人工在转换的时候添加的数据)。以数据库数据为例,操作如下。
左侧输入——>表输入
![](https://img-blog.csdn.net/20160214102333469?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
步骤名称(填写步骤名称),数据库连接(选择输入数据的数据库),就和连接资源库时的步骤差不多了(数据库连接),获取SQL查询语句,选择要输入的数据所在的表。
![](https://img-blog.csdn.net/20160214103215025?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
得到查询表里面的所有字段的SQL语句,根据自己需求,自己调整。
![](https://img-blog.csdn.net/20160214103924224?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
如果有条件查询里面存在变量,可勾选【允许……】和【替换……】但注意在前一步需要有变量的确定和输入,这里先做一个简单的输入,【预览】可看,点击【确定】即可。
一个简单的表输入就完成了,其他的输入基本步骤也是如此,不同的是,如果是文本数据,需要告诉KETTLE怎么区分字段,是用什么分割的。
一般只有数据输入是没有用的,我们还需要输出,更重要的是中间的转换过程,想要使用一个工具就想好好了解其功能,多试试各种勾选框和按钮的功能。
最基本的数据输入完成。
进入界面以后会发现左侧菜单有两个东西:转换和作业;简单说一下,转换是单次的转换,不可重复,但可重复利用;作业是汇聚了其他操作和多次(可单次)转换,可定时触发,可定时循环。集体情况后面方便再说。
KETTLE支持很多的种形式的数据输入,总体上分三种方式:第一种数据库数据输入(支持多种数据库关系和非关系型数据库);第二种文本数据输入(常见的多种文本,txt,xml等),第三种,有系统自动生成的的数据(包括人工在转换的时候添加的数据)。以数据库数据为例,操作如下。
左侧输入——>表输入
步骤名称(填写步骤名称),数据库连接(选择输入数据的数据库),就和连接资源库时的步骤差不多了(数据库连接),获取SQL查询语句,选择要输入的数据所在的表。
得到查询表里面的所有字段的SQL语句,根据自己需求,自己调整。
如果有条件查询里面存在变量,可勾选【允许……】和【替换……】但注意在前一步需要有变量的确定和输入,这里先做一个简单的输入,【预览】可看,点击【确定】即可。
一个简单的表输入就完成了,其他的输入基本步骤也是如此,不同的是,如果是文本数据,需要告诉KETTLE怎么区分字段,是用什么分割的。
一般只有数据输入是没有用的,我们还需要输出,更重要的是中间的转换过程,想要使用一个工具就想好好了解其功能,多试试各种勾选框和按钮的功能。
最基本的数据输入完成。
相关文章推荐
- kettle中使用js调用java类的方法
- xms/xmx/xss在kette中的调优设置
- kettle中对hive操作时需要知道的东西
- Kettle-Spoon使用文档
- Kettle REST Client生成经纬度
- kettle启动“Error: could not create the Java Virtual Machine”
- kettle 5.01 连接数据源
- 数据输入控件使用简介
- kettle运行时报错 could not create java virtual machine
- 开源ETL工具--Kettle的简易使用实例
- kettle转换中使用javascript例子整理(1)
- kettle创建数据库资源库,执行SQL语句有两条执行失败
- 使用Java程序调用本地转换盒作业,资源库中的转换和作业(kettle4.2)
- kettle转换中使用javascript例子整理(2)
- Kettle - 生成xml文件
- 解决kettle连接mysql库时缺少驱动的问题
- Kettle 集群(cluster)在多个服务器(windows、linux)上并发执行
- kettle批量设置日志
- 如何自定义修改kettlle默认读取kettle.properties文件路径
- KETTLE——(一)资源库