目录
- 一、新建一个转换工程
- 1. 创建【转换】工程
- 2. 创建输入对象并编辑步骤
- 3. 创建输出对象并编辑步骤
- 二、运行转换工程和查看执行结果
- 1. 运行转换工程
- 2. 查看执行结果
一、新建一个转换工程
1. 创建【转换】工程
在 Kettle 欢迎界面中,依次点击【新建】->【转换】菜单项,或使用 Ctrl+N 组合键,创建【转换 1 】工程。
2. 创建输入对象并编辑步骤
(1)新建转换工程后,左侧的组件区域会默认选中【核心对象】选项卡,该选项卡下有许多类别对象。我们点击【输入】对象,看到【输入】对象下有包含Access 输入、CSV文件输入、Cube文件输入、Excel文件输入等众多组件。我们选择“CSV文件输入”组件并将其拖拽至右侧的工作区域内。
(2)选中“CSV文件输入”组件,右键点击“编辑步骤”弹出“CSV文件输入”组件可配置的所有参数选项,这些参数选项我们会在后续的课程中详细讲解和使用,目前我们只需点击“文件名”参数后的“浏览(B). . .”进行所需读取文件的选择。
(3)我们选择路径为“/root/qingjiao_data/data”目录下的“student.csv”文件并点击【OK】。(我们这里选择的是CSV文件输入组件,其它格式的文件是不可读取的)
(4)接着我们点击 CSV 文件输入 窗口底部的【获取字段】后会弹出“sample data”(抽样数据)窗口,这里我们可以设置读取此文件的前多少行,默认为100。然后直接点击【确定】按钮。因为此处我们没有设置每个字段的名称和类型等参数,kettle 默认会将读取文件的首行数据作为字段名称,并且会自动推断和确定字段的类型、格式、长度、精度等字段的详细属性。
(5)接下来点击【预览】按钮,会弹出预览数据的行数,默认为1000。点击【确定】按钮,弹出“预览数据”窗口。因为首行数据被当作字段,所以预览数据时只能看到我们有49条数据。(原始 student.csv 文件中有50条数据)
(6)点击【关闭】按钮,关闭“预览数据”窗口,接着在“CSV 文件输入”窗口点击【确定】按钮即可完成 CSV 文件输入 组件的参数配置。
3. 创建输出对象并编辑步骤
(1)在左侧【核心对象】下选择【输出】分类下的“Excel输出”拖拽至右侧工作区域内。
(2)选中“CSV文件输入”后按住键盘上的【Shift】键,然后拖拽至“Excel输出”组件,进行组件间的“节点连接”。
(3)右键“Excel输出”组件进行 编辑步骤 页面,修改保存的 文件名 参数值为“/root/software/”目录下,保存的文件名称为“excel_output.xls”。将 编辑步骤 页面的 扩展名 参数值设置为空后,点击【确定】。
二、运行转换工程和查看执行结果
1. 运行转换工程
(1)点击 “转换 1” 转换工程标题下方【运行】运行按钮,弹出 “执行转换” 窗口,此窗口内主要有 kettle 的运行模式、日志级别等参数。点击【启动】按钮执行转换工程。
(2)接下来 kettle 会弹出让我们保存的窗口,我们这里保存到 “/root/software/” 目录下,文件名为 “first_Transform.ktr”。(.ktr是 PDI 转换工程文件的存储格式)
2. 查看执行结果
查看日志
Tip:“执行结果”面板选项卡说明
- 【日志】选项卡。默认选项,显示转换中的日志信息,这些信息一般包括转换成功、失败、失败的错误提示信息等。
- 【执行历史】选项卡。显示【转换日志表】【步骤日志表】【日志通道日志表】【Metrics log table】等表的信息。
- 【步骤度量】选项卡。显示组件一些可以度量的数据信息,如复制的记录行数,读、写记录数等。
- 【性能图】选项卡。配置转换属性的参数,以便能够有效地重新执行转换。
- 【Metrics】选项卡。显示有关转换的组件执行时间、读取数据文件时间等指标数据。
- 【Preview data】选项卡。预览转换的结果数据。