【Kettle】新建转换工程

news2024/9/22 7:24:48

目录

  • 一、新建一个转换工程
    • 1. 创建【转换】工程
    • 2. 创建输入对象并编辑步骤
    • 3. 创建输出对象并编辑步骤
  • 二、运行转换工程和查看执行结果
    • 1. 运行转换工程
    • 2. 查看执行结果


一、新建一个转换工程

1. 创建【转换】工程

在 Kettle 欢迎界面中,依次点击【新建】->【转换】菜单项,或使用 Ctrl+N 组合键,创建【转换 1 】工程。
在这里插入图片描述

2. 创建输入对象并编辑步骤

(1)新建转换工程后,左侧的组件区域会默认选中【核心对象】选项卡,该选项卡下有许多类别对象。我们点击【输入】对象,看到【输入】对象下有包含Access 输入、CSV文件输入、Cube文件输入、Excel文件输入等众多组件。我们选择“CSV文件输入”组件并将其拖拽至右侧的工作区域内。
在这里插入图片描述
(2)选中“CSV文件输入”组件,右键点击“编辑步骤”弹出“CSV文件输入”组件可配置的所有参数选项,这些参数选项我们会在后续的课程中详细讲解和使用,目前我们只需点击“文件名”参数后的“浏览(B). . .”进行所需读取文件的选择。
在这里插入图片描述
(3)我们选择路径为“/root/qingjiao_data/data”目录下的“student.csv”文件并点击【OK】。(我们这里选择的是CSV文件输入组件,其它格式的文件是不可读取的)
在这里插入图片描述
(4)接着我们点击 CSV 文件输入 窗口底部的【获取字段】后会弹出“sample data”(抽样数据)窗口,这里我们可以设置读取此文件的前多少行,默认为100。然后直接点击【确定】按钮。因为此处我们没有设置每个字段的名称和类型等参数,kettle 默认会将读取文件的首行数据作为字段名称,并且会自动推断和确定字段的类型、格式、长度、精度等字段的详细属性。
在这里插入图片描述
(5)接下来点击【预览】按钮,会弹出预览数据的行数,默认为1000。点击【确定】按钮,弹出“预览数据”窗口。因为首行数据被当作字段,所以预览数据时只能看到我们有49条数据。(原始 student.csv 文件中有50条数据)
在这里插入图片描述
(6)点击【关闭】按钮,关闭“预览数据”窗口,接着在“CSV 文件输入”窗口点击【确定】按钮即可完成 CSV 文件输入 组件的参数配置。

3. 创建输出对象并编辑步骤

(1)在左侧【核心对象】下选择【输出】分类下的“Excel输出”拖拽至右侧工作区域内。
在这里插入图片描述
(2)选中“CSV文件输入”后按住键盘上的【Shift】键,然后拖拽至“Excel输出”组件,进行组件间的“节点连接”。
在这里插入图片描述
(3)右键“Excel输出”组件进行 编辑步骤 页面,修改保存的 文件名 参数值为“/root/software/”目录下,保存的文件名称为“excel_output.xls”。将 编辑步骤 页面的 扩展名 参数值设置为空后,点击【确定】。
在这里插入图片描述

二、运行转换工程和查看执行结果

1. 运行转换工程

(1)点击 “转换 1” 转换工程标题下方【运行】运行按钮,弹出 “执行转换” 窗口,此窗口内主要有 kettle 的运行模式、日志级别等参数。点击【启动】按钮执行转换工程。
在这里插入图片描述

(2)接下来 kettle 会弹出让我们保存的窗口,我们这里保存到 “/root/software/” 目录下,文件名为 “first_Transform.ktr”。(.ktr是 PDI 转换工程文件的存储格式)
在这里插入图片描述
在这里插入图片描述

2. 查看执行结果

查看日志
Tip:“执行结果”面板选项卡说明
在这里插入图片描述

  • 【日志】选项卡。默认选项,显示转换中的日志信息,这些信息一般包括转换成功、失败、失败的错误提示信息等。
  • 【执行历史】选项卡。显示【转换日志表】【步骤日志表】【日志通道日志表】【Metrics log table】等表的信息。
  • 【步骤度量】选项卡。显示组件一些可以度量的数据信息,如复制的记录行数,读、写记录数等。
  • 【性能图】选项卡。配置转换属性的参数,以便能够有效地重新执行转换。
  • 【Metrics】选项卡。显示有关转换的组件执行时间、读取数据文件时间等指标数据。
  • 【Preview data】选项卡。预览转换的结果数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2055541.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

其实你就学不会 Python

标题党一下,Python 程序员成千上万,当然有很多人学得会。这里说的“你”,是指职场中的非专业人员。 职场人员一般会用 Excel 处理数据,但也会有很多无助的情况,比如复杂计算、重复计算、自动处理等,再遇上个…

中石油笔试25届秋招考什么?如何通过在线测评|附真题库面试攻略

职小豚 一、中石油公司介绍 嘿,小伙伴们!今天咱们来聊聊大名鼎鼎的中石油。 中石油,那可是能源领域的巨无霸!它就像一座庞大的能源宝库,为我们的生活和国家的发展源源不断地输送着动力。 中石油在国内外的油气勘探…

如何优雅的薅羊毛之Flux.1免费使用还支持中文prompt

我看硅基流动,现在免费用Flux.1的模型了,就注册了一个账号 但是Flux和之前的sd一样,中文理解力有问题 换哪个模型都不成,直接换英文提示词还行 放DIFY里串一下 我看tool里没有,那就自定义一个 DIFY要求schema要满足op…

SpringCloud天机学堂:分布式任务调度

SpringCloud天机学堂:分布式任务调度 文章目录 SpringCloud天机学堂:分布式任务调度1、分布式任务调度2、分布式任务调度原理3、分布式任务调度技术对比4、XXL-JOB介绍部署调度中心定义任务注册执行器配置任务调度执行一次 1、分布式任务调度 一般的定时…

43.x86游戏实战-XXX寻找吸怪坐标

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 本次游戏没法给 内容参考于:微尘网络安全 工具下载: 链接:https://pan.baidu.com/s/1rEEJnt85npn7N38Ai0_F2Q?pwd6tw3 提…

( Neurocomputing,2023)Relphormer:用于知识图谱表示的关系图Transformer

Relphormer:Relational Graph Transformer for Knowledge Graph Representations 资料 论文:Relphormer:Relational Graph Transformer for Knowledge Graph Representations 代码:https://github.com/zjunlp/Relphormer 摘要 Transformer在包括自然…

提高网站并发量的有效策略有哪些?

提高网站并发量的有效策略有哪些? 1. 静态化 & 模板引擎2. 分离静态资源3. 数据库优化4. 缓存技术5. 镜像部署6. 负载均衡7. CDN加速 💖The Begin💖点点关注,收藏不迷路💖 1. 静态化 & 模板引擎 HTML静态化&a…

8月19日笔记

http隧道搭建(续) ABPTTS安装使用 一款基于 SSL 加密的 HTTP 端口转发工具,全程通信数据加密,比 reGerog 都要稳定。使用 python2 编写,但是该工具只支持 aspx 和 jsp 脚本的网站。 下载地址:https://github.com/nccgroup/ABPTT…

CentOS7上安装RabbitMQ

在 CentOS 7 上安装 RabbitMQ 需要一些步骤,包括安装必要的依赖项、启用 RabbitMQ 源以及安装 RabbitMQ 服务器。以下是详细的步骤: 1. 更新系统 首先,确保系统是最新的: sudo yum update -y2. 安装 Erlang RabbitMQ 依赖于 E…

【Python】成功解决 ModuleNotFoundError: No module named ‘PIL‘

【Python】成功解决 ModuleNotFoundError: No module named ‘PIL’ 下滑即可查看博客内容 🌈 欢迎莅临我的个人主页 👈这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地!🎇 🎓 博主简介:985高…

网络安全-防火墙初步认识。

文章目录 1. 防火墙是什么?2. 防火墙的工作原理是什么?3. 防火墙的分类有哪些?4. 实战4.1 防火墙管理和实验介绍4.2 防火墙命令行初体验实验目标:实验步骤: 4.3 防火墙Web初体验实验目标:实验步骤&#xff…

[星瞳科技]OpenMV是否属于单片机?

文件系统 MicroPyhon的文件系统是FatFS。 根目录 路径都是以根目录为起点。 当插入sd卡后,根目录就是SD卡;不插入sd卡,根目录就是内置的Flash。 如果需要,你可以在SD卡上,新建一个空文件:/flash/SKIPS…

你是如何克服编程学习中的挫折感的?

编程之旅:穿越挫折的迷雾,拥抱成长的阳光 在编程的浩瀚星空中,每个人都是探索未知的宇航员,面对着无尽的代码海洋和未知的Bug黑洞。挫折感,这位不速之客,时常在探索的旅途中悄然降临,试图用迷茫…

使用WINUI3 编写一个小软件1 C#

本篇主要是记录安装和运行的问题。 先说安装 因为我是WIN11,所以勾了,如果你是WIN10就不用勾选11那个,但是我不确定用11要不要10那个,所以就勾了,按安装手册来的。 2、创建项目 照着选就完事了,别选错 这…

运维学习————nginx-入门及反向代理搭建

目录 一、简介 二、正向代理和反向代理 1、正向代理 作用 2、反向代理 作用 三、单机版nginx部署 1、查看环境 2、环境安装以及nginx安装 2.1、安装pcre 2.2、安装gzip模块需要 zlib 库 2.3、安装Nginx 3、启动测试 四、反向代理配置 一、简介 nginx [engine x] 是…

python人工智能002:jupyter基本使用

小知识:将jupyter修改为中文,修改用户变量, 注意是用户变量,不是系统变量 新增用户变量 变量名:LANG 变量值:zh_CN.UTF8 然后重启jupyter 上一章的软件安装完成之后,就可以创建文件夹来学习写…

[PHP]-Laravel中Group By引发的问题思考

Laravel 和 ThinkPHP 是两个不同的 PHP 框架,它们在底层使用了相同的 SQL 查询语言来与数据库交互。然而,由于框架的设计和实现方式不同,它们在生成 SQL 查询时可能会表现出一些细微的差异,包括对 GROUP BY 子句的处理。 在调用查…

OpenCV学堂 | 汇总 | 深度学习图像去模糊技术与模型

本文来源公众号“OpenCV学堂”,仅用于学术分享,侵权删,干货满满。 原文链接:汇总 | 深度学习图像去模糊技术与模型 引言 深度学习在图像去模糊领域展现出了强大的能力,通过构建复杂的神经网络模型,可以自…

基于 html5 的图书管理系统--论文pf

TOC springboot532基于 html5 的图书管理系统--论文pf 第1章 绪论 1.1选题动因 当前的网络技术,软件技术等都具备成熟的理论基础,市场上也出现各种技术开发的软件,这些软件都被用于各个领域,包括生活和工作的领域。随着电脑和…

ansible[自动配置]

回顾 1、mysql和python (1)不需要执行mysql_ssl_rsa_setup (2)Change_master_to.不需要get public key 2、可以使用pymysql非交互的管理mysql (1)connpymysql.connect(host,user,password,database,prot)…