快速上手kettle(一)壶之简介

news2024/12/23 17:37:57

Linux核心命令系列文章目录

快速上手kettle(一):壶之简介
快速上手kettle(二):Kettle初体验(博主正在玩命更新中)
快速上手kettle(三):Kettle转换(博主正在玩命更新中)
快速上手kettle(四):Kettle作业(博主正在玩命更新中)
快速上手kettle(五):Kettle实际使用(博主正在玩命更新中)
快速上手kettle(六):Kettle资源库(博主正在玩命更新中)
快速上手kettle(七):Kettle调优(博主正在玩命更新中)

快速上手kettle(一)壶之简介

      • 一、前言
      • 二 、ETL简介
      • 三、Kettle 简介
        • 3.1 kettle是什么?
        • 3.2 kettle两种设计
        • 3.3 kettle核心组件
        • 3.4 kettle 优点
      • 四、Kettle安装
        • 4.1 下载地址
        • 4.2 kettle目录及文件介绍
        • 4.3 kettle 安装
        • 4.4 kettle界面介绍

一、前言

最近由于工作需要,需要用到kettle工具进行数据迁移转换。特意找资料学习了一下,kettle基本操作算是学会了。

所学的也结合实际工作进行了验证。为了防止以后用到忘记了,便写了几篇文章记录一下。

快速上手kettle

二 、ETL简介

ETL ( Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程) 。在企业种我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,对开发人员来说必不可少,这里我要学习的ETL工具是Kettle ! 。

三、Kettle 简介

3.1 kettle是什么?

Kettle 是一款国外的开源ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

顾名思义,Kettle 翻译为中文是水壶,寓意着把所有乱七八糟的数据放到一个壶里,最终以一种指定格式流出

水壶

3.2 kettle两种设计

kettle两种设计

转换和作业

  • Kettle中有两种脚本文件,transformationjobtransformation完成数据基本转换,job完成整个工作流程的控制
  • 转换是数据流,作业是步骤流
  • 作业的每一个步骤,必须等待前面的步骤执行完,后面的步骤才会执行。
  • 转换会一次性把所有控件都启动(一个控件对应一个线程)
  • 数据流会从第一个控件开始,一条记录一条记录的流向最后控件

3.3 kettle核心组件

外国人起名字挺有意思的,kettle的核心组件就是一套烹饪厨具。kettle的作者应该是一位吃货 (●’◡’●)

kettle核心组件

3.4 kettle 优点

kettle 优点

四、Kettle安装

4.1 下载地址

① 官网地址

https://community.hitachivantara.com/docs/DOC-1009855

官网地址国内下载可能很慢很慢,小伙伴们可以通过以下国内镜像地址下载

②国内镜像地址
http://mirror.bit.edu.cn/pentaho/Pentaho%208.2/client-tools/

4.2 kettle目录及文件介绍

目录结构
image-20230525221340766

4.3 kettle 安装

Kettle是java开发的,所以需要安装jdk,我们这里安装经典的jdk8

至于jdk怎么安装,这里就不细说了,如果不知道的小伙伴百度即可

jdk安装完成后,我们将4.1 下载的安装包解压到自己想放置的路径即可

4.4 kettle界面介绍

双击Spoon.bat 即可打开如下界面

首页

转换组件

作业组件

本期内容到此就结束了 (●’◡’●)

下一篇:快速上手kettle(二):kettle初体验(小编正在玩命更新中)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/570564.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

艾迪普发布新一代国产化“3D引擎+工具+平台”,加速释放数字内容生产力

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 艾迪普的2023新产品发布会在5月20日在北京隆重举行,该发布会以"向新出发 智见未来"为主题,艾迪普重磅推出了新一代实时三维图形图像引擎IDP Engine 4.0、iVis无代码编程数字孪生应用开发工…

谷歌云开启GPU算力狂飙,驱动AIGC时代加速到来

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 随着人工智能的飞速发展,尤其是大型AI模型、AIGC的崛起,对AI算力产生了巨大的需求。以GPU为核心的算力供给,已经成为大模型、AIGC乃至整个智能产业发展的关键基础设施。因此,对…

springboot+vue基于java的用户行为的个性化新闻推荐系统

使用个性化新闻服务平台相对传统个性化新闻服务方式具备很多优点:首先可以大幅提高个性化新闻服务信息检索,只需输入新闻相关信息就能在数秒内反馈想要的结果;其次可存储大量的个性化新闻服务信息,同时个性化新闻服务安全性有更高…

Java内存模型 JMM

并发编程模型的两个关键问题 线程之间如何通信及线程之间如何同步。 线程之间如何通信:共享内存,消息传递线程之间如何同步通信是指线程之间以何种机制来 交换信息同步是指程序中用于控制不同线程间 操作发生相对顺序 的机制在共享内存的并发模型里&a…

案例21:Java农产品供求信息系统设计与实现开题报告

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

腾讯、头条 | 算法岗详细面经

作者 | 常青czq 整理 | NewBeeNLP 面试锦囊之面经分享系列,持续更新中 赶紧后台回复"面试"加入讨论组交流吧 写在前面 本硕华南某985,有过两段实习经历,一段是大厂的算法实习,另一段是招行Fintech实习,虽然…

如何在Linux桌面上创建快捷方式?

以下内容源于网络资源的学习与整理,如有侵权请告知删除。 一般而言,Linux环境下在命令行上通过软件包管理工具安装软件,或者从网站直接下载已经编译好的二进制软件包,软件安装好之后不会在桌面上创建快捷方式。接下来如果想要在桌…

iOS推送播放语音播报更新

接上篇如何让iOS推送播放语音,之前的结论是iOS如果需要送审商店只能播放本地的mp3文件,这里更新一下: 更新 语音的播放,最终调用的方法是UNNotificationSound(named: xxx),而这个方法官方文档注释如下: // …

chatgpt赋能python:Python写Kafka:介绍及优势

Python写Kafka:介绍及优势 Kafka是目前互联网企业使用最广泛的消息队列系统之一,广泛应用于应用程序之间的异步通信、数据采集、日志收集等领域。Python作为一门通用且易学易用的编程语言,在和Kafka结合时也展现出了其独特的优势。本文将介绍…

我C,最好用的AI工具居然是它!

这几天写了两篇自己的AI实践: 《程序员,如何借力ChatGPT?》; 《普通人,如何借力ChatGPT?》; 很多朋友在后台留言,问我用的是哪一款AI工具。 先说结论。 我最终在ChatGPT,…

超大规模数据库集群保稳系列之二:数据库攻防演练建设实践

总第562篇 2023年 第014篇 本文整理自美团技术沙龙第75期的主题分享《美团数据库攻防演练建设实践》,系超大规模数据库集群保稳系列(内含4个议题的PPT及视频)的第2篇文章。 本文首先介绍了美团当前数据库运维现状、遇到的问题,以及…

Flutter 笔记 | Flutter 可滚动组件

Sliver布局模型 我们介绍过 Flutter 有两种布局模型: 基于 RenderBox 的盒模型布局。基于 Sliver ( RenderSliver ) 按需加载列表布局。 之前我们主要了解了盒模型布局组件,下面学习基于Sliver的布局组件。 通常可滚动组件的子组件可能会非常多、占用…

Protein Cell | 中国农科院基因组所刘永鑫组综述微生物组研究的过去、现在和未来(大众评审截止26号20点)...

微生物组研究展望:过去、现在和未来 Microbiome research outlook: past, present, and future 2023-5-23,Protein & Cell,[IF 15.328] DOI:10.1093/procel/pwad031 原文链接:https://academic.oup.com/proteincel…

adb 命令速查(下)

ADB 关于APP安装、调试和monkey压力测试 作者:炭烤毛蛋 ,查看博主了解更多。 提示:承接上篇《adb 命令速查(中)》,本文将 文章目录 ADB 关于APP安装、调试和monkey压力测试7 adb 关于 apk 的相关操作7.1 安装 apk普通安装带有命…

QQGC?揭秘QQ的AI绘画大模型技术

👉腾小云导读 2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文将介绍在QQGC基础大模型训练中的实践和探索,接着往下看吧~ …

我用AI帮我唱了首“基尼太美”,颠覆了我的认知!太牛逼了

目录 前言 AI唱"基尼太美"是什么感觉 使用so-vits-svc打造自己专属歌手 1.声音素材整理 2.训练模型 3.让AI唱歌​编辑 AI歌手背后的技术 AI歌手会成为主流吗 写到最后 大家好,我是大侠,AI领域的专业博主 前言 在5月份,孙…

第五篇:强化学习基础之马尔科夫决策过程

你好,我是zhenguo(郭震) 今天总结强化学习第五篇:马尔科夫决策过程 基础 马尔科夫决策过程(MDP)是强化学习的基础之一。下面统一称为:MDP MDP提供了描述序贯决策问题的数学框架。 它将决策问题建模为: 状态…

司空见惯 - 使用dBm表示功率的各种现实情况

前面一篇文章介绍过,使用dBm表示功率时,如何转换为mW。 那现实世界的实际情况中,使用dBm来表示电磁波的能量强度,列表如下: Power level Power Notes 526 dBm 3.61049 W 黑洞碰撞后的引力波辐射的功率&#xff0c…

解决缓存与数据库数据不一致的问题,这篇文章告诉你如何做!

缓存是提高应用程序性能和响应速度的关键组件之一。缓存可以帮助减少数据库查询次数,从而减轻服务器负担并加快页面加载速度。然而,缓存与数据库一致性是分布式系统中常见的问题,因为缓存和数据库之间可能存在数据不一致的情况。为了解决这个…

CyberLink的摄像头应用程序YouCam 10.1版本在win10系统的下载与安装配置教程

目录 前言一、YouCam安装二、使用配置总结 前言 YouCam是由CyberLink公司开发的一款实用的摄像头应用程序,它集成了多种实时视频特效、背景虚化、美颜、屏幕录制等功能。 通过使用该软件内置的相机特效,用户可以将视频聊天或自拍照片变得更加精彩和有趣…