kettle从入门到精通 第五十六课 ETL之kettle Microsoft Excel Output

news2024/11/16 4:13:04

1、9.4 版本的kettle中有两个Excel输出,Excel输出和Microsoft Excel输出。前者只支持xls格式,后者支持xls和xlsx两种格式,本节课主要讲解步骤Microsoft Excel输出,如下图所示:

 1)、步骤【生成记录】生成两条测试数据,每条数据里面包含id和name字段。

 2)步骤【Microsoft Excel Output】负责将数据写入文件。

 2、Microsoft Excel 输出-文件&工作表配置。

1)步骤名称:自定义步骤名称

2)文件名称:设置输出文件的文件名称,不用带后缀

3)扩展名:文件后缀,有xls和xlsx两种,这里选择xlsx。

4)Stream XSLX data:在将大型XLSX文件写入输出文件时,请选择此选项。

如果您希望流式传输XLSX文件,请选择此选项。选择此复选框后,系统将使用流式传输API来写入大型文件,而无需任何内存限制(不超过MS Excel的1,048,575行和16,384列的限制)。
如果您不希望流式传输XLSX文件,请取消选中此复选框。
只有在上面的扩展字段中选择了“.xlsx [Excel 2007及以上]”选项时才会出现此选项。

5)Split every ... data rows:在此字段中指定一个正数,以便每“n”行数据创建一个新的输出文件。例如,如果您想要在每200行数据处拆分文件,则在此字段中输入200。文件将按编号进行。填写0则不拆分。

6)文件名包含步骤数目,文件名包含日期,文件名包含时间,指定日期时间格式,都是为了指定文件生成的名字,如下图所示。

7)如果文件已存在:两个选择覆盖原文件和使用现有文件输出,根据业务场景自行选择使用哪种方式。

8)在接收数据前不创建文件:如果选择了此选项,则在检测到一行后,步骤才会创建文件。如果取消选择此选项,则无论是否实际向文件写入行,输出文件都会被创建。,根据业务场景自行选择使用哪种方式。

9)结果中添加文件名:使用此选项将文件名添加到MS Excel输出文件中。

10)工作表名:在MS Excel文件中指定要写入来自PDI的输入行的工作表名称。此字段中可以使用变量或参数。也就是设置sheet的名称。

11)设为活动工作表:如果选中,则在打开Excel时,默认会打开上述工作表。我理解如果静态设置sheet名称之后打开文件时会自动激活该sheet,如果sheet名称设置为动态变量&且勾选设置活动工作表是什么效果,大家可以试下。

 12)如果输出文件中已存在工作表:两个选择覆盖工作表和输出至已存在工作表。根据业务场景自行选择使用哪种方式。

13)保护工作表/保护人/密码:只对xls文件起作用,设置文件的owner和密码。

14)使用模版创建新文件、模版文件:可以设置模版文件,然后基于模板文件复制目标文件,最后将数据写入。

 15)使用模板输出文件,如下图所示

3、Microsoft Excel 输出-内容配置。

1)开始输出自单元格:在MS Excel电子表格中指定要开始写入的单元格(字母列,数字行),例如,A2,表示从从第一列第二行位置开始写数据,第一行为模板文件内容。

2)当输出记录时:两个选项覆盖已存在单元格和下移已有单元格。

3)输出表头/输出表尾/自动调整列大小/不改变现有单元格格式:自己根据业务场景进行设置。

4)强制公式重新计算:决定是否要尝试更新输出文件中的所有公式字段。

当选择此选项时,对于XLS文件格式,步骤会设置一个标记。一旦在MS Excel中打开文件,公式就会重新计算。对于XLSX文件格式,步骤本身必须尝试重新计算公式字段。底层的POI库不支持完整的Excel公式集,这可能会导致错误,如果步骤无法重新计算公式。
选择此选项以强制步骤更新输出文件中的所有公式字段。
清除此选项以保留公式字段并不进行更新。

5)在表的末尾开始写(追加行):勾选的话增量方式写入数据。

6)抵消行数:在写入行之前,指定任何非零数字以使步骤向下移动此数量的行(正数)或向上移动(负数)。负数可能在需要追加到表中但仍保留预定义页脚时很有用。

7)在写入文件前添加的空行数:指定任何正数以使步骤保留此数量的空行。

当向现有表写入时,您可能决定首先写入一些空行。如果您要追加几行到现有表格中,但要偏移它们以查看每个生成的行块的边界,则此选项很有用。

8)删除表头:决定在写入现有电子表格时是否要包含标题。省略标题是有用的,如果您想要生成带有标题的新文件,但不希望在追加到相同文件时重复标题。

9)字段设置:此处设置哪些字段写入文件,比较简单,不做详细介绍。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1644088.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VUE v-for 数据引用

VUE 的数据引用有多种方式。 直接输出数据 如果我们希望页面中直接输出数据就可以使用: {{ pageNumber }}双括号引用的方式即可。 在 JavaScript 中引用 如果你需要直接在代码中使用,直接使用变量名就可以了。 上面这张小图,显示了引用的…

「 网络安全常用术语解读 」通用安全通告框架CSAF详解

1. 简介 通用安全通告框架(Common Security Advisory Framework,CSAF)通过标准化结构化机器可读安全咨询的创建和分发,支持漏洞管理的自动化。CSAF是OASIS公开的官方标准。开发CSAF的技术委员会包括许多公共和私营部门的技术领导…

Ubuntu 域名解析出现暂时性错误

Ubuntu 域名解析出现暂时性错误 问题描述解决方案 问题描述 由于在Ubuntu系统里面经常切换网络导致,系统一直处于有线网络连接但是没网状态,尝试ping网络也无法完成,尝试了很多方法均不能解决 解决方案 点击”虚拟机“ 按照要求设置好即可…

Grafana:云原生时代的数据可视化与监控王者

🐇明明跟你说过:个人主页 🏅个人专栏:《Grafana:让数据说话的魔术师》 🏅 🔖行路有良友,便是天堂🔖 目录 一、引言 1、Grafana简介 2、Grafana的重要性与影响力 …

GPT-3

论文:Language Models are Few-Shot Learners(巨无霸OpenAI GPT3 2020) 摘要 最近的工作表明,通过对大量文本进行预训练,然后对特定任务进行微调,在许多NLP任务和基准方面取得了实质性进展。虽然这种方法…

WPF应用程序XAML

当WPF应用程序创建好后,系统会自动添加一个Grid控件到窗体上,通过Grid控件能够方便地对界面进行布局.下面代码中为Grid控件添加了两行两列,分别用RowDefinitions属性ColumnDefinitions属性表示行的集合和列的集合,集合中有RowDefi…

【短剧在线表格搜索-附模板】

短剧在线表格搜索-附模板 介绍电脑界面手机界面送附加功能:反馈缺失短剧送:资源更新源头获取 介绍 你好! 这是你第一次使用 金山在线文档 所生成的短剧搜索表格,支持批量导入自己转存的短剧名字和链接,实现在线搜索&a…

Java八股文系列之四(JVM)

什么是Java虚拟机?为什么Java被称作是“平台无关的编程语言”? Java虚拟机是一个可以执行Java字节码的虚拟机进程。 Java 实现跨平台的主要原因在于它的编译和执行方式。Java 程序首先被编译成中间代码(bytecode),然…

【白话机器学习系列】白话特征向量

白话特征向量 一个方阵 A A A 与列向量 v v v 的乘积会生成一个新的列向量。这个新向量通常与原向量有着不同的方向,矩阵在这里代表一个线性变换。然而,某些向量会保持其原始方向。我们称这种向量为矩阵 A A A 的特征向量(eigenvector&…

论文阅读_使用有向无环图实现流程工程_AgentKit

英文名称: AgentKit: Flow Engineering with Graphs, not Coding 中文名称: AgentKit:使用图而非编码进行流程工程 链接: https://arxiv.org/pdf/2404.11483.pdf 代码: https://github.com/holmeswww/AgentKit 作者: Yue Wu, Yewen Fan, So Yeon Min, Shrimai Prabh…

5月3号作业

作业 16. 答案:c。 17. 答案: c。 18. 答案:a。 19. 答案:a。 20. 答案:c。 21. 答案:c。 22. 答案:d。 23. 答案:b。 第一个出队元素是5,说明5前面的元素全…

Day15-JavaWeb开发-Maven高级-分模块设计与开发继承与聚合私服

1. Maven高级-分模块设计与开发 2. Maven高级-继承与聚合 2.1 继承关系实现 2.2 版本锁定 2.3 聚合实现 3. Maven高级-私服 3.1 私服-介绍 3.2 私服-资源上传与下载 4. Web开发-完结

全方位了解 Meta Llama 3

本文将为您提供 Llama 3 的全面概览,从其架构、性能到未来的发展方向,让您一文了解这一革命性大语言模型的所有要点。 Meta Llama 发展历程 Llama 1 Llama 是由 Meta(FaceBook) AI 发布的一个开源项目,允许商用,影响力巨大。Lla…

让.NET 8 支持 Windows Vista RTM

众所周知,从 Windows 的每次更新又会新增大量 API,这使得兼容不同版本的 Windows 需要花费很大精力。导致现在大量开源项目已经不再兼容一些早期的 Windows 版本,比如 .NET 8 AOT编译命令行程序时生成的EXE,依赖以下三个函数&…

Raft共识算法笔记,MIT6.824,

处理leader和follow的一个重要思路是多数投票,确保系统中存在奇数个服务器(例如3台)。进行任何操作都需要来自多数服务器的同意,例如3台服务器中的2台。如果没有多数同意,系统会等待。为什么多数投票有助于避免脑裂问题…

【linux-IMX6ULL配置GPIO通用流程-以及时钟配置】

目录 1. GPIO模式控制流程1.1 LED、蜂鸣器、按键1.2 GPIO控制流程 2. 标准库的简要分析及实现:2.1 问题引入:2.2 代码实现: 3. 时钟配置总结:3.1 时钟树概要:3.2 IMX6ULL时钟概要及时钟树:3.3 IMX6ULL时钟配…

Spring Boot | Spring Boot 消息管理 ( 消息中间件 ) 、RabbitMQ“消息中间件“

目录: 一、"消息服务" 概述 :1.1 为什么要使用 "消息服务" ( 消息中间件 ) ?① 异步处理② 应用解耦③ 流量削峰④ 分布式事务管理 1.2 常用 "消息中间件" 介绍 :ActiveMQ ( 广泛应用于中小型企业 )RabbitMQ ( 没有特别要求的场景下…

XBoot:基于Spring Boot 2.x的一站式前后端分离快速开发平台

XBoot:基于Spring Boot 2.x的一站式前后端分离快速开发平台 摘要 随着信息技术的迅速发展,快速构建高质量、高可靠性的企业级应用成为了迫切需求。XBoot,作为一个基于Spring Boot 2.x的一站式前后端分离快速开发平台,通过整合微信…

CSS选择器、字体文本属性、三大特性、盒子模型等

目录 导入css简介HTML的局限性CSS-网页美化CSS语法规范CSS代码风格 选择器基础选择器复合选择器 CSS字体属性字体系列字体大小字体粗细文字样式字体复合属性 CSS文本属性文本颜色对齐文本装饰文本文本缩进行间距(即行高) CSS的引入方式emmet语法元素显示模式什么是?…

百度下拉框负面信息如何删除?

百度头条360等搜索引擎,作为人们获取信息的主要途径之一。然而,一些知名的企业或个人可能会面临在搜索的下拉框中出现负面信息的问题,这可能对其声誉和形象造成不良影响。小马识途营销顾问根据自身从业经验,针对这类情况提出以下建…