[Kettle] 字段处理

news2025/1/18 2:00:58

1.增加常量

常量是指在计算机程序运行过程中其值不能改变的量

常量可以是任何的数据类型,例如,圆周率"3.141159"、中国首都"北京"等都可以是常量

增加常量是指在数据中增加一个字段,并给字段设置一个固定的值

数据源

2018年上学期期末考试成绩(Kettle数据集9).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537342?spm=1001.2014.3001.5501需求:为了方便统计学生考试的平均分数,需要在某年级的"2018年上学期期末考试成绩.xls"文件中,使用增加常量组件,增加"考试课程数"字段,并设置值为"6"

1.1 建立【增加常量】转换工程

使用Ctrl+N快捷键,创建【增加常量】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末考试成绩.xls"文件,预览数据,如下图所示,没有"考试课程数"字段

在【增加常量】转换工程中,单击【核心对象】选项卡,展开【转换】对象,在【核心对象】选项卡中,选中【增加常量】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【增加常量】组件,建立节点连接,如下图所示

1.2 设置【增加常量】组件参数

双击【增加常量】组件,弹出创建【增加常量】对话框,如下图所示

【增加常量】组件有关参数说明如下表所示

参数名称说明
步骤名称

表示增加常量组件名称,在单个转换工程中,名称必须唯一

默认值为【增加常量】组件名称

名称表示增加常量的字段名称,默认值为空
类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

格式

表示转换时,原始字段格式的可选掩码。使用公共有效日期和数字格式的信息,请参阅有关公共格式参考书

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
当前的表示是否对当前记录处理,默认值为空
10进制的表示数字类型字段是否为10进制,默认值为空
分组表示数值分组符号,一般使用","英文逗号,默认值为空
表示增加常量字段的值,默认值为空
设为空串表示是否设为空字符串,默认值为空

在【增加常量】对话框中,因为学生考试课程数都是一样的,所以增加"考试课程数"字段,并设置值为"6",操作步骤如下

(1) 确定组件名称,保留【增加常量】默认值为"增加常量"

(2) 设置增加常量的字段参数,对【字段】参数进行设置

此时完成【增加常量】组件参数的设置如下图所示

1.3 预览结果数据

在【增加常量】转换工程中,单击【增加常量】组件,再单击工作区上方的"预览这个转换"图标,预览增加常量后的数据,如下图所示

2.将字段值设置为常量

增加常量是增加字段,并给该字段赋值,与增加常量类似,将字段值设置为常量,是对现有的字段,重新赋一个新的固定值

数据源

2018年上学期期末语数英考试成绩(Kettle数据集10).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537546?spm=1001.2014.3001.5501需求:为了统计课程考试的平均分数,需要在"2018年上学期期末语数英考试成绩.xls"文件中,对其中数据为空的"基础课程数"字段,采用将字段值设置为常量组件,设置"基础课程数"字段的数据为"3",表示语文、数学和英语等3门基础课程数

2.1 建立【将字段值设置为常量】转换工程

使用Ctrl+N快捷键,创建【将字段值设置为常量】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末语数英考试成绩.xls"文件,预览数据,如下图所示,发现"基础课程数"数据为<null>

在【将字段值设置为常量】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【将字段值设置为常量】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【将字段值设置为常量】组件,建立节点连接,如下图所示

2.2 设置【将字段值设置为常量】组件参数

在【将字段值设置为常量】转换工程中,双击【将字段值设置为常量】组件,弹出创建【将字段值设置为常量】对话框,如下图所示

【将字段值设置为常量】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示将字段值设置为常量组件名称,在单个转换工程中,名称必须唯一

默认值为【将字段值设置为常量】组件名称

在常量中使用变量表示常量是否使用变量的值,默认值为空
名称表示将字段值设置为常量的字段名称,默认值为空
值替换表示替换数据的值,默认值为空

转换掩码(对日期型)

表示转换时,对于日期型字段,采用的可选掩码。有关使用的公共有效日期和数字格式的信息,请参阅有关公共格式参考书

默认值为空

设为空串

表示是否设置为空串,选项为:是、否

默认值为空

在【将字段值设置为常量】对话框中,对于所有的考生,基础课程数都是3门,将"基础课程数"字段设置为"3",步骤如下

(1) 确定组件名称,保留【将字段值设置为常量】参数默认值"将字段值设置为常量"

(2) 设置将字段值设置为常量的字段参数,对【字段】表参数进行设置

此时完成【将字段值设置为常量】组件参数的设置如下图所示

2.3 预览结果数据

在【将字段值设置为常量】转换工程中,单击【将字段值设置为常量】组件,再单击工作区上方的"预览这个转换"图标,预览将字段值设置为常量后的数据,如下图所示

3.剪切字符串

字符串(String)是由数字、字母和下划线等组成、由一对英文双引号或单引号包括起来的用于表示文本的数据类型

剪切字符串,就是在字符串中,去除多余的内容,保留需要的内容,例如在"Hello,World!"字符串中,只保留"Hello",而剪除其余部分

数据源

2018年12月月考成绩(Kettle数据集11).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537857?spm=1001.2014.3001.5501需求:为了简化数据,需要在"2018年12月月考考试成绩.xls"文件中,采用剪切字符串组件,使"考试时间"字段只保留年月的数据

3.1 建立【剪切字符串】转换工程

使用Ctrl+N快捷键,创建【剪切字符串】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年12月月考考试成绩.xls"文件,注意在设置字段参数中,"考试时间"字段由"Date"日期型设置为"String"字符串类型,格式设置为"yyyy-MM-dd HH:mm:ss",以便进行字符串剪切,如下图所示

预览数据,如下图所示,发现当前数据中,"考试时间"字段数据为完整的年月日和具体时间 

在【剪切字符串】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【剪切字符串】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【剪切字符串】组件,建立节点连接,如下图所示

3.2 设置【剪切字符串】组件参数

双击【剪切字符串】组件,弹出创建【剪切字符串】对话框,如下图所示

【剪切字符串】组件的有关参数说明如下表所示

参数名称说明

步骤名称

表示剪切字符串组件名称,在单个转换工程中,名称必须唯一

默认值为【剪切字符串】组件名称

输入流字段要剪切的字段名称,默认值为空
输出流字段剪切后的新字段名称,默认值为空
起始位置表示剪切的起始位置,位置从0开始计算,默认值为空
结束位置表示结束对字符串剪切的位置,默认值为空

在【剪切字符串】对话框中,月考的考试时间只需保留年月即可,步骤如下

(1) 确定组件名称,保留【剪切字符串】参数为默认值"将字段值设置为常量"

(2)  设置要剪切的字符串字段的参数,对【要剪切的字段】参数进行设置

此时完成【剪切字符串】组件参数的设置如下图所示

3.3 预览结果数据

在【剪切字符串】转换工程中,单击【剪切字符串】组件,再单击工作区上方的"预览这个转换"图标,预览剪切字符串后的数据,如下图所示 

4.拆分字段

数据源

系统操作日志(Kettle数据集12).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88538593?spm=1001.2014.3001.5501需求:为了方便浏览日志内容,需要在某软件系统的操作日志"系统操作日志.xls"文件中,采用拆分字段组件,从日志内容中拆分出用户ID、操作时间、操作内容和IP地址字段,并对应到相关的数据

4.1 建立【拆分字段】转换工程

使用Ctrl+N快捷键,创建【拆分字段】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"系统操作日志.xls"文件,预览数据,如下图所示,只有一个"系统日志"字段,内容显得很乱

在【拆分字段】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【拆分字段】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【拆分字段】组件,建立节点连接,如下图所示

4.2 设置【拆分字段】组件参数

双击【拆分字段】组件,弹出创建【拆分字段】对话框,如下图所示

【拆分字段】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示拆分字段组件名称,在单个转换工程中,名称必须唯一

默认值为【拆分字段】组件名称

需要拆分的字段表示要拆分字段的名称,默认值为空
分隔符

表示确定字段的分隔符

特殊字符(如CHAR ASCII HEX01)可以用$[value]格式设置,如$[01]或$[6F,FF,00,1F]

默认值为","英文逗号

Enclosureignore delimiters within paris enclosure(leave blank of none)
字段

表示拆分的新字段名称,使用【字段】表,设置新字段参数。对于新字段,必须定义字段名称、数据类型和其他属性

默认值为空

新的字段表示拆分出的新的字段名称,默认值为空

ID

表示给拆分出新字段的ID编号,方便移除字段时使用,默认值为空

移除ID?

表示是否要移除该编号的的字段,选项有Y、N

默认值为空

类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
格式

表示转换时,原始字段格式的可选掩码

默认值为空

分组符号

表示数值分组符号,一般使用","英文逗号表示

默认值为空

小数符号

表示小数点符号,一般使用"."英文点号

默认值为空

货币符号

表示货币符号,例如"¥","$","€"等货币符号

默认值为空

Nullif

表示Nullif名称,默认值为空
缺省表示缺省值,默认值为空

去除空格类型

表示去除空格的类型,选项有不去掉空格、去掉左空格、去掉右空格、去掉左右两端空格

默认值为不去掉空格

在【拆分字段】对话框中,设置参数,从操作日志数据中分拆出用户ID、操作时间、操作内容和IP地址等字段数据,步骤如下 

(1) 设置【拆分字段】组件名称,【步骤名称】参数保留默认值"拆分字段"

(2) 确定需要拆分的字段名称以及内容分隔符,【需要拆分的字段】参数设置为"系统日志";保留【分隔符】默认值","英文逗号

(3) 设置拆分后新字段参数,对要拆分的字段参数进行设置,【新的字段】【移除ID?】【类型】参数的设置如图所示,【去除空格类型】参数统一设为"不去掉空格"

此时完成【拆分字段】组件参数的设置如下图所示

4.3 预览结果数据

在【拆分字段】转换工程中,单击【拆分字段】组件,再单击工作区上方的"预览这个转换"图标,预览拆分字段后的数据,如下图所示

5.数值范围

数值范围是给定下限和上界数值的区间范围,划分出多个数值范围

数据源

2019年10月月考英语成绩(Kettle数据集5).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88529906?spm=1001.2014.3001.5501需求:为了解学生分数的分布情况,需要在"2019年10月月考英语成绩.xls"文件中,使用数值范围组件,对英语分数划分范围,以便统计各范围区间的人数:小于80分、80~90分、90~100分、100~110分、100~120分、120~130分、130~140、140~150分、150分满分

5.1 建立【数值范围】转换工程

使用Ctrl+N快捷键,创建【数值范围】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2019年10月月考英语成绩.xls"文件,预览数据,如下图所示

在【数值范围】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【数值范围】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【数值范围】组件,建立节点连接,如下图所示 

5.2 设置【数值范围】组件参数

双击【数值范围】组件,弹出【数值范围】对话框,如下图所示

【数值范围】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示数值范围的组件名称,在单个转换工程中,名称必须唯一

默认值为【数值范围】的组件名称

输入字段

表示要对其划分数值范围的输入流数值型字段,在输入流字段列表中选取

默认值为空

输出字段表示划分数值范围的新字段名称,默认值为range
缺省值(如果没有匹配到的范围)

表示要划分数值范围的字段数据,没有在划分的范围内的值

默认值为unknown

范围 (最小<=X<最大)

表示要划分的设置范围区间

使用一个表,分行设置多个范围,范围的参数如下:

① 下限:该范围取值的最小值(<=)
② 上界:该范围取值的最大值(<)
③ 值:该范围的名称

在【数值范围】对话框中,设置参数,对英语分数划分以下范围:小于80分、80~90分、90~100分、100~110分、100~120分、120~130分、130~140、140~150分、150分满分,步骤如下

(1) 设置【数值范围】组件名称,【步骤名称】保留默认值"数值范围"

(2) 确定划分数值范围的字段,【输入字段】设置为"英语"字段

(3) 确定输出的字段,【输出字段】设置为"分数范围"字段

(4) 确定【缺省值(如果没有匹配到的范围)】的内容,【缺省值(如果没有匹配到的范围)】设置为"不在范围内"

(5) 划分数值范围,对【范围 (最小<=X<最大)】表的参数进行设置

此时完成【数值范围】组件参数的设置如下图所示

5.3 预览结果数据

在【数值范围】转换工程中,单击【数值范围】组件,再单击工作区上方的"预览这个转换"图标,预览设置数值范围后的数据,如下图所示 

6.计算器

计算器除了进行加、减、乘和除等简单运算外,还可以进行乘方、开方、指数、对数、三角函数和统计等方面的运算

Kettle软件提供计算器组件,对数值型的字段数据进行运算

数据源

2018年上学期期末考试成绩(Kettle数据集9).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537342?spm=1001.2014.3001.5501需求:为了详细了解学生的基础和全部课程的考试情况,需要在"2018年上学期期末考试成绩.xls"文件中,使用计算器组件,分别计算学生语文、数学和英语3门基础课程的总分数,以及全部6门课程的总分数

6.1 建立【计算器】转换工程

使用Ctrl+N快捷键,创建【计算器】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末考试成绩.xls"文件,预览数据,如下图所示,只有各科课程分数,没有统计分数

在【计算器】转换工程,单击【核心对象】选项卡,展开【转换】对象,选中【计算器】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【计算器】组件,建立节点连接,如下图所示

6.2 设置【计算器】组件参数

双击【计算器】组件,弹出创建【计算器】对话框,如下图所示

【计算器】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示计算器组件名称,在单个转换工程中,名称必须唯一

默认值为【计算器】组件名称

Throw an error on non existing files表示文件不存在是是否抛出一个错误,默认值为√,勾选
字段表示保存计算器运算结果的新字段,使用一个【字段】表,设置新字段参数,默认值为空
新字段表示保存计算器运算结果的新字段名称,默认值为空
计算表示计算公式,从系统提供的计算公式中选择,默认值为空
字段A表示参加计算的第一个字段,从输入流中选取,也可直接键盘设置,默认值为空
字段B表示参加计算的第二字段,从输入流中选取,也可直接键盘设置,默认值为空
字段C表示参加计算的第三字段,从输入流中选取,也可直接键盘设置,默认值为空
值类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
移除表示所在行的新字段只参加运算,不出现在输出流中
Conversion Mask表示所在行的新字段的掩码,默认值为空
小数点表示小数点符号,一般使用"."英文点号,默认值为空
分组表示数值分组符号,一般使用","英文逗号表示,默认值为空
货币符号表示货币符号,例如"¥","$","€"等货币符号,默认值为空

在【计算器】对话框中,设置参数,统计基础课程语数英的总分数和全部6门考试课程的总分数,步骤如下

(1) 设置【计算器】组件名称,【步骤名称】保留默认值"计算器"

(2) 设置统计字段的参数,对【字段】表参数进行设置

此时完成【计算器】组件参数的设置如下图所示

6.3 预览结果数据

在【计算器】计算器工程中,单击【计算器】组件,再单击工作区上方的"预览这个转换"图标,预览使用计算器后的数据,如下图所示

7.增加序列

序列是按照一定规律次序排好的行列,有特定起始值和增量值,是不断变化的整数值行列,例如"1,2,3,4,…. ",以及"1,2,3,1,2,3,……"等都是序列

数据源

2019年11月月考数学成绩(Kettle数据集3).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88521681?spm=1001.2014.3001.5501需求:由于在"2019年11月月考数学成绩.xls"文件中,存在着重复记录,在去除重复记录后,序号不能连贯按顺序排列,需要使用增加序列组件,生成新序号,以便序号能够顺序排列

(1) 建立【增加序列】转换工程

使用Ctrl+N快捷键,创建【增加序列】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2019年11月月考数学成绩.xls"文件,接着创建【排序记录】组件,并由【Excel输入】组件指向【排序记录】组件,建立节点连接,双击【排序记录】组件,对"学号"字段按照升序进行排序后预览数据

创建【去除重复记录】组件,由【排序记录】组件指向【去除重复记录】组件,建立节点连接,设置去除重复记录参数,去除数据中的重复记录后预览数据

浏览去除重复记录后的数据如下图所示,序号数据不连续了,出现序号数据从"23"跳到"25"、从"29"跳到"31"等的情况

在【增加序列】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【增加序列】组件,并拖曳到右边工作区中,由【去除重复记录】组件指向【增加序列】组件,这时弹出包括【主输出步骤】和【错误处理步骤】选项的选项框,选择【主输出步骤】选项建立节点连接,如下图所示

(2) 设置【增加序列】组件参数

双击【增加序列】组件,弹出创建【增加序列】对话框,如下图所示

【增加序列】组件有关参数说明如下表所示

参数名称说明
步骤名称

表示增加序列组件名称,在单个转换工程中,名称必须唯一

默认值为【增加序列】组件名称

值的名称

表示增加序列的字段名称

默认值为valuename

使用DB来获取sequence表示是否使用DB来获取序列,默认值为空
数据库连接表示数据库的连接名称。默认值为空或当前工程中已经存在的数据库连接名称。也可以单击【编辑】【新建】和【Wizard】按钮编辑数据库连接
模式名称表示数据库模式名称,默认值为空
Sequence 名称表示序列名称,默认值为SEQ_
使用计数器来计算sequence表示是否使用计数器来获取序列,默认值为√
计数器名称(可选)表示计数器的名称,默认值为空
起始值表示序列起始值,默认值为1
增长根据表示序列增加或减少的步长,默认值为1
最大值表示序列的最大值,默认值为999999999

在增加序列】对话框中,使用转换计数器来生成序列,增加一个名称为"新序号"字段,表示是新增加的序列号,步骤如下

(1) 确定【增加序列】组件名称,【增加序列】采用默认值"增加序列"

(2) 设置新系列的名称,设置【值的名称】为"新序号"

(3) 使用转换计数器来生成序列数据

① 【起始值】设置为"1"

② 【增长根据】设置为"1"

③ 【最大值】采用默认值

此时完成【增加序列】组件参数设置如下图所示

(3) 预览结果数据

在【增加序列】转换工程中,单击【增加序列】组件,再单击工作区上方的"预览这个转换"图标,预览增加序列后的数据,如下图所示

8.字段选择

数据文件中有些字段全是数字,如电话号码字段会被系统当成浮点型处理,有些字段在某个场景里用不上,也有个别字段使用了不恰当或错误的名称,对于这些问题,都需要对相对应的字段进行改变类型、去除字段和改变名称等字段处理

数据源

2018年4月月考成绩(Kettle数据集13).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88550080?spm=1001.2014.3001.5501需求:为了统计语文、数学和英语3门基础学科的分数,需要对某年级的"2018年4月月考成绩.xls"文件,使用【字段选择操作】组件,选择语文、数学和英语字段,并且把创建时间改为考试时间

8.1 建立【字段选择】转换工程

使用Ctrl+N快捷键,创建【字段选择】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年4月月考成绩.xls"文件,预览数据,如下图所示,"序号","学号"字段出现小数,有"创建时间"而没有"考试时间"

在【字段选择】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【字段选择】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【字段选择】组件,建立节点连接,如下图所示

8.2 设置【字段选择】组件参数

双击【字段选择】组件,弹出创建【选择/改名值】对话框,如下图所示

【字段选择】组件的参数包含组件的基础参数和【选择和修改】【移除】【元数据】3个选项卡参数 

在组件的基础参数中,【步骤名称】参数表示字段选择组件的名称,在单个转换工程中,名称必须唯一,采用默认值"字段选择"

【选择和修改】选项卡参数

在【选择和修改】选项卡中,使用一个【字段】参数表设置字段参数,有关参数的说明如下表所示

参数名称说明
字段

表示要选择和修改字段,使用一个字段表设置有关字段参数,字段参数如下
① 字段名称:要选择和修改的字段名称,可以单击【获取选择的字段】按钮,获取输入流字段名称,默认值为空
② 改名成:字段改名后的目标名称,如果不希望改名,那么为空,默认值为空
③ 长度:字段的长度,默认值为空
④ 精度:数字类型字段的浮点数的精确位数,默认值为空

包含未指定列,按名称排序是否包含输入流中未在字段表中显式选择的字段

在【选择和修改】选项卡中,对导入的"2018年4月月考成绩.xls"文件中的字段进行选择和修改,步骤如下

(1) 确定选择和修改的字段,单击【获取选择的字段】按钮,获取导入文件的所有字段,添加到【字段】表中

(2) 修改字段名称,"创建时间"字段所在行的【改名成】设置为"考试时间",需要注意的是,输入流"创建时间"字段名称已经被改名为"考试时间",该字段的【长度】【精度】参数暂时不进行设置

【移除】选项卡参数

单击【移除】选项卡,展示【移除的字段】参数表,如下图所示

在【移除的字段】参数表中设置参数,移除不需要的字段

因为只需选择3门基础课程语文、数学和英语的考试分数,所以需要设置参数移除物理、化学和生物3门课程,操作步骤如下

(1) 添加输入流字段,单击【获取移除的字段】按钮,添加输入流的字段名称到【移除的字段】参数表中

(2) 确定要移除的字段,在【移除的字段】参数表中,单击字段名称所在的行号数,右键单击选中的行,单击快捷菜单的【删除选中的行】选项,删除非移除的字段,保留要移除的字段,输入流中"物理","化学","生物"字段将被移除

【元数据】选项卡参数

单击【元数据】选项卡,展示【需要改变元数据的字段】参数表,如下图所示

在【元数据】参数选项卡中,使用【需要改变元数据的字段】参数表设置字段参数,有关参数的说明如下表所示

参数名称说明
字段名称表示需要改变元数据的字段的名称。可以通过【获取改变的字段】或直接使用键盘设置,默认值为空
改名成表示字段改名后的目标名称,如果不希望改名,那么为空,默认值为空
类型

表示字段的数据类型,类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
Binary to Normal?

表示是否将字符串转换为数字数据类型,选项有是、否

默认值为空

格式表示转换时,原始字段格式的可选掩码。有关公共有效日期和数字格式的信息,请参阅有关公共格式参考书。默认值为空
Date Format Lenient?

表示日期格式解析器是否是严格还是宽松的

选项有是、否

设置为"是"时,只接受严格有效的日期值;设置为"否"时,解析器会尝试把错误日期纠正为正确的日期默认值为空

Date Locale

表示日期地区区域。为空时,以系统上默认日期区域编码设置,默认值为空

Date Time Zone表示日期时区。为空时,以系统上默认日期日期编码设置,默认值为空
Lenient number conversion?表示数字转换是否是宽松的。选项有是、否。设置为"是"时,将解析数字,直到找到一个非数字值,如破折号或斜杠,解析然后停止,不报告错误。当设置为"否"时,如果输入的数字无效,解析器将报告错误,默认值为空

Encoding

表示文本文件编码。为空时,以在系统上使用默认编码。从系统上提供的编码列表中选择,默认值为空
分组表示数值分组符号,一般使用","英文逗号,默认值为空
货币符号表示货币符号,例如"¥","$","€"等货币符号,默认值为空

在【需要改变元数据的字段】参数表中,设置需要改变元数据的字段参数,步骤如下

(1) 获取源数据字段,单击【获取改变的字段】按钮,添加输入流的字段到【需要改变元数据的字段】表中

(2) 设置字段的参数

此时完成【字段选择】组件参数的设置,如下图所示

8.3 预览结果数据

在【字段选择】转换工程中,单击【字段选择】组件,再单击工作区上方的"预览这个转换"图标,预览字段选择后的数据,如图所示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1225040.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

4.2 Windows驱动开发:内核中进程线程与模块

内核进程线程和模块是操作系统内核中非常重要的概念。它们是操作系统的核心部分&#xff0c;用于管理系统资源和处理系统请求。在驱动安全开发中&#xff0c;理解内核进程线程和模块的概念对于编写安全的内核驱动程序至关重要。 内核进程是在操作系统内核中运行的程序。每个进…

zyj-ha 安装过程及使用部署

一&#xff0e;安装过程排坑 1. 硬件环境准备 排坑 1 首先&#xff0c;服务器至少需要 2 台&#xff0c;每台服务器至少需要 2 块网卡&#xff0c;并且必须有预留 心跳线网口&#xff0c;不能被其他业务占用&#xff0c;否则容易出现脑裂。 2. 通过配置管理工具导入安装包 …

【南京】最新ChatGPT/GPT4科研技术应用与AI绘图及论文高效写作

2023年我们进入了AI2.0时代。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义&#xff0c;不亚于互联网和个人电脑的问世。360创始人周鸿祎认为未来各行各业如果不能搭上这班车&#xff0c;就有可能被淘汰在这个数字化时代&#xff0c;如何能高效地处理文本、文献查阅、PPT…

大师学SwiftUI第18章Part1 - 图片选择器和相机

如今&#xff0c;个人设备主要用于处理图片、视频和声音&#xff0c;苹果的设备也不例外。SwiftUI可以通过​​Image​​视图显示图片&#xff0c;但需要其它框架的支持来处理图片、在屏幕上展示视频或是播放声音。本章中我们将展示Apple所提供的这类工具。 图片选择器 Swift…

OpenCV入门6——图像基本变换

文章目录 图像的放大与缩小缩放算法放大 图像的翻转图像的旋转仿射变换之图像平移仿射变换之获取变换矩阵仿射变换之变换矩阵之二OpenCV透视变换 图像的放大与缩小 缩放算法 # -*- coding: utf-8 -*- import cv2 import numpy as npimg cv2.imread(E://pic//4.jpg) # (600, 48…

搭建 AI 图像生成器 (SAAS) php laravel

今天来搭一套&#xff0c;AI 图像生成器 是基于 Openai DALLE 2 和 Openai DALLE 3 以及 Stability AI 和稳定扩散 API 构建的脚本&#xff0c;为用户提供了使用简单的提示和大小生成独特自定义图像的可能性。在这个平台上&#xff0c;创意得以快速、高效地实现&#xff0c;借助…

继承语法详解

继承语法详解 一:继承1&#xff1a;什么是继承 二&#xff1a;访问成员变量三&#xff1a;访问成员方法四&#xff1a;访问父类的成员变量和成员方法super关键字super和this关键字的区别 五&#xff1a;子类的构造方法六&#xff1a;代码块七&#xff1a;final关键字八&#xf…

驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接

参考&#xff1a;https://www.cnblogs.com/sam-snow-v/p/15917898.html eclipse链接SQL Server出现问题 笔者使用Open JDK 17&#xff0c;SQL Server 2016&#xff0c;项目中使用JPA操作数据库。测试环境没问题&#xff0c;生产环境出现如题所示“驱动程序无法通过使用安全套接…

[Docker]六.Docker自动部署nodejs以及golang项目

一.自动部署nodejs 1.创建node项目相关文件 app.js代码如下: var express require(express);var appexpress();app.get(/,function(req,res){res.send(首页update); }) app.get(/news,function(req,res){res.send(首页); })//docker做端口映射的时候不要指定ip app.listen(30…

浏览器页面被恶意控制时的解决方法

解决360流氓软件控制浏览器页面 提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、接受360安全卫士的好意&#xff08;尽量不要选&#xff09;二、拒绝360安全卫士的好意&#xff08;强烈推荐&#xff09;第…

unity教程

前言 伴随游戏行业的兴起&#xff0c;unity引擎的使用越来越普遍&#xff0c;本文章主要记录博主本人入门unity的相关记录大部分依赖siki学院进行整理。12 一、认识unity引擎&#xff1f; 1、Unity相关信息&#xff1a; Unity的诞生&#xff1a;https://www.jianshu.com/p/550…

webpack 中,filename 和 chunkFilename 的区别

filename filename 是一个很常见的配置&#xff0c;就是对应于 entry 里面的输入文件&#xff0c;经过webpack打包后输出文件的文件名。比如说经过下面的配置&#xff0c;生成出来的文件名为 index.min.js。 chunkFilename chunkFilename 指未被列在 entry 中&#xff0c;却…

LangChain 2模块化prompt template并用streamlit生成网站 实现给动物取名字

上一节实现了 LangChain 实现给动物取名字&#xff0c; 实际上每次给不同的动物取名字&#xff0c;还得修改源代码&#xff0c;这周就用模块化template来实现。 1. 添加promptTemplate from langchain.llms import OpenAI # 导入Langchain库中的OpenAI模块 from langchain.p…

springboot323基于Java的美妆购物网站的设计与实现

交流学习&#xff1a; 更多项目&#xff1a; 全网最全的Java成品项目列表 https://docs.qq.com/doc/DUXdsVlhIdVlsemdX 演示 项目功能演示&#xff1a; ————————————————

资产设备管理系统

dtAsset 是一个固定资产设备管理系统&#xff0c;它专为中小企业的需求而设计。该软件提供了对常用资产设备进行信息化管理的功能&#xff0c;并支持自定义设备类型、导入导出数据、维护工作统计、采购管理、文档管理、运维监控 (使用 Zabbix)、知识库等功能。 主要模块 1.系统…

【Rust】快速教程——闭包与生命周期

前言 你怎么向天生的瞎子说清颜色&#xff1f;怎么用手势向天生的聋子描述声音&#xff1f; 鲜花就在眼前&#xff0c;雷鸣就在头顶&#xff0c;对他们来说却都毫无意义 眼睛看不到&#xff0c;鼻子可以嗅闻花香&#xff0c;耳朵听不见&#xff0c;手指可以触碰窗纸的震动。 犯…

QtCreator13源码windows编译

1.下载QtCreator13源码: https://download.qt.io/snapshots/qtcreator/13.0/13.0.0-beta1/installer_source/latest/qt-creator-opensource-src-13.0.0-beta1.zip 2.下载并安装llvm Release LLVM 17.0.5 llvm/llvm-project GitHub 3.系统 要求&#xff1a; Windows 10 (64…

2023OceanBase年度发布会后,有感

很荣幸收到了OceanBase邀请&#xff0c;于本周四&#xff08;11月16日&#xff09;参加了OceanBase年度发布会并参加了DBA老友会&#xff0c;按照理论应该我昨天&#xff08;星期五&#xff09;就回到成都了&#xff0c;最迟今天白天就该把文章写出来了&#xff0c;奈何媳妇儿买…

vue2【axios请求】

1&#xff1a;axios作用 axios&#xff08;发音&#xff1a;艾克c奥斯&#xff09;是前端圈最火的&#xff0c;专注于数据请求的库。 Axios 是一个基于 promise 的 HTTP 库&#xff0c;可以用在浏览器和 node.js 中axios的github:https://github.com/axios/axios 中文官网地址…

ESP32网络开发实例-非接触式水位监测

非接触式水位监测 文章目录 非接触式水位监测1、HC-SR04介绍2、软件准备3、硬件准备4、代码实现在本文中,我们将使用 HC-SR04 超声波传感器和 ESP32 创建一个水位监测网络服务器。 这将是一个非接触式水位测量系统。 首先,我们将介绍HC-SR04 与 ESP32 连接。 使用ESP32对超声…