kettle使用--1.mysql多表关联导入mongoDB

news2024/10/6 22:31:17

文章目录

  • 1. 初步体验:csv 转为excel
  • Kettle概念
  • 配置mysql链接
  • mysql 一对多关联查询结果保存到mongodb中

1. 初步体验:csv 转为excel

Windows环境下安装pdi-ce-8.0.0.0-28.zip ,解压后执行lib下的Spoon.bat

在这里插入图片描述
在这里插入图片描述
将csv输入拖入
双击拖进去的csv,浏览选择csv文件,其他配置默认
在这里插入图片描述
点击获取字段,然后再点击预览

同理将excel输出拖入到工作区
在这里插入图片描述
然后按下shift + 点击csv文件,并拖向Excel输出
在这里插入图片描述
按下ctrl+s,将代码保存到某个位置
然后双击Excel输出,设置输出位置
在这里插入图片描述
点击字段,点击获取字段,点击最小宽度,确认,然后点击执行按钮
在这里插入图片描述
文件即可导出成功

Kettle概念

Kettle is Visual Programming Language ,简称VPL , 图形化编程语言

对于kettle的转换,不能定义为一个执行顺序,因为所有的方式都以并发的方式执行,当转换启动后,所有的步骤都同时启动;
如果需要按照一定的顺序执行,需要用到Job,作业Job就是一个串行的调度工具

配置mysql链接

将mysql驱动拷贝到lib下,配置mysql数据源的时候要注意设置useSSL为false
在这里插入图片描述

mysql 一对多关联查询结果保存到mongodb中

在这里插入图片描述
先看下职员信息表
在这里插入图片描述

资质信息
在这里插入图片描述

工作经验信息
在这里插入图片描述

设计将职员信息的uuid为_id主键,维护到mongodb中,而职员有多个资质,工作经验信息,资质和经验均以json数组的形式保存在职员对象中

例如

{
  _id: '8160158147989553152',
  staff_code: '0000111000',
  itcode: 'KWLB002',
  LEVEL: '02',
  staff_name: 'lucy',
  gender: 1,
  birth_date: '20211208',
  staff_category_code: '01',
  department_code: '03',
  place_code: '00',
  judicial_entity_code: '0048',
  fl_place_code: '01',
  begin_work_time_1: '20211201',
  enter_company_time_1: '20211202',
  highest_education_code_1: '01',
  import_stamp: '1639745876804',
  certificate: [
    {
      name: '毕业证',
      type: '03',
      valid: '1'
    },
    {
      name: '毕业证',
      type: '04',
      valid: '1'
    }
  ],
  experience: [
    {
      name: '微创ESS服务项目',
      beginTime: '200701',
      endTime: '200712'
    },
    {
      name: '中储棉市场监测系统系统集成服务',
      beginTime: '200801',
      endTime: '200812'
    },
  
    {
      name: '体育局运维服务二期',
      beginTime: '201001',
      endTime: '201012'
    },
    {
      name: '项目18',
      beginTime: '202001',
      endTime: '202012'
    },
    {
      name: '项目14',
      beginTime: '202101',
      endTime: '202112'
    }
  ]
}

职员基本信息输入

SELECT
	uuid AS _id,
	staff_code,
	itcode,
	LEVEL,
	staff_name,
	gender,
	birth_date,
	staff_category_code,
	post_code,
	department_code,
	place_code,
	judicial_entity_code,
	fl_place_code,
	major_name,
	work_years,
	office_years,
	begin_work_time_1,
	enter_company_time_1,
	highest_education_code_1,
	graduated_school_1,
	import_stamp 

FROM bid_manager.b_staff_baseinfo

职员资质信息输入

SELECT    staff_uuid as _id,   CONCAT("[",GROUP_CONCAT(   '{',   '"name":"'   ,certificate_name       ,'"'   ,',',   '"type":"' ,type     ,'"'   ,',',   '"valid":"',is_forever_valid    ,'"'   ,'}'   ),"]") AS certificate  FROM   b_staff_certificate_info  GROUP BY staff_uuid ;

职员工作经验输入

select staff_uuid as _id ,CONCAT("[",GROUP_CONCAT(   '{',   '"name":"'   ,project_name       ,'"'   ,',',   '"beginTime":"' ,begin_time     ,'"'   ,',',   '"endTime":"',end_time    ,'"'   ,'}'   ),"]") AS experience from b_staff_work_experience_info GROUP BY staff_uuid ;

在这里插入图片描述
在这里插入图片描述

mongoDB的设置为
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/366153.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无聊小知识02.Junit4Junit5对比

Junit是Java编程语言的单元测试框架&#xff0c;用来编写单元测试代码。随着Junit5的盛行&#xff0c;与Junit4有何差异。JDK支持Junit4需要Java5版本Junit5需要Java8版本Maven依赖Junit4不区分模块&#xff0c;只有一个jar&#xff1a;<dependency><groupId>junit…

【Linux】工具(1)——yum

好久不见&#xff0c;让大家久等啦~最近开学被一系列琐事所耽误了&#xff0c;接下来会进入稳定更新状态~话不多说&#xff0c;在我们了解Linux基本内容之后&#xff0c;我们的目的是要在Linux环境下进行软硬件开发&#xff0c;在这个过程中我们会用到一系列工具&#xff0c;例…

知识蒸馏论文阅读:LD算法笔记

标题&#xff1a;Localization Distillation for Dense Object Detection 会议&#xff1a;CVPR2022 论文地址&#xff1a;https://ieeexplore.ieee.org/document/9878414/ 官方代码&#xff1a;https://github.com/HikariTJU/LD 作者单位&#xff1a;南开大学、天津大学、哈尔…

uniapp本地存储

uniapp本地存储 vue的本地存储方式, 小程序在浏览器测试时也可以实现, 但是在真机运行时不能实现 一. 存储 1.uni.setStorage(OBJECT) 将数据存储在本地缓存中指定的key中, 会覆盖掉原来该key对应的内容, 这是一个异步接口 OBJECT参数示例 uni.setStorage({key:"token&qu…

王子与骑士-第14届蓝桥杯STEMA测评Scratch真题精选

[导读]&#xff1a;超平老师的《Scratch蓝桥杯真题解析100讲》已经全部完成&#xff0c;后续会不定期解读蓝桥杯真题&#xff0c;这是Scratch蓝桥杯真题解析第101讲。 蓝桥杯选拔赛现已更名为STEMA&#xff0c;即STEM 能力测试&#xff0c;是蓝桥杯大赛组委会与美国普林斯顿多…

使用Navicat进行SSH加密方式连接MySQL数据库

前言近年来网络安全形式日趋严峻&#xff0c;为保障企业信息安全和业务连续性&#xff0c;越来越多的要求业务系统上线前需要满足等保要求。其中数据库作为存储数据的载体&#xff0c;安全更是重中之重。部分等保要求&#xff0c;mysql数据库不能通过直连方式连接&#xff0c;需…

炔基点击交联试剂1704097-05-1,Alkyne-A-DSBSO crosslinker,发生相应点击反应

1、理论分析&#xff1a;中文名&#xff1a;炔基-A-DSBSO crosslinker&#xff0c;英文名&#xff1a;Alkyne-A-DSBSO crosslinkerCAS号&#xff1a;1704097-05-1化学式&#xff1a;C25H32N2O12S2分子量&#xff1a;616.652、产品详情&#xff1a;外观&#xff1a;白色固体&…

动漫培训学校排行榜(最新)

哪家动漫培训学校比较好&#xff1f;价格也是关键&#xff01;价格是一个企业盈利标准&#xff0c;有人认为便宜没好货&#xff0c;在目前这个竞争那么激烈的是时代&#xff0c;这个观点是非常有问题的。 一&#xff1a;学动漫的线上平台推荐 1、轻微课&#xff1a;轻微课是国…

ChatGPT是什么?为何会引爆国内算力需求?

过去十年中&#xff0c;通过“深度学习大算力”从而获得训练模型是实现人工智能的主流技术途径。由于深度学习、数据和算力这三个要素都已具备&#xff0c;全世界掀起了“大炼模型”的热潮&#xff0c;也催生了大批人工智能企业。大模型是人工智能的发展趋势和未来大模型&#…

Redis主从复制过程

将目前服务器加入到端口号为6379的从服务器 一主二仆 当期中一台从服务器宕机之后 从服务器重启之后会变成单独的主服务器&#xff0c;与之前的主从复制没有关系&#xff0c;重新使用slaceof命令才能恢复到之前一样 主服务器宕机后&#xff0c;从服务器不会成为主服务器&…

shell的测试语句

一、shell的条件测试语句 在写shell脚本时&#xff0c;经常遇到的问题就是判断字符串是否相等&#xff0c;可能还要检查文件状态或进 行数字测试&#xff0c;只有这些测试完成才能做下一步动作。 1.1、shell脚本中的条件测试如下&#xff1a; 1、文件测试 2、字符串测试 3、数…

SPI实验

目录 一、SPI 简介 二、硬件原理 ECSPI3_SCLK ECSPI3_MISO和ECSPI3_MOSI ECSPI3_SS0 三、I.MX6U ECSPI 简介 ECSPIx_RXDATA ECSPIx_TXDATA ECSPIx_CONREG ECSPIx_CONFIGREG ECSPIx_PERIODREG​编辑 ECSPIx_STATREG 四、ICM-20608 简介 五、代码编写 1、创建文件及文…

BACnet协议详解——应用层说明二

文章目录写在前面3 BACnet APDU的传输3.1 需确认的请求报文传输3.2 分段的需确认请求报文的传输3.3 分段的复杂确认报文的传输3.4 分段确认APDU的传输3.5 重复的APDU和报文分段3.5.1 客户端事务处理状态机的中止3.5.2 服务端事务处理状态机的中止3.5.3 重复报文的处理3.6 失效资…

使用ChatGPT需要避免的8个错误

如果ChatGPT是未来世界为每个登上新大陆人发放的一把AK47&#xff0c; 那么现在大多数人做的事&#xff0c;就是突突突一阵扫射&#xff0c; 不管也不知道有没有扫射到自己想要的目标。每个人都在使用 ChatGPT。但几乎每个人都停留在新手模式。 避免下面常见的8个ChatGPT的错…

基于Tkinter制作定时器,提醒做某事

基于Tkinter制作定时器 文章目录基于Tkinter制作定时器一、前言二、需要的模块三、tkinter最简单的使用四、无边框tkinter窗口的创建五、时间的获取六、完整代码七、演示效果一、前言 对于喜欢用电脑的人来说&#xff0c; 一旦往那里一坐&#xff0c;就很容易忘记时间&#x…

安全相对论 | 45亿条快递数据疑似遭泄露,他们这样说……

近期&#xff0c;Telegram各大频道突然大面积转发某隐私查询机器人链接&#xff0c;网传消息称该机器人泄露了国内45亿条个人信息&#xff0c;疑似电商或快递物流行业数据。随着舆论的发酵&#xff0c;快递股出现闪崩&#xff0c;多家快递公司股价下降。事件发生后&#xff0c;…

双碳”目标下二氧化碳地质封存技术应用前景及模型构建实践方法

2022年七月七日&#xff0c;工业和信息化部、发展改革委、生态环境部关于印发工业领域碳达峰实施方案的通知落地。全国各省份积极响应&#xff0c;纷纷出台地方指导文件&#xff0c;标志着我国碳减排事业的全面铺开。二氧化碳地质封存技术作为实现我国“双碳”目标的重要一环&a…

解决线程不安全问题的方法

解决线程不安全问题&#xff1a; 一、原子性 synchronized关键字的特性&#xff08;监视锁&#xff09; 1、synchronized的互斥性 通过特殊手段&#xff0c;让count变成原子操作 举例&#xff1a;上厕所&#xff0c;人进入后上锁&#xff0c;用完了出来解锁&#xff0c;期…

编译原理【运行时环境】—什么是活动记录、 活动记录与汇编代码的关系

系列文章戳这里&#x1f447; 什么是上下文无关文法、最左推导和最右推导如何判断二义文法及消除文法二义性何时需要消除左递归什么是句柄、什么是自上而下、自下而上分析什么是LL(1)、LR(0)、LR(1)文法、LR分析表LR(0)、SLR(1)、LR(1)、LALR(1)文法之间的关系编译原理第三章习…

专利撰写 为什么要申请专利 申请专利对个人有什么利益关系 专利申请实例 如何申请专利 专利申请办理流程

专利撰写 专利是对发明者或创造者所创造的发明或设计提供一定期限的独占权的法律保护。撰写专利需要考虑到多方面的因素&#xff0c;包括发明或设计的技术性、可行性、独创性、保密性等等。以下是一些关于专利撰写的常见问题和注意事项&#xff1a;专利类型&#xff1a;专利包括…