kettle工具连接elasticsearch 7并导入MySQL表数据-简述

news2024/11/19 0:38:13

一、简述
工作中需要利用kettle开源ETL工具将MySQL数据库中表数据同步到elasticsearch集群中。为此特记录一下操作方式,留作记录和学习。

二、环境
kettle工具:kettle 9.2
elasticsearch集群:7.11.1
集群配置信息:
集群名称:my-application
集群节点:192.168.172.200(node-1)、192.168.172.201(node-2)、192.168.172.202(node-3)
集群用户:elastic/admin#110
数据库:MySQL 8.0.29
数据表:t_kdxx
三、配置同步工程
1、更新kettle中elasticsearch的插件。
(1)下载相关插件:
链接:https://pan.baidu.com/s/1QuuetvBC1y2dT0KTgXlTyQ
提取码:2ny3

找到kettle安装目录下es插件的安装位置:D:\data-integration9.0\plugins\elasticsearch-bulk-insert-plugin。如下图所示,将插件下的文件全部删除或拷贝其他位置。
请添加图片描述
(2)将下载后的插件包elasticsearch-bulk-insert-plugin.zip解压,并将解压后文件复制到es插件安装目录下。
在这里插入图片描述
(3)替换完成后重启kettle即可完成插件更新。

2.创建kettle转换。
本次以全量同步为目的,只需要kettle中两个组件:表输入、Elasticsearch bulk insert。
如下图:
在这里插入图片描述
表输入连接MySQL没有特别需要配置的,不做介绍,主要介绍一下连接es的配置组件:
Elasticsearch bulk insert
(1)打开组件,首先是一般配置:
请添加图片描述
一般配置分为index和options两部分。
index: 需要填写es索引名称和索引类型type。索引必须提前在es中创建好,如果再等 “ Serves ” 和 “ Settings ”配置完后点击“Test Index”,连接成功通过会弹出提示框 “Index found ({0} shards)”。表示es配置成功。

Option:
Batch Size —— 批量提交的大小;
Batch Timeout —— 超时时间;
ID Field —— 作为es中文档记录id的字段。注意:作为id的字段需要特别指定,单独取表主键列作为id更新,而且不能跟正常使用的字段读取数据。
OverWrite if exists —— 复写已存在的记录;

(2)Servers配置
请添加图片描述
填写es集群的三个节点的地址和端口号。可以用tcp协议端口的9200.

(3)Fileds 配置
请添加图片描述
如果不需要更改字段,则直接可以获取字段。

(4)Settings配置
请添加图片描述
输入es集群的集群名称,如果设置密码了需要配置用户和密码。
集群名称参数 —— cluster_name my-application
用户验证参数(用户和密码用冒号隔开) —— xpack.security.user elastic:admin#110

配置完成即可进行数据同步至es集群环境中。单实例es也可以参照进行配置。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/157320.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux-终端命令行

终端(Terminal)命令行仅仅是一个工具,对于命令有许多,而且随着嵌入式领域不断开发,命令会越来越多,我们只需要去了解常用的即可。 对于创建或删除一个文件夹,清理终端,下载文件等等都可以在终端命令行输入…

Nginx 进阶篇

文章目录Nginx 进阶篇五、 服务配置1、 配置成系统服务2、 配置环境变量六、 部署静态资源1、 概述2、 配置指令2.1 listen2.2 server_name2.3 location2.4 root2.5 alias2.6 index2.7 error_page3、 静态资源优化配置语法4、 静态资源压缩模块4.1 Gzip 模块配置指令4.2 配置实…

《Linux运维实战:Centos7.6基于ansible一键离线部署redis6.2.8容器版之哨兵集群》

一、部署背景 由于业务系统的特殊性,我们需要针对不同的客户环境部署redis 哨兵集群,由于大都数用户都是专网环境,无法使用外网,为了更便捷,高效的部署,针对业务系统的特性,我这边编写了基于ans…

唤醒手腕 Go 语言开发学习笔记(基本简介、环境安装)

1. Go语言简介 Go(又称 Golang)是 Google 的 Robert Griesemer,Rob Pike 及 Ken Thompson 开发的一种静态强类型、编译型语言。Go 语言语法与 C 相近,但功能上有:内存安全,GC(垃圾回收&#xf…

Java中String类的常见问题

目录 Q1:为什么String类要定义成不可变类型? 方便String对象缓存HashCode值 字符串常量池的需要 衍生问题:String str new String("hello world") 创建了几个对象? 为了保障程序的安全性 Q2:String的…

2022年深度学习在时间序列预测和分类中的研究进展综述

时间序列预测的transformers的衰落和时间序列嵌入方法的兴起,还有异常检测、分类也取得了进步 2022年整个领域在几个不同的方面取得了进展,本文将尝试介绍一些在过去一年左右的时间里出现的更有前景和关键的论文,以及Flow Forecast [FF]预测…

解决Windows莫名其妙地从休眠状态唤醒的问题

因为经常写代码开很多个工作区,电脑经常就是合盖休眠,这样打开就能用,但是总是在我不经意的时候发现电脑风扇在狂转,不知道是哪个应用又在qj我的电源管理计划,今天午休发现电脑风扇狂转,打开发现是windows系…

c语言操作符(下)

前言 🎈个人主页:🎈 :✨✨✨初阶牛✨✨✨ 🐻推荐专栏: 🍔🍟🌯 c语言初阶 🔑个人信条: 🌵知行合一 🍉本篇简介:>: 讲解c语言中有关操作符的知识. 金句分享: ✨✨✨行程…

我用python写了个小病毒,老板再也不敢扣我工资啦

名字:阿玥的小东东 学习:python正在学习c 主页:阿玥的小东东 今天做个什么呢,我的好朋友提议做一个关机的代码吧,我这一想,对吼,我以前还做过一个关机代码呢,于是乎,今天…

时序收敛技巧之寄存器复制

1、何时需要复制寄存器? 在设计中的关键路径发现某个寄存器具有高扇出和高延迟时,使用寄存器复制是个不错的实现时序收敛的方法。下图是一个典型的例子: 可以看出,第一个寄存器的 IC(InterConnect) 延迟为 1.476ns,该寄…

seo站内优化的方法有哪些(站内优化和站外优化)

站内部优化什么意思 网站优化公司的内部优化意味着什么?网站内部优化,就是网站关键词优化、内容优化、内链优化等等,网站要有一定的排名和流量,要做到内部优化,要做到最快,最快的优化排名?接下…

「认知」打工人的自我修养

都说认知以外的钱难搞,那认知内的呢? 01互联网内卷年代,作为不着调的普通选手; 在诸多花里胡哨的黑话中,个人最待见的就是"认知"这个词; 认知,有强烈的抽象感; 想要深刻…

Mr. Cappuccino的第37杯咖啡——Kubernetes资源管理

Kubernetes资源管理kubectl常用的命令陈述式管理方法1. 创建一个namespace2. 查询所有namespace3. 在namespace下运行一个pod4. 查询指定namespace下的pod5. 查看指定pod的详细信息6. 删除pod7. 删除namespace声明式管理方法命令式对象配置1. 创建yaml文件2. 基于yaml文件创建资…

【JavaEE】多线程(初阶)

目录 Thread 线程的创建 线程的常见属性 中断线程 等待线程 休眠线程 线程的状态 多线程相比于单线程的优势 Thread 在Java中操作多线程,最常用的类就是Thread。 Thread 类是 JVM 用来管理线程的一个类,换句话说,每个线程都有一个唯一…

一网打尽带环链表问题(手把着手带你理解,木有基础也能看懂!)

目录 0.前言 1.认识带环链表 2.带环链表OJ问题简述 3.判断是否为带环链表 4. 寻找入环节点(法一:数学推理的魅力) 5. 寻找入环节点(暴力拆解带环链表的魄力) 6.番外:判断是否为带环链表(fast和slow的…

树上的DP

ACACAC来的如此之快,让我以为还要再调试几个点(h),本文涉及思路参考:参考文章 嗯,这个题和思路让我对跨父节点的树上链有了一个认识,我们来看一下: 如果说,我们要对这样的一条链进行dpdpdp操作&#xff0c…

[GXYCTF2019]BabysqliV3.0

发现我们随便上传一个以后返回的是 alert(Wrong pass); 密码错误 如果上传一个账号永真的话返回 Not this user! 没有这个用户,所以感觉可以使用盲注,对账号进行盲注 可是题目 ascii(substr((select database()),1,1))>1 也不对 最后才知道是…

电脑组装配件知识

目录 1.电脑硬件基础知识 1.1CPU 1.2内存 ​编辑 1.3硬盘 1.4主板 1.5显卡 ​编辑 1.6显示器 1.7电源 1.8机箱 2.电脑硬件搭配及选购 2.1硬件搭配原则 2.2怎样查询软件或游戏配置 2.3配件购买注意事项 2.4搭配一台普通办公电脑 3.电脑组装 1.电脑硬件基础知识 …

软件测试/测试开发 | 一文学会 Appium 环境配置

Appium 是一个开源的、跨平台的测试框架,可以用来测试 Native App、混合应用、移动 Web 应用(H5 应用)等,也是当下互联网企业实现移动自动化测试的重要工具。Appium 坚持的测试理念: •无需用户对 App 进行任何修改或…

OAuth2.0 开放平台认证授权开发套件 Authmore-Framework 1.0 发布

简介 | Intro 基于 OAuth2.0 协议的开放平台认证授权开发套件, 包含授权服务和开放平台 Docker 镜像,基于 Spring Boot Starter 的资源服务工具包和客户端(第三方应用)工具包 优点 | Advantages 简洁:专注核心功能 —— 社会化…