【MySQL】开启 canal同步MySQL增量数据到ES

news2024/12/24 20:52:04

开启 canal同步MySQL增量数据到ES

canal 是阿里知名的开源项目,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费。示使用 canal 将 MySQL 增量数据同步到ES。
在这里插入图片描述

一、集群模式

在这里插入图片描述

图中 server 对应一个 canal 运行实例 ,对应一个 JVM 。

server 中包含 1…n 个 instance , 我们可以将 instance 理解为配置任务。

instance 包含如下模块 :

eventParser:数据源接入,模拟 slave 协议和 master 进行交互,协议解析。

eventSink:Parser 和 Store 链接器,进行数据过滤,加工,分发的工作。

eventStore:数据存储。

metaManager:增量订阅 & 消费信息管理器。

真实场景中,canal 高可用依赖 zookeeper ,笔者将客户端模式可以简单划分为:TCP 模式 和 MQ 模式 。

实战中我们经常会使用 MQ 模式 。因为 MQ 模式的优势在于解耦 ,canal server 将数据变更信息发送到消息队列 kafka 或者 RocketMQ ,消费者消费消息,顺序执行相关逻辑即可。

顺序消费:

对于指定的一个 Topic ,所有消息根据 Sharding Key 进行区块分区,同一个分区内的消息按照严格的先进先出(FIFO)原则进行发布和消费。同一分区内的消息保证顺序,不同分区之间的消息顺序不做要求。
在这里插入图片描述

二、MySQL配置

1、对于自建 MySQL , 需要先开启 Binlog 写入功能,配置 binlog-format 为 ROW 模式,my.cnf 中配置如下:

[mysqld]
log-bin=mysql-bin # 开启 binlog
binlog-format=ROW # 选择 ROW 模式
server_id=1 # 配置 MySQL replaction 需要定义,不要和 canal 的 slaveId 重复

注意:针对阿里云 RDS for MySQL , 默认打开了 binlog , 并且账号默认具有 binlog dump 权限 , 不需要任何权限或者 binlog 设置,可以直接跳过这一步。

2、授权 canal 链接 MySQL 账号具有作为 MySQL slave 的权限, 如果已有账户可直接 grant :

CREATE USER canal IDENTIFIED BY ‘canal’;
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON . TO ‘canal’@‘%’;
– GRANT ALL PRIVILEGES ON . TO ‘canal’@‘%’ ;
FLUSH PRIVILEGES;

3、创建数据库商品表 t_product :

CREATE TABLE t_product (
id BIGINT ( 20 ) NOT NULL AUTO_INCREMENT,
name VARCHAR ( 255 ) COLLATE utf8mb4_bin NOT NULL,
price DECIMAL ( 10, 2 ) NOT NULL,
status TINYINT ( 4 ) NOT NULL,
create_time datetime NOT NULL,
update_time datetime NOT NULL,
PRIMARY KEY ( id )
) ENGINE = INNODB DEFAULT CHARSET = utf8mb4 COLLATE = utf8mb4_bin

三、Elasticsearch配置

使用 Kibana 创建商品索引 。

PUT /t_product
{
“settings”: {
“number_of_shards”: 2,
“number_of_replicas”: 1
},
“mappings”: {
“properties”: {
“id”: {
“type”:“keyword”
},
“name”: {
“type”:“text”
},
“price”: {
“type”:“double”
},
“status”: {
“type”:“integer”
},
“createTime”: {
“type”: “date”,
“format”: “yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis”
},
“updateTime”: {
“type”: “date”,
“format”: “yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis”
}
}
}
}

执行完成,如图所示 :

在这里插入图片描述

四、RocketMQ 配置

创建主题:product-syn-topic ,canal 会将 Binlog 的变化数据发送到该主题。
在这里插入图片描述
在这里插入图片描述

五、canal 配置

我们选取 canal 版本 1.1.6 ,进入 conf 目录。

1、配置 canal.properties

#集群模式 zk地址
canal.zkServers = localhost:2181
#本质是MQ模式和tcp模式 tcp, kafka, rocketMQ, rabbitMQ, pulsarMQ
canal.serverMode = rocketMQ
#instance 列表
canal.destinations = product-syn
#conf root dir
canal.conf.dir = …/conf
#全局的spring配置方式的组件文件 生产环境,集群化部署
canal.instance.global.spring.xml = classpath:spring/default-instance.xml

######以下部分是默认值 展示出来
#Canal的batch size, 默认50K, 由于kafka最大消息体限制请勿超过1M(900K以下)
canal.mq.canalBatchSize = 50
#Canal get数据的超时时间, 单位: 毫秒, 空为不限超时
canal.mq.canalGetTimeout = 100
#是否为 flat json格式对象
canal.mq.flatMessage = true

2、instance 配置文件

在 conf 目录下创建实例目录 product-syn , 在 product-syn 目录创建配置文件 :instance.properties。

#按需修改成自己的数据库信息
#################################################

canal.instance.master.address=192.168.1.20:3306
#username/password,数据库的用户名和密码

canal.instance.dbUsername = canal
canal.instance.dbPassword = canal

#table regex
canal.instance.filter.regex=mytest.t_product

#mq config
canal.mq.topic=product-syn-topic
#针对库名或者表名发送动态topic
#canal.mq.dynamicTopic=mytest,.,mytest.user,mytest\…,.\…
canal.mq.partition=0
#hash partition config
#canal.mq.partitionsNum=3
#库名.表名: 唯一主键,多个表之间用逗号分隔
#canal.mq.partitionHash=mytest.person:id,mytest.role:id
#################################################

3、服务启动

启动两个 canal 服务,我们从 zookeeper gui 中查看服务运行情况 。

在这里插入图片描述

修改一条 t_product 表记录,可以从 RocketMQ 控制台中观测到新的消息。
在这里插入图片描述

六、消费者

1、产品索引操作服务
在这里插入图片描述

2、消费监听器

在这里插入图片描述

消费者逻辑重点有两点:

顺序消费监听器

将消息数据转换成 JSON 字符串,从 data 节点中获取表最新数据(批量操作可能是多条)。然后根据操作类型 UPDATE、 INSERT、DELETE 执行产品索引操作服务的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1043562.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++刷题 全排列问题

C刷题 全排列问题 题目描述思路讲解代码展示 题目描述 思路讲解 代码展示 #include <iostream>using namespace std;const int maxn 11;//P为当前排列&#xff0c;hashTable记录整数x是否已经在P中 int n, P[maxn], hashTable[maxn] {false};//当前处理排列的第index号…

Mysql高级——数据库设计规范(2)

8. ER模型 ER 模型中有三个要素&#xff0c;分别是实体、属性和关系。 实体&#xff0c;可以看做是数据对象&#xff0c;往往对应于现实生活中的真实存在的个体。在 ER 模型中&#xff0c;用矩形来表示。实体分为两类&#xff0c;分别是强实体和弱实体。强实体是指不依赖于其…

ElementUI动态树,数据表格以及分页的实现

目录 前言 一. ElementUI动态树 二. 数据表格和分页 三. 后端代码 service层 controller层 前言 在上一篇博客中实现了左侧菜单栏&#xff0c;在此基础上将它变为动态的&#xff0c;即动态的展示数据库的数据。还有数据表格的实现以及分页。&#xff08;纯代码分享&#…

Opengl之基础光照

现实世界的光照是极其复杂的&#xff0c;而且会受到诸多因素的影响&#xff0c;这是我们有限的计算能力所无法模拟的。因此OpenGL的光照使用的是简化的模型&#xff0c;对现实的情况进行近似&#xff0c;这样处理起来会更容易一些&#xff0c;而且看起来也差不多一样。这些光照…

【DenseNet模型】

【DenseNet模型】 1 DenseNet结构2 DenseNet特征图保持一致方法3 模型预览方法 1 DenseNet结构 参考链接&#xff1a;https://arxiv.org/pdf/1608.06993.pdf DenseNet通过密集连接&#xff0c;可以缓解梯度消失问题&#xff0c;加强特征传播&#xff0c;鼓励特征复用&#xff0…

逻辑像素与物理像素引发学习型探索

文章目录 目的关于像素从像素到分辨率DP(设备像素&#xff09;- 物理像素DIP(逻辑像素&#xff09;- 设备独立像素CSS 像素屏幕特性 DRP&#xff08;设备像素比&#xff09;PPI(Pixels Per Inch ) - 像素密度屏幕像素密度PPI 目的 做一个前端或或者产品开发者&#xff0c; 在涉…

Simulink 封装

快捷键&#xff1a; Edit Mask&#xff1a;CtrlM Look Under Mask&#xff1a;CtrlU 封装之后的模型&#xff1a; Edit Mask界面&#xff1a; 双击模块后的提示界面&#xff1a; 封装的模块内部&#xff1a;

防火墙两台设备对接,隧道成功建立后,总部子网pc不能ping通分部子网,怎么排查解决?

环境: 总部 深信服防火墙 8.0.75 AF-2000-FH2130B-SC 分部 深信服防火墙 8.0.75 AF-2000-FH2130B-SC 问题描述: 防火墙两台设备对接,隧道成功建立后,总部子网pc不能ping通分部子网,怎么排查解决?分部子网可以ping通总部子网。 两台防火墙之前是做热备的,配置一样,…

C语言编程题目及答案分享——持续更新

1.输入一个球的半径&#xff0c;计算这个球的表面积和体积&#xff0c;输出计算结果 #include<stdio.h> const float PI3.1415926; float mianji(float r){float s;s 4*PI*r*r;return s; } float tiji(float r){float s;s 4*PI*r*r*r/3;return s; }int main(){float r…

ARINC825规范简介

ARINC825规范简介 机载CAN网络通用标准 ARINC825规范全称为机载CAN网络通用标准&#xff08;The General Standardization of CAN for Airborne Use&#xff09;。顾名思义&#xff0c;ARINC825规范是建立在CAN物理网络基础上的高层规范。CAN网络使用共享的双绞电缆传输数据&…

如何套用模板制作大屏?

在山海鲸可视化的资源中心里内置了大量的二维、三维大屏模板&#xff0c;大家可以根据需要找到自己想要的模板&#xff0c;然后点击下载直接进行使用。 有需要可自行前往哔哩哔哩账号中观看相关内容的视频教程↓↓↓ 山海鲸可视化的个人空间-山海鲸可视化个人主页-哔哩哔哩视频…

Web自动化测试 —— 关键数据记录

记录关键数据的作用 内容作用日志1、记录代码执行情况&#xff0c;方便复现场景&#xff0c;也可以作为bug依据截图1、断言失败或成功的截图&#xff1b;2、异常截图达到丰富报告的作用&#xff1b;3、可以作为bug依据page source1、协作排查报错时元素是否存在 一、行为日志记…

UI自动化测试单例实现报错:AttributeError: ‘NoneType‘ object has no attribute ‘get_driver‘

UI自动化测试单例实现报错&#xff1a;AttributeError: ‘NoneType’ object has no attribute ‘get_driver’ from selenium import webdriverfrom configs.env import Envclass Singleton1(object):_instance Nonedef __new__(cls, *args, **kwargs):print(判断hasattr现在…

容器技术所涉及Linux内核关键技术

目录 一、容器技术前世今生 1.1 1979年 — chroot 1.2 2000年 — FreeBSD Jails 1.3 2001年 — Linux VServer 1.4 2004年 — Solaris容器 1.5 2005年 — OpenVZ 1.6 2006年 — Process容器 1.7 2007年 — Control Groups 1.8 2008年 — LXC 1.9 2011年 — Warden 1…

进程的内存映像

组成部分 代码段&#xff1a;即程序的二进制代码&#xff0c;只读&#xff0c;可被多个进程共享数据段&#xff1a;包括全局变量和静态变量进程控制块PCB&#xff1a;在系统区&#xff08;内核区&#xff09;&#xff0c;操作系统通过PCB来控制和管理进程堆&#xff1a;用来存放…

后端开放从小白到大佬之Linux的命令(一):nohup,详解底层!!!

文章目录 nohupnohup命令初识nohup命令语法nohup的原理如何查看nohup的进程ps | greppgrepjobspu -ux 如何关闭进程killpkill 结尾 nohup nohup命令初识 在 Linux 中&#xff0c;nohup 命令 用于在后台运行命令&#xff0c;并将其输出重定向到一个文件中&#xff0c;即使退出…

一文教你学会ArcGIS Pro地图设计与制图系列全流程(2)

ArcGIS Pro做的成果图及系列文章目录&#xff1a; 系列文章全集&#xff1a; 《一文教你学会ArcGIS Pro地图设计与制图系列全流程&#xff08;1&#xff09;》《一文教你学会ArcGIS Pro地图设计与制图系列全流程&#xff08;2&#xff09;》《一文教你学会ArcGIS Pro地图设计与…

PHP 图书资料管理系统mysql数据库web结构apache计算机软件工程网页wamp

一、源码特点 PHP 图书资料管理系统是一套完善的web设计系统&#xff0c;对理解php编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。 PHP 图书资料管理系统mysql数据库web结构apach 代码 https://download.csdn.net/down…

pip install open-interpreter报错,无法安装

标题pip install open-interpreter报错&#xff0c;无法安装 ERROR: Could not find a version that satisfies the requirement open-interpreter (from versions: none) ERROR: No matching distribution found for open-interpreter 另外发现自己换了很多国内镜像源&#x…

提升推广效果的秘密武器,快速学会电子传单制作

随着科技的发展&#xff0c;电子传单成为了企业宣传的重要工具之一。相比传统纸质传单&#xff0c;电子传单更加灵活、便捷&#xff0c;并且能够通过网络快速传播。想要制作一份精美的电子传单&#xff0c;我们可以利用一些专业的H5制作平台/工具&#xff0c;下面就来介绍一下具…