datax mysql同步数据到clickhouse配置文件样例及说明

news2024/9/23 13:29:02

datax mysql同步数据到clickhouse配置文件样例及说明

{
    "job": {
        "content": [
            {
                "reader": {
                    "parameter": {
                        "password": "atm_push",
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://xxxx:3306/xxxx?useUnicode=true&characterEncoding=UTF-8&allowMultiQueries=true"
                                ],
                                "querySql": [
                                    "select id ,ds ,name ,age from user limit 10"
                                ]
                            }
                        ],
                        "writeMode": "update",
                        "username": "atm_push"
                    },
                    "name": "mysqlreader"
                },
                "writer": {
                    "name": "clickhousewriter",
                    "parameter": {
                        "username": "default",
                        "password": "xxxx",
                        "column": ["id", "ds", "name", "age"],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:clickhouse://xxxxx:8123/default",
                                "table": ["user"]
                            }
                        ],
                        "preSql": [],
                        "postSql": [],

                        "batchSize": 65536,
                        "batchByteSize": 134217728,
                        "dryRun": false,
                        "writeMode": "insert"
                    }
                }
            }
        ],
        "setting": {
            "speed": {
                "channel": "1"
            }
        }
    }
}

MySQL参数说明

  • jdbcUrl

    • 描述:描述的是到对端数据库的JDBC连接信息,使用JSON的数组描述,并支持一个库填写多个连接地址。之所以使用JSON数组描述连接信息,是因为阿里集团内部支持多个IP探测,如果配置了多个,MysqlReader可以依次探测ip的可连接性,直到选择一个合法的IP。如果全部连接失败,MysqlReader报错。 注意,jdbcUrl必须包含在connection配置单元中。对于阿里集团外部使用情况,JSON数组填写一个JDBC连接即可。

      jdbcUrl按照Mysql官方规范,并可以填写连接附件控制信息。具体请参看Mysql官方文档。

    • 必选:是

    • 默认值:无

  • username

    • 描述:数据源的用户名

    • 必选:是

    • 默认值:无

  • password

    • 描述:数据源指定用户名的密码

    • 必选:是

    • 默认值:无

  • table

    • 描述:所选取的需要同步的表。使用JSON的数组描述,因此支持多张表同时抽取。当配置为多张表时,用户自己需保证多张表是同一schema结构,MysqlReader不予检查表是否同一逻辑表。注意,table必须包含在connection配置单元中。

    • 必选:是

    • 默认值:无

  • column

    • 描述:所配置的表中需要同步的列名集合,使用JSON的数组描述字段信息。用户使用*代表默认使用所有列配置,例如['*']。

      支持列裁剪,即列可以挑选部分列进行导出。

      支持列换序,即列可以不按照表schema信息进行导出。

      支持常量配置,用户需要按照Mysql SQL语法格式: ["id", "`table`", "1", "'bazhen.csy'", "null", "to_char(a + 1)", "2.3" , "true"] id为普通列名,`table`为包含保留字的列名,1为整形数字常量,'bazhen.csy'为字符串常量,null为空指针,to_char(a + 1)为表达式,2.3为浮点数,true为布尔值。

    • 必选:是

    • 默认值:无

  • splitPk

    • 描述:MysqlReader进行数据抽取时,如果指定splitPk,表示用户希望使用splitPk代表的字段进行数据分片,DataX因此会启动并发任务进行数据同步,这样可以大大提供数据同步的效能。

      推荐splitPk用户使用表主键,因为表主键通常情况下比较均匀,因此切分出来的分片也不容易出现数据热点。

     目前splitPk仅支持整形数据切分,不支持浮点、字符串、日期等其他类型。如果用户指定其他非支持类型,MysqlReader将报错!

    如果splitPk不填写,包括不提供splitPk或者splitPk值为空,DataX视作使用单通道同步该表数据。
    
    • 必选:否

    • 默认值:空

  • where

    • 描述:筛选条件,MysqlReader根据指定的column、table、where条件拼接SQL,并根据这个SQL进行数据抽取。在实际业务场景中,往往会选择当天的数据进行同步,可以将where条件指定为gmt_create > $bizdate 。注意:不可以将where条件指定为limit 10,limit不是SQL的合法where子句。

      where条件可以有效地进行业务增量同步。如果不填写where语句,包括不提供where的key或者value,DataX均视作同步全量数据。
      
    • 必选:否

    • 默认值:无

  • querySql

    • 描述:在有些业务场景下,where这一配置项不足以描述所筛选的条件,用户可以通过该配置型来自定义筛选SQL。当用户配置了这一项之后,DataX系统就会忽略table,column这些配置型,直接使用这个配置项的内容对数据进行筛选,例如需要进行多表join后同步数据,使用select a,b from table_a join table_b on table_a.id = table_b.id

    当用户配置querySql时,MysqlReader直接忽略table、column、where条件的配置,querySql优先级大于table、column、where选项。

    • 必选:否

    • 默认值:无

执行结果

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/697160.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

魔兽世界私人服务器怎么开

开设魔兽世界的私人服务器涉及到一系列复杂的步骤和技术要求。下面是一个大致的指南,以供参考: 1. 硬件需求:首先,你需要一台强大的服务器来承载游戏服务器。服务器的规模和配置将取决于你计划同时容纳多少玩家以及服务器的性能要…

linux下unmount了移动硬盘之后,硬盘灯还是常亮并且硬盘还在一直转动

linux下unmount了移动硬盘之后,硬盘灯还是常亮并且硬盘还在一直转动 ​ 参考:https://www.zhihu.com/question/23362385 希捷2T移动硬盘 在windows下卸载硬盘之后硬盘灯就不亮了,手摸也没有震动感。 在ubuntu下卸载硬盘之后,硬盘灯仍然常…

语音采集技术新革命,4G语音工牌问世,它有哪些应用价值?

随着ChatGpt的火爆和大语言模型的日趋成熟,智能语音赛道迎一轮新的发展。越来越多的企业开始着眼语音数据价值的挖掘,期望能借此来实现销售过程的洞察、赋能,服务过程的管理,客户的精细化运营。基于此,语音前端的采集工…

基于数字全息和相位恢复算法的信息加密与重建实验研究-Matlab代码

▒▒本文目录▒▒ 一、引言二、相位恢复算法三、数字全息显微加密与重建实验验证3.1 基于相位恢复算法全息图加密与解密3.2 菲涅耳变换法重建像3.3 卷积法重建像3.4 角谱法重建像 四、参考文献五、Matlab程序获取 一、引言 近年来,基于光学信息处理技术对图像进行加…

【期末专题】数据库知识点整理

1.要求&#xff1a;修改表的“价格”列&#xff0c;使其数据类型为decimal(6,2) 语句&#xff1a;alter table BookInfo modify price decimal(6,2); 注意点&#xff1a;修改一个表中已有列的数据类型的语句格式&#xff1a; alter table <表名> modify <列名> &…

【STM32】F103 总线结构

一、总线的概念二、STM32的总线结构2.1 STM32的总线矩阵2.2 STM32的存储器映射2.3 STM32的外设寄存器 一、总线的概念 总线是连接多个部件的信息传输线&#xff0c;是各部件共享的传输介质。总线是一种电路&#xff0c;它是CPU、RAM、ROM、输入、输出等设备传递信息的公共通道…

DYnamics 365如何隐藏实体列表页面home page页面上的PowerBI按钮和EXCEL template按钮

如何隐藏以上两个按钮&#xff0c;用ribbon工具根本找不到这2个按钮。 解决方案&#xff1a;添加一个没用的按钮&#xff0c;通过调用enable方法来隐藏。 // JavaScript source code function HiddenButton() { HiddePowerBIButton(); HiddeDocumentTemplateButton(); return…

u盘文件加密怎么设置?丢失重要数据怎么办?

“我同事经常趁我不在工位上的时候&#xff0c;拿我的U盘拷贝了一些文件资料&#xff0c;都没经过我的同意。本来U盘里就存储了很多个人数据&#xff0c;比较隐私&#xff0c;并不想被别人看见&#xff0c;我想给U盘加密&#xff0c;请问u盘文件加密怎么设置&#xff1f;有没有…

国内的“PMP证书”来了,值不值得考?(PMP证书免考增持CSPM-2)

2021年10月&#xff0c;中共中央、国务院发布的《国家标准化发展纲要》明确提出构建多层次从业人员培养培训体系&#xff0c;开展专业人才培养培训和国家质量基础设施综合教育。建立健全人才的职业能力评价和激励机制。由中国标准化协会&#xff08;CAS&#xff09;组织开展的项…

H5学习(二)-- 常用标签

标签内容 一、标题标签二、表单标签啊三、段落标签四、插入图片标签五、换行标签六、列表标签七、超链接标签八、容器标签九、结构性标签十、级块性标签十一、行内语义性标签 HTML中的常用的标签 一、标题标签 <body><!--标题标签--><h1>h1标签</h1>&…

关于vue中element-UI中table的循环展示以及分页方式

vue中table多用到分页&#xff0c;有时会忘记怎么使用分页和循环展示表格 直接上代码&#xff1a; 父组件 <tableDate :dateTable"dateTable" :tableData"tableData"></tableDate>js部分 export default {components: {searchBox,tableDate}…

sounddevice通过ffmpeg读取rstp远程网络设备声音;conda环境里用不了电脑系统环境里的应用ffmpeg

1、sounddevice通过ffmpeg读取rstp远程声音 *** samples维度是samples_per_read指定 *** ##用全路径&#xff0c;调用系统ffmpeg&#xff0c;直接conda里运行不然容易出错 C:/Users/loong/.conda/envs/nlp/python.exe D:\sound\ffmpeg_test.pyffmpeg_test.py: import sound…

Revit添加自己的快捷键和一键剪切

一、Revit中如何自己添加快捷键 我们用Revit做模型时&#xff0c;快捷键可以加快我们的操作速度&#xff0c;提高工作效率。那么我们如何自己添加快捷键呢&#xff0c;下面请看步骤。 1、 点击“视图”&#xff0c;最右“用户界面” 2、 点击“快捷键”&#xff0c;过滤器为“全…

vue2/vue3中,H5自动生成骨架屏代码

generate-skeleton-h5 vue2/vue3自动生成h5骨架屏 安装骨架屏插件 npm i draw-page-structure -D页面引入 import { generateSkeleton } from "generate-skeleton-h5" generateSkeleton().then(res > {// 当前页面的骨架屏代码&#xff0c;含html与cssconsole…

Flutter学习四:Flutter开发基础(四)包管理

目录 0 引言 1 包管理 1.1 简介 1.2 Pub仓库 1.3 依赖Pub仓库 1.3.1 查找包 1.3.2 添加包 1.3.3 下载包 1.3.4 引入包 1.3.5 使用包 1.4 其他依赖方式 1.4.1 依赖本地包 1.4.2 依赖git仓库 1.4.3 不常用的依赖方式 0 引言 本文是对第二版序 | 《Flutter实战第二版…

一文搞懂JSON

目录 什么是JSON? JSON的基本数据类型 JSON的特点和优势&#xff08;了解&#xff09; JSON格式规范&#xff08;重点&#xff09; JSON的基本操作 关键接口的梳理 序列化 反序列化 答案和解析 序列化答案 反序列化答案 第一种思路 第二种思路 什么是JSON? JSO…

Linux4.vim

1.vim 三种模式 : 命令模式的常见命令 : 底行模式 : 2.sudo 信任名单的位置 : /etc/sudoers 添加信任名单 :以root身份&#xff0c;使用vim打开信任名单&#xff0c;显示行号&#xff0c;大概在104行。

数字化车间数字孪生可视化提高资产利用率

车间管理中往往存在以下几方面问题&#xff1a; 1、产品加工过程复杂、工序繁多;产品在生产制造过程中由于设备和工艺等原因产生不确定因素会影响最终产品质量; 2、生产计划制定困难、生产任务无法及时完成导致生产计划执行困难; 3、业务需求不明确或变化频繁造成车间管理工作无…

360手机驱动提取 360手机驱动安装 360手机高通驱动

360手机驱动提取 360手机驱动安装 360手机高通驱动 参考&#xff1a;360手机-360刷机360刷机包twrp、root 360刷机包360手机刷机&#xff1a;360rom.github.io 【360手机驱动提取】 注&#xff1a;期间手机提示授权&#xff0c;请勾选同意 打开手机&#xff1a;开发者模式&a…

楚天云淡风更长--2023华为主题创意工作坊武汉站侧记

create:2023-06-28 楚 三镇锁大江 名城历千秋。 华中重地&#xff0c;中心城市优势引领区域经济发展。 无论是古老的楚越文化、离骚诗赋&#xff0c; 还是后世追起的黄鹤高楼、千载悠悠&#xff0c; 或是明清以降的开风气之先河&#xff0c; 又以工业重镇立于现代城市之林&am…