TapData 信创数据源 | 国产信创数据库 TiDB 数据迁移指南,加速国产化进程,推进自主创新建设

news2025/1/10 3:44:09

随着国家对自主可控的日益重视,目前在各个行业和区域中面临越来越多的国产化,采用有自主知识产权的国产数据库正在成为主流。长期以来,作为拥有纯国产自研背景的 TapData,自是非常重视对于更多国产信创数据库的数据连接器支持,旗下产品已陆续与阿里云、华为云、麒麟软件、优炫数据库、Apache Doris、人大金仓、OceanBase 等国产数据库及操作系统完成产品生态集成认证或产品兼容互认证。

本专题将以 TapData 正在支持的各国产信创数据源为原点,提供详细的数据库同步、迁移教程,为有需求的用户提供更灵活的工具选择。本文将介绍的 TapData 数据源为——TiDB

国产化浪潮之下,基础软件自主可控迫在眉睫,越来越多的国内企业开始从 Oracle、MySQL 这一类海外数据库向国产数据库迁移,TapData 的能力恰好满足企业快速、无痛实现迁移的需求,有效推动信创行业国产化建设更进一步。信创领域和基础软件设施的自主可控作为国家重点关注领域,全面国产化替代的进程仍在全速前进中。

同为国产基础软硬件生态的积极建设者,TapData 一直以来都在坚持拓展并持续深化与更多国产信创数据库的生态与战略伙伴关系,以期推动更多行业数据管理解决方案及创新应用的落地,提供更加广泛的基础设施选择及技术服务保障,从而为加速国产软硬件产品的应用普及与协同发展贡献力量。纯国产自研的背景更是为 TapData 的这一发展目标添翼。目前,TapData 已成功实现对主流国产数据库的广泛支持,以 TiDB 为例:

TiDB 由 PingCAP 自主设计、研发,为企业关键业务打造,是一款同时支持在线事务处理与在线分析处理 (Hybrid Transactional and Analytical Processing, HTAP) 的融合型分布式数据库,具备水平扩容或者缩容、金融级高可用、实时 HTAP、云原生的分布式数据库、兼容 MySQL 协议和 MySQL 生态等重要特性。适合高可用、强一致要求较高、数据规模较大等各种应用场景。核心场景包括金融行业场景、海量数据及高并发的 OLTP 场景、实时 HTAP 场景,以及数据汇聚、二次加工处理的场景。是目前较为知名的国产数据库产品之一。

那么,面临国产化推进需求的企业,如何高效实现面向 TiDB 的数据迁移?

一、TiDB 数据迁移方案

更多详情,参见《TiDB 技术文档-数据迁移》:
https://docs.pingcap.com/zh/tidb/stable/migration-overview

TiDB 在官方文档中,为大家提供了一些适用的数据迁移方案:

  • 全量数据迁移

    • 数据导入:使用 TiDB Lightning 将 Aurora Snapshot,CSV 文件或 SQL dump 文件的数据全量导入到 TiDB 集群。
    • 数据导出:使用 Dumpling 将 TiDB 集群的数据全量导出为 CSV 文件或 SQL dump 文件,从而更好地配合从 MySQL 数据库或 MariaDB 数据库进行数据迁移。
    • TiDB DM (Data migration) 也提供了适合小规模数据量数据库(例如小于 1 TiB)的全量数据迁移功能。
  • 快速初始化 TiDB 集群:TiDB Lightning 提供的快速导入功能可以实现快速初始化 TiDB 集群的指定表的效果。请注意,使用快速初始化 TiDB 集群的功能对 TiDB 集群的影响极大,在进行初始化的过程中,TiDB 集群不支持对外访问。

  • 增量数据迁移:使用 TiDB DM 从 MySQL,MariaDB 或 Aurora 同步 Binlog 到 TiDB,该功能可以极大降低业务迁移过程中停机窗口时间。

  • TiDB 集群复制:TiDB 支持备份恢复功能,该功能可以实现将 TiDB 的某个快照初始化到另一个全新的 TiDB 集群。

  • TiDB 集群增量数据同步:TiCDC 支持同构数据库之间的灾备场景,能够在灾难发生时保证主备集群数据的最终一致性。目前该场景仅支持 TiDB 作为主备集群。

根据迁移数据所在数据库类型、部署位置、业务数据规模大小、业务需求等因素,会有不同数据迁移选择。下面是一些常用的迁移工具汇总:

TiDB Data Migration (DM)
在这里插入图片描述TiDB Lightning
在这里插入图片描述TiCDC
在这里插入图片描述TapData
在这里插入图片描述Dumpling
在这里插入图片描述Backup & Restore (BR)
在这里插入图片描述sync-diff-inspector
在这里插入图片描述以上是使用这些工具的场景、支持的上下游、优势和相关限制等信息,可根据实际需求选择合适的工具。

二、TapData 高效迁移教程:以 MySQL → TiDB 为例

更多详情,参见《TapData 帮助文档-连接数据源-自建数据库 TiDB》:https://docs.tapdata.net/prerequisites/on-prem-databases/tidb

完成 TapData Agent 部署后,即可跟随以下教程在 TapData 中添加 TiDB 数据源(支持版本:TiDB 6.0.0 及以上),后续可将其作为源或目标库来构建数据管道。这里我们将以 MySQL 为数据源,TiDB 为数据目标进行模拟演示。(*涉及工具版本为 Tapdata 本地部署版)

版本指路:
点击登录 Tapdata Cloud
申请试用 Tapdata 本地部署版

*注意:为保障数据的正常同步,TiDB 集群与 TapData 引擎(Agent)之间需处于同一内网且能正常通信。

① 准备工作

  1. 登录 TiDB 数据库,执行下述格式的命令,创建用于数据同步/开发任务的账号。
CREATE USER 'username'@'host' IDENTIFIED BY 'password';
  • username:用户名。
  • host:允许该账号登录的主机,百分号(%)表示允许任意主机。
  • password:密码。

示例:创建一个名为 tapdata 的账号,允许从任意主机登录。

CREATE USER 'tapdata'@'%' IDENTIFIED BY 'your_passwd';
  1. 为刚创建的账号授予权限。
-- 授予指定库权限
GRANT SELECT, INSERT, UPDATE, DELETE, ALTER, CREATE, CREATE ROUTINE, CREATE TEMPORARY TABLES, DROP ON database_name.* TO 'username';

-- 授予所有库权限
GRANT SELECT, INSERT, UPDATE, DELETE, ALTER, CREATE, CREATE ROUTINE, CREATE TEMPORARY TABLES, DROP ON *.* TO 'username';
  • database_name:数据库名称。
  • username:用户名。

② 创建 TiDB 的连接

  • 进入 TapData 控制台,在左侧导航栏,单击连接管理

  • 单击页面右侧的创建,在弹框中,搜索并选择 TiDB

  • 在跳转到的页面,根据下述说明填写 TiDB 连接信息:
    在这里插入图片描述

  • 连接信息设置

    • 连接名称:填写具有业务意义的独有名称。
    • 连接类型:支持将 TiDB 数据库作为源或目标。
    • PD Server 地址:填写 PDServer 的连接地址和端口,默认端口号为 2379,本参数仅在作为源库时需填写。
    • 数据库地址:数据库连接地址。
    • 端口:数据库的服务端口,默认为 4000
    • 数据库名称:数据库名称,即一个连接对应一个数据库,如有多个数据库则需创建多个数据连接。
    • 账号、密码:数据库的账号和密码,账号的创建和授权方法,见准备工作。
  • 高级设置

    • 其他连接串参数:额外的连接参数,默认为空。
    • 时间类型的时区:默认为数据库所用的时区,您也可以根据业务需求手动指定。
    • 共享挖掘:挖掘源库的增量日志,可为多个任务共享源库的增量日志,避免重复读取,从而最大程度上减轻增量同步对源库的压力,开启该功能后还需要选择一个外存用来存储增量日志信息,本参数仅在作为源库时需填写。
    • 包含表:默认为全部,您也可以选择自定义并填写包含的表,多个表之间用英文逗号(,)分隔。
    • 排除表:打开该开关后,可以设定要排除的表,多个表之间用英文逗号(,)分隔。
    • agent 设置:默认为平台自动分配,您也可以手动指定。
    • 模型加载时间:当数据源中模型数量小于 10,000 时,每小时刷新一次模型信息;如果模型数据超过 10,000,则每天按照您指定的时间刷新模型信息。
    • 开启心跳表:当连接类型选择为源头和目标、源头时,支持打开该开关,由 Tapdata 在源库中创建一个名为 _tapdata_heartbeat_table 的心跳表并每隔 10 秒更新一次其中的数据(数据库账号需具备相关权限),用于数据源连接与任务的健康度监测。
  • SSL 设置:选择是否开启 SSL 连接数据源,可进一步提升数据安全性,开启该功能后还需要上传 CA 文件、客户端证书、密钥填写客户端密码。更多介绍,见生成自签名证书。
    *提示:数据源需在数据复制/开发任务引用并启动后,心跳任务任务才会启动,此时您可以再次进入该数据源的编辑页面,即可单击查看心跳任务。

  1. 单击连接测试,测试通过后单击保存
    在这里插入图片描述*提示:如提示连接测试失败,请根据页面提示进行修复。

③ 创建 MySQL 的连接

  1. 参照 TiDB 连接创建流程,完成 MySQL 连接配置信息填写,添加数据源 MySQL:
    在这里插入图片描述
  2. 测试 MySQL 连接:
    在这里插入图片描述④ 创建数据复制/开发任务

1.左侧导航栏点击数据复制,并点击右侧创建:
在这里插入图片描述
2. 进入 DAG 页面,构建数据复制任务,通过拖拉拽的方式添加源与目标节点,并连接源与目标:
在这里插入图片描述
3. 进入 DAG 页面,构建数据复制任务,通过拖拉拽的方式添加源与目标节点,并连接源与目标:
在这里插入图片描述
4. 保存任务:
在这里插入图片描述⑤ 任务启动与监控

1.启动任务,任务全量同步正常运行:
在这里插入图片描述
2.增量事件正常同步:
在这里插入图片描述以上,便是借助 TapData 快速实现 MySQL 到 TiDB 的全、增量同步的模拟教程。

后续,我们还将陆续输出 GaussDB、人大金仓Kingbase、Oceanbase、神州通用、南大通用、OpenGauss、瀚高、 TDengine、TDSQL、VastBase等热门国产数据源的连接教程,欢迎关注 TapData 官方公众号,了解更多。

< 上一篇 达梦(Dameng)

推荐阅读】:

  • TapData 信创数据源 |国产信创数据库达梦(Dameng)数据迁移指南,加速国产化进程,推进自主创新建设
  • ETL vs. ELT:数据集成的最佳实践是什么?
  • 统一的实时数据平台终极指南
  • 加速数字化转型,信创自主可控:TapData为银行业数据管理能力建设提供新思路
  • 如何高效整合分散数据,构建统一的实时数据平台?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1964809.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

EasyTwin的动画系统已经到了next level?快来一探究竟!

在实际的数字孪生项目场景建设中&#xff0c;水利项目中的洪水推演、工业领域的工程施工模拟、车间产线运转、机械装置和零件配置展示等项目场景&#xff0c;都对动画效果有很强的使用需求&#xff0c;这是对渲染软件和设计师能力的极大考验&#x1f198;。 别担心&#xff01…

使用人工智能在乳腺癌筛查中的早期影响指标| 文献速递-AI辅助的放射影像疾病诊断

Title 题目 Early Indicators of the Impact of Using AI in Mammography Screening for Breast Cancer 使用人工智能在乳腺癌筛查中的早期影响指标 01 文献速递介绍 基于人群的乳腺癌筛查通过使用乳房X线摄影成功地降低了乳腺癌的死亡率&#xff0c;但这给乳腺放射科医生…

【通俗理解】自相似性探索——从分形到递归的奇妙之旅

【通俗理解】自相似性探索——从分形到递归的奇妙之旅 自相似性的奇妙比喻 你可以把自相似性比作一个“无限镜子”&#xff0c;它能够在不同的尺度上反射出相同的图案或结构。就像是在一面两面镜之间放置一个物体&#xff0c;镜子中的倒影会无限重复&#xff0c;每个倒影都与原…

韦东山瑞士军刀项目自学之中断控制LED

使用库函数设置外部中断控制LED 重点&#xff1a;在设置GPIO为外部中断控制源时&#xff0c;你至少要先检查一下信号是不是来自于你所设置的那个端口&#xff01;因为EXTI并不是对每个端口单独引线&#xff0c;而是将所有组的同编号的部分接口只用一个EXTI进行控制&#xff0c…

【最新】cuda和cudnn和显卡驱动的对应关系

NV官方文档Support Matrix — NVIDIA cuDNN v9.2.1 documentation下列的非常清楚&#xff0c;如图&#xff1a;

Cocos Creator2D游戏开发(9)-飞机大战(7)-爆炸效果

这个爆炸效果我卡在这里好长时间,视频反复的看, 然后把代码反复的测试,修改,终于给弄出来 视频中这段,作者也是修改了好几次, 跟着做也走了不少弯路; 最后反正弄出来了; 有几个坑; ① 动画体创建位置是enemy_prefab ② enemy_prefab预制体下不用放动画就行; ③ 代码中引用Anima…

入门 PyQt6 看过来(案例)18~ 表格属性

QTableWidget是常用的显示数据表格控件&#xff0c;是QTableView的子类&#xff0c;它使用标准的数据模型&#xff0c;并且其单元格数据是通过QTableWidgetItem对象来实现的。 QTableWidget类常用方法如下表&#xff1a; 方法描述setRowCount(行数)设置表格行数setColumnCount…

【C++高阶】哈希:全面剖析与深度学习

目录 &#x1f680; 前言一&#xff1a; &#x1f525; unordered系列关联式容器1.1 unordered_map1.2 unordered_set 二&#xff1a; &#x1f525; 哈希的底层结构 ⭐ 2.1 哈希概念⭐ 2.2 哈希冲突⭐ 2.3 哈希函数⭐ 2.4 哈希冲突解决2.4.1 &#x1f304;闭散列2.4.2 &#x…

【课程系列06】某乎AI大模型全栈工程师-第6期

网盘链接 链接&#xff1a;https://pan.baidu.com/s/1QLkRW_DmIm1q9XvNiOGwtQ --来自百度网盘超级会员v6的分享 课程目标 【知乎大模型课程】学习的四个维度 &#x1f449;指挥层&#xff1a;学高阶指令工程 AI编程等&#xff0c;指挥大模型完成90%代码任务&#xff0c;包…

MySql理解RR(可重复读)事务隔离级别

demo&#xff0c;理解mysql的可重复读隔离级别&#xff0c;当前读、快照读的区别 如下图&#xff0c;表sys_user中我同时开启三个事务连接&#xff1a; session1&#xff1a; 当session1开启事务时&#xff0c;mysql使用快照读保存事务开始前的数据&#xff0c;所以这条事务…

数据仓库及离线数仓架构、实时数仓架构

往期推荐 大数据HBase图文简介-CSDN博客 数仓常见名词解析和名词之间的关系-CSDN博客 目录 0. 前言 0.1 浅谈维度建模 0.2 数据分析模型 1. 何为数据仓库 1.1 为什么不直接用业务平台的数据而要建设数仓&#xff1f; 1.2 数据仓库特征 1.3 数据仓库和数据库区别 1.4 以…

VULNHUB-XXE漏洞 靶机

1.导入打开虚拟机 然后没账号密码~ 虚拟机虚拟网络编辑器是net 可以知道虚拟机的ip池 直接拿工具扫描端口 御剑 Zenmap namp 都可以 然后打开这个端口 扫描一下目录发现有个robots.txt 有个/xxe/应该是个路径 打开看看 admin.php是个文件 有个登录 试了试弱口令没办法 抓…

谁是金融核心系统市场第一名?中兴通讯旗下金篆GoldenDB

从IDC发布的《中国银行业本地部署分布式事务型数据库市场份额&#xff0c;2023》报告来看&#xff0c;中兴通讯旗下的金篆GoldenDB以24.8%的市场份额在银行业本地部署分布式数据库市场中独占鳌头&#xff0c;排名“第一”。    毕竟关系着人民群众的财产安全&#xff0c;银行…

upload-labs靶场1-19关秒杀攻略

Pass-01 打开第一关&#xff0c;我们先上传一个jpg文件看看这个文件上传功能正不正常 发现可以正常上传&#xff0c;并且访问这个图片也能正常访问&#xff0c;然后我们尝试上传php文件&#xff0c;发现弹出个警告&#xff0c;不让上传 我们上传php时开启抓包&#xff0c;发现抓…

VMware、Yum、VIM、Zsh、Oh My Zsh - 搭建属于你的虚拟机

目录 VMware 虚拟机搭建 下载 Centos7 镜像 创建虚拟机 虚拟机网络配置 常用软件配置 yum 配置 vim 安装及配置 zsh 安装 on my zsh 用起来 基本安装 插件 zsh-augosuggestions&#xff08;自动补全&#xff09; 插件 zsh-syntax-highlighting&#xff08;语法高亮…

数据结构:二叉树(链式结构)

文章目录 1. 二叉树的链式结构2. 二叉树的创建和实现相关功能2.1 创建二叉树2.2 二叉树的前&#xff0c;中&#xff0c;后序遍历2.2.1 前序遍历2.2.2 中序遍历2.2.3 后序遍历 2.3 二叉树节点个数2.4 二叉树叶子结点个数2.5 二叉树第k层结点个数2.6 二叉树的深度/高度2.7 二叉树…

Vitis HLS 完美嵌套循环通过 m_axi 接口读取DDR 的迭代次数细粒度控制实验 — 问题描述

1 自媒体账号 目前运营的自媒体账号如下&#xff1a; 哔哩哔哩 【雪天鱼】: 雪天鱼个人主页-bilibili.comCSDN 【雪天鱼】: 雪天鱼-CSDN博客 QQ 学习交流群 FPGA科研硕博交流群 910055563 (进群有一定的学历门槛&#xff0c;长期未发言会被请出群聊&#xff0c;主要交流FPG…

str字符串常量,字符指针char * str的存储方式,以及如何赋值的

在使用字符指针时&#xff0c;第一种为通常的情况。 这次主要关注第二种情况&#xff1a;把字符串赋值给字符指针变量&#xff0c;pa中存储的不是这串字符&#xff0c;而是字符串的首字符的地址。 abcdef作为一个常量字符串程序会把其放在一个单独的内存区域&#xff0c;pa存储…

C++ Primer 总结索引 | 第十七章:标准库特殊设施

仍有一些标准库设施在很多应用中都是有用的&#xff1a;tuple、bitset、正则表达式以及随机数。还将介绍一些附加的I/O库功能&#xff1a;格式控制、未格式化I/O和随机访问 1、tuple 类型 1、tuple 是类似 pair 的模板。不同 tuple 类型的成员类型也不同&#xff0c;但一个 t…

基于SpringBoot+Vue的在线政务服务中心(带1w+文档)

基于SpringBootVue的在线政务服务中心(带1w文档) 本在线政务服务中心管理系统应用在线政务服务中心&#xff0c;数据库采用的是Mysql数据库&#xff0c;并且选择了java语言和SpringBoot框架进行开发项目&#xff0c;在项目开发过程中&#xff0c;实现了系统功能模块的安全性、实…