数据库迁移同步 | 两地三中心到异地双活演变及关键技术探讨

news2024/12/22 20:19:39

两地三中心和异地多活都是分布式系统的关键技术,用于保证系统的高可用性和容错性。其中最关键的技术无疑是数据同步、同步防环和数据冲突解决。

异地容灾 & 两地三中心

两地三中心架构是一种分布式系统的架构模式,用于保证系统的高可用性和容错性。它将整个系统划分为三个数据中心:两个位于同城,一个位于异地。其中,同城的两个数据中心分别承担主备的角色,异地数据中心则作为备份。

在两地三中心架构中,同城的两个数据中心之间通过高速网络进行数据同步,实现了主备切换和故障恢复。当主数据中心发生故障时,备份数据中心会自动接管服务,保证系统的连续性和可用性。同时,异地数据中心作为备份,可以在主备数据中心都出现故障时提供服务。

两地三中心架构具有以下优点:

  • 高可用性:通过主备切换和异地备份,保证了系统的高可用性和连续性。

  • 容错性:当某个数据中心或服务器出现故障时,可以快速切换到其他可用的数据中心或服务器上,保证了系统的容错性。

  • 灵活性:可以根据业务需求灵活配置数据中心的数量和位置,满足不同的业务需求。

  • 性能优化:可以通过负载均衡等方式优化系统的性能,提高用户体验。

  • 安全性:可以通过数据同步和容灾备份等方式保证数据的安全性和完整性。

以MySQL数据库为例,可以通过同城双向复制和异地异步复制来实现两地三中心架构。

以下是两地三中心架构的部署架构:

  • 主数据中心:包括一个MySQL主库和一个或多个MySQL从库,主库用于写入操作,从库用于读取操作。

  • 同城备份数据中心1:包括一个MySQL主库和一个或多个MySQL从库,主库用于备份主数据中心的数据,从库用于读取操作。

  • 异地备份数据中心2:包括一个MySQL主库和一个或多个MySQL从库,主库用于备份主数据中心的数据,从库用于读取操作。

尽管两地三中心架构具有很多优点,但也存在一些缺陷:

  • 成本高:由于需要建设多个数据中心和进行数据同步等操作,所以成本较高。

  • 配置复杂:两地三中心架构需要对系统进行详细的规划和配置,包括主备切换、数据同步、负载均衡等方面,因此配置比较复杂。

配置这么复杂,而且同城备份中心和异地备份中心基本上都用不到,造成了大量的资源浪费;并且大部分用户并不能做到每个月/季度做一次容灾演练,导致真正发生机房异常的情况下,同城或者异地容灾中心并不能派上用场,用户做两地三中心并没有什么动力。

一般企业的选择是:对部分核心业务和有监管要求的数据库才会搭建同城容灾,并且对异地容灾会尽量缩减规模,例如:主中心是一主两从,而异地容灾中心可能只有一个数据库实例,去掉了从机。

总之,两地三中心架构的部署需要对系统进行详细的规划和配置,并且需要考虑多个数据中心之间的协调和管理。

异地多活 & 单元化

上面说的两地三中心和异地容灾方案成本高、配置复杂、真正需要的时候不一定用的上,有些企业特别是业务在全国甚至全球范围需要本地化访问时会采用异地多活(或者称为单元化)的解决方案。

异地多活架构(Active-Active Architecture)是一种分布式系统架构,它允许多个数据中心同时处理用户请求,并且这些数据中心之间可以相互协作,实现数据的共享和同步。异地多活架构有以下优缺点:

优点:

  • 高可用性:异地多活架构可以在多个数据中心之间进行负载均衡和故障转移,从而提高了系统的可用性和容错性。

  • 低延迟:由于数据中心之间可以相互协作,因此可以将数据尽可能地靠近用户,减少网络延迟和响应时间。

  • 数据共享:异地多活架构可以实现数据的共享和同步,从而提高了数据的可靠性和一致性。

  • 灵活性:异地多活架构可以根据实际需求进行扩展和缩减,从而满足不同规模和复杂度的业务需求。

异地多活最大的挑战来自于数据库,最主要的来自于数据一致性:由于异地多活架构需要实现数据的共享和同步,因此需要解决数据一致性的问题,避免出现数据冲突和错误。

闲话少说,举例为证:假设你是一个MySQL DBA,你们公司有三个机房:北京、广州和上海。领导要求你提供一个解决方案:让每个地区的客户都就近访问本地的数据库,华北的客户数据存储在北京的数据库,华东的客户数据存储在上海的数据库,华南的客户数据存储在广州的数据库上。这些数据库的数据需要能相互同步,保证数据一致,以便华北的用户出差到上海以后可以就近访问上海数据库上的数据(这些数据是华北这个客户的数据从北京同步到上海的),在上海出差产生的数据同样应该同步回北京。这样客户出差回北京以后,他可以继续访问和更新“最新”的数据。

对应的,你就需要搭建一个异地多活架构来实现数据的就近访问和不同中心的数据同步。具体的方案如下:

  • 在每个机房都部署一套MySQL数据库。

  • 通过VPN隧道或者其他技术,打通各个机房的网络,让MySQL可以建立复制链路。

  • 配置MySQL GTID复制,搭建双向复制,将不同机房之间的数据进行双向同步,保证数据的一致性和可靠性。

简单的示意图如下:

总之,异地多活架构是一种高级别的分布式系统架构,具有高可用性、低延迟、数据共享和灵活性等优点,但也存在复杂性、成本较高、数据一致性和安全性等缺点,需要根据实际情况进行选择和应用。

同步防环

如前所述,不管是两地三中心还是异地多活,其中比较关键的就是双向同步(两地三中心中的同城双向同步,异地多活的多中心双向同步),保证业务在一个中心写的数据可以复制到另外一个中心。数据库原生提供的复制有些本身是可以搭建双向复制的,但是这种方式只能做到实例级别同步(无法支持where条件过滤或者做对象名映射)、无法定制化修改(需要有内核修改能力并且修改后必须停业务以升级数据库),监控和管理不直观(命令行式,操作不便)。一般使用专业的双向同步工具或者其他第三方工具来实现,以保证易用性、易维护性,提供定制化修改和监控管理功能。

沃趣科技的DBMotion(squids.cn)实现了MySQL和openGauss的双向同步,它不依赖于数据库原生的复制,采用独立的cdc解析模块从源库中获取重做日志并解析,通过sink模块将源库中的变更并行应用到目标库。如下图所示,如果不做特殊处理,将会出现循环复制的问题。

还是以MySQL为例,上图中两个MySQL实例分别位于华东中心和华南中心,如果通过DBMotion做双向同步,那么在华东中心插入一行数据,通过DBMotion在华南回放,也会插入一行数据;但是反向的DBMotion解析到这条insert的数据,又会将它同步回华东中心。也就产生了循环复制,如果是无主键表,insert不产生唯一约束冲突,这个insert将在华东和华南永续循环复制下去。

当然,通过MySQL基于server-id是可以避免的。如图,在db1插入的数据,插入到db2的时候,在日志中也记录为server-id=1。这样dbmotion的反向复制,检查到server-id为1的日志要同步回来,就可以安全的过滤掉。

但是这种方式需要精准的控制每个中心所有数据库的server-id,下图中如果是server-id=1产生的更新,就会在华南中心的双master实例间做无限循环复制。

当然,MySQL也可以利用GTID来实现,但是GTID并不是所有的客户都开启的,如何兼容是一个问题。

上面只是以MySQL这种逻辑复制避免循环复制的方案。openGauss原生的复制目前是另外一种方案:华东中心复制写入华南中心的时候不记录日志。这样反向复制同步时,取不到正向同步的数据,也就不会形成循环复制。当然这种方式会导致华南中心的备库没有华东中心过来的数据,对于多中心数据同步也是无法级联同步数据的。

DBMotion采用的是类似于server-id打标的方式,在数据写入华南中心的时候对日志进行标记, 保证DBMotion写入的数据,在DBMotion日志解析的时候能够被认出来,避免数据被复制回华东中心。

如果扩展到多中心,还是会存在循环复制的问题,如图:在华北中心插入的数据被标识为region3,复制到华东和华南中心时,他们发现数据都不是自己发出的时候,就会出现循环复制的问题。

此时,DBMotion就需要做额外的处理,在华东中心把华北过来的数据和业务请求的数据统一标记成region1,这样在华南过来的业务数据没有标记,而从华东过去的数据都有标记,就可以将打标的更新成功过滤。

当然,这种同步还是避免不了用户故意搭建的环形复制链路产生循环复制,所以DBMotion支持的异地多活,目前只能支持树形复制,类似于下图的结构。在region-id=6的数据库上插入一笔数据,通过DBMotion同步到region-id=2的节点时,会将2标记为同步到region-id为1和5的节点,并且从1和5同步回来时会自动被过滤掉,之后会依次被同步到3,4;7;8。

综上,“同步防环”可以解决一条更新在多个中心上循环复制的问题,异地双活的关键技术难点“循环复制”,可以通过打标忽略的方式解决。

冲突解决

异地多活又称为单元化,前提是业务可以单元化,让客户同时只在一个单元上操作。

如前文中提到的,北京的用户无论是在北京还是在上海,只会在不同的时间点更新自己的数据,不会出现在多个中心同时更新同一笔数据的情况。如果需要在同时在同一个时间点更新同一个数据,如北京和上海的用户同时汇款给广州的客户,就可能同时对广州的客户账户有两个增加余额的操作。

这种同时在多中心操作同一笔数据的方式,需要在业务上严格避免,或在业务架构上使用集中式架构,在同一个中心(或者通过同城多中心的分布式数据库)应对所有单元的更新请求;或对业务进行单元化分拆(以上面的汇款案例为例,广州的用户应该在北京和上海都有子账户,收到汇款只是在北京和上海的子账户上增加余额,对应的广州的这个用户查询余额就需要汇总所有中心的账户余额了)。

另外,复制延迟也有可能导致冲突,例如北京的客户出差到了上海来更新自己的数据,此时在北京的部分更新还没有同步到上海,那么也会出现类似于两边同时写同一份数据的冲突。

上述数据冲突的问题,都必须在业务或者说在数据库的上层解决。通过数据同步将数据已经写入到数据库后,数据冲突在“下层”是无法解决的,只能检测冲突,提醒客户有冲突发生,并提供相关的冲突解决策略去辅助客户解决这个问题。

DBMotion通过匹配前镜像和后镜像更新报错来发现冲突,目前提供两种机制来处理冲突

  1. 复制链路可以指定冲突错误忽略列表,用户可以指定对部分冲突报错直接忽略报错,类似于MySQL的replica_skip_errors错误。例如:用户需要对Duplicate Key报错进行忽略,可以直接在冲突错误忽略列表中增加1062错误。

  2. 复制检测到冲突可以按照复制冲突策略来自动处理冲突。

DBMotion复制检测到冲突目前有三种冲突解决策略可以指定

  • 报错:DBMotion在检测到冲突以后就报错停止,配合上短信和邮件报警,用户收到报错后可以查看并手工解决冲突以后,点“继续”会让DBMotion断点续传从上次报错的位置继续同步。

  • 忽略:DBMotion在检测到冲突后,只会在日志中记录冲突,忽略错误并继续同步。

  • 覆盖:DBMotion会直接以主键或者唯一键对目标库进行覆盖,保证目标库和源库一致,继续同步。

总结

综上,冲突解决是异地多活和分布式数据库面临的通用问题,需要在业务架构上尽量避免。DBMotion在数据库同步的时候提供了两种机制,三种策略来辅助客户检测冲突和设置冲突解决策略。

目前DBMotion已经在Squids上上线(squids.cn),为客户提供异地、跨云的MySQL和openGauss多活业务访问,未来将继续支持更多的多活场景。

更多技术干货请关注公号“云原生数据库”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/494205.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pom文件的project标签报错java.lang.OutOfMemoryError: GC overhead limit exceeded

1、pom文件的project标签报错java.lang.OutOfMemoryError: GC overhead limit exceeded,如何解决? 只需修改idea配置 调大内存,即可解决

git之gitk命令介绍

Gitk 是 Git 提供的一个 GUI 工具,可作为git图形化客户端使用。安装 Git 的时候会自动安装 Gitk 工具。打开git bash,输入 gitk 命令即可打开gitk工具。 Gitk 的主界面主要包含五个部分: 主菜单栏显示区提交信息显示区,显示提交…

【Nginx基础篇】Linux虚拟机安装nginx

目录 一、版本区别 二、编译安装 三、启动nginx 关于防火墙 四、安装成系统服务 一、版本区别 常用版本分为四大阵营 Nginx开源版 http://nginx.org/ Nginx plus 商业版 https://www.nginx.com openresty http://openresty.org/cn/ Tengine http://tengine.taobao.org/ …

BetaFlight统一硬件AOCODARC H7DUAL配置文件讨论

BetaFlight统一硬件AOCODARC H7DUAL配置文件讨论 1. 源由2. Review配置3. 分析整理3.1 生产商信息3.2 磁力计3.3 气压计3.4 陀螺仪3.5 串口RxTx3.6 板载Flash3.7 模拟OSD MAX74563.8 PPM接收机3.9 伺服器3.10 LED灯带3.11 蜂鸣器3.12 电机 X83.13 ADC(电压/电流/RSSI信号强度/空…

(六)Spring源码阅读:invokeBeanFactoryPostProcessors方法

一、概述 invokeBeanFactoryPostProcessors的执行顺序大致如下,先执行子类BeanDefinitionRegistryPostProcessor再执行父类BeanFactoryPostProcessor。而对于同一个类的执行顺序是先执行外部的集合再到子集,之后再到父集。更小维度执行的顺序按照order注…

私人图片云盘 - 本地快速搭建简单的EasyImage图床并实现公网访问

文章目录 1.前言2. EasyImage网站搭建2.1. EasyImage下载和安装2.2. EasyImage网页测试2.3.cpolar的安装和注册 3.本地网页发布3.1.Cpolar云端设置3.2 Cpolar内网穿透本地设置 4. 公网访问测试5. 结语 1.前言 一个好的图床,是网站或者文章图片能稳定显示的关键&…

学习网络安全如何避免成为脚本小子或者安全工具人

想要避免成为工具人或者脚本小子,你需要注意学习初期和工作初期的选择。 首先,在学习初期,打好基础最重要,避免成为脚本小子。 你可能发现很多人仅仅会写个Python然后会用工具,积累一点经验就可以找到一份还不错的工…

传奇人物《周兴和》书连载之67 不辱神圣的使命

不辱神圣的使命 这里,先前还是一个十分神秘的地方。 外人和车辆要想进入这片区域,那是绝对不允许的。这片区域隐于群山之中,且戒备森严,外人若想进入,那是要经过好几道政治审查和随身检查的。近年来,随着…

外卖项目优化-02-mysql主从复制、读写分离(shardingJdbc)、Nginx(反向代理,负载均衡)

文章目录 瑞吉外卖项目优化-Day02课程内容前言1. MySQL主从复制1.1 介绍1.2 搭建1.2.1 准备工作1.2.2 主库配置1.2.3 从库配置 1.3 测试 2. 读写分离案例 (shardingJdbc)2.1 背景介绍2.2 ShardingJDBC介绍2.3 数据库环境2.4 初始工程导入2.5 读写分离配置2.6 测试 3. 项目实现读…

GPT-4等大语言模型对教育的未来意味着什么?

‍ ‍ shadow Mixlab这些年举办了非常多的活动和workshop,都带有很强的教育属性。今天我抽空学习了可汗学院的《AI-for-Education》课程,非常有启发。我记录了精华内容,分享给大家。 课程地址: www.khanacademy.org/college-caree…

8086CPU汇编环境安装

之前是使用XP虚拟机中的DOS窗口,后来在B站上逛到的视频【《汇编语言》速成指南(全程敲代码)】中介绍了DOSBox这个软件,觉得很好用,使用方式记录在这里。 软件下载好是这样: 一、安装BOX程序 双击exe安装 ,默认下一步…

看看好不好用,使用 Netty+SpringBoot 打造的 TCP 长连接通讯方案

项目背景 正文 一、项目架构 二、项目模块 三、业务流程 四、代码详解 五、测试 六、源码 后记 项目背景 最近公司某物联网项目需要使用socket长连接进行消息通讯。本猿为了解决这个问题,经过长时间的研究、调试和测试,最终找到了一个可行的方…

基于ASAM ODS标准的试验数字化平台-WDP

一 现状 随着现代测控技术的提高,数据结构变得越来越复杂多样,测量的数据量也在日益增大。此外,由于试验条件的限制,大多数企业的数据管理方式主要是通过各类电子文档将试验数据保存在每个工程师的移动电脑中,再进行汇…

【技术选型】Elasticsearch 和Solr那个香?

我们为什么在这里?我存在的目的是什么?我应该运动还是休息并节省能量?早起上班或晚起并整夜工作?我应该将炸薯条和番茄酱或蛋黄酱一起吃吗? 这些都是古老的问题,可能有也可能没有答案。其中一些是非常困难或…

值得关注!正在引领行业变革的15家AI明星创业公司

夕小瑶科技说 原创 作者 | 小戏、iven 星星之火,可以燎原。 在大模型横空出世的这个疯狂的春天,一场关于 AI 产品的革命也正在席卷全球。这边是大公司一个接一个模型搞军备竞赛,那边是各路豪强纷纷下场创业招兵买马。那么,除了咱…

PAT A1032 Sharing

1032 Sharing 分数 25 作者 CHEN, Yue 单位 浙江大学 To store English words, one method is to use linked lists and store a word letter by letter. To save some space, we may let the words share the same sublist if they share the same suffix. For example, l…

FreeRTOS:任务挂起和恢复

目录 一、任务挂起和恢复定义二、任务挂起2.1含义2.2任务挂起内部实现2.3函数vTaskSuspend() 三、任务恢复3.1含义3.2任务恢复内部实现3.3函数vTaskResume() 四、任务挂起和恢复实验4.1实验要求4.2程序代码 一、任务挂起和恢复定义 有时候我们需要暂停某个任务的运行&#xff…

代码随想录算法训练营第三十二天 | 利润题、覆盖范围题

122.买卖股票的最佳时机II 文档讲解:代码随想录 (programmercarl.com) 视频讲解:贪心算法也能解决股票问题!LeetCode:122.买卖股票最佳时机II_哔哩哔哩_bilibili 状态:根本做不出来,思路太巧了。 思路 想获…

浅谈Java、PHP、C++编程的优缺点

Java 、PHP、C 编程语言都是非常流行的编程语言,在开发、Web 开发、移动应用开发等领域都有广泛的应用。本文将从以下几个方面分析 Java、PHP、C 编程语言的优缺点。 一、Java 编程语言的优缺点 优点 (1)具有跨平台特性,能够在不…

Java8中DateTimeFormatter真的是线程安全的吗?

文章目录 [toc] 1.背景2.解决办法2.1办法一:换姿势或者升级JDK的版本2.1办法二:更换文件名称字生成策略 Java8中DateTimeFormatter真的是线程安全的吗? 答案是否定的 1.背景 由于之前写了一个旷世的ocr的服务,接入了旷世的FaceID的人脸比对…