MySQL之分库分表后带来的“副作用”你是怎么解决的?

news2025/1/11 20:03:17

目录标题

  • 一、垂直分表后带来的隐患
  • 二、水平分表后带来的问题
    • 1.多表联查问题
    • 2.增删改数据问题
    • 3.聚合操作问题
  • 三、垂直分库后产生的问题
    • 1.跨库join问题
    • 2.分布式事务问题
    • 3.部分业务库依然存在的性能问题
  • 四、水平分库后需要解决的问题
    • 1.聚合操作和连表问题
    • 2.数据分页问题
    • 3.ID主键的唯一性问题
    • 4.流量迁移、容量规划、节点扩容

一、垂直分表后带来的隐患

垂直分表后当试图读取一条完整数据时,需要连接多个表来获取,对于这个问题只要在切分时,设置好映射的外键字段即可。当增、删、改数据时,往往需要同时操作多张表,并且要保证操作的原子性,也就是得手动开启事务来保证,否则会出现数据不一致的问题。

这里可以看到,垂直分表虽然会有后患问题,但带来的问题本质上也不算大问题,就是读写数据的操作会相对麻烦一些,下面来看看其他的分库分表方案,接下来是真正的重头戏

二、水平分表后带来的问题

水平分表就是将一张大表的数据,按照一定的规则划分成不同的小表,当原本的一张表变为多张表时,虽然提升了性能,但问题随之也来了~

1.多表联查问题

  • 全局表:对于一些不经常更新但需要频繁联查的小表,可以将其设置为全局表,每个分片都有一份完整的副本。这样在进行联查时,可以直接使用本地的全局表数据。
  • 中间件支持:使用如ShardingSphere这样的分布式数据库中间件,它们能够智能地解析SQL语句,并在必要时从多个分片获取数据,然后在中间件层合并结果。
  • 预聚合与缓存:对于一些固定模式的联查,可以在后台定期执行并存储结果到缓存或专门的汇总表中!
  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

2.增删改数据问题

  • 分片键策略定位具体库表

3.聚合操作问题

  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

三、垂直分库后产生的问题

垂直分库是按照业务属性的不同,直接将一个综合大库拆分成多个功能单一的独享库,分库之后能够让性能提升N倍,但随之而来的是需要解决更多的问题,而且问题会比单库分表更复杂!

1.跨库join问题

  • Java系统中组装数据,通过调用对方服务接口的形式获取数据,然后在程序中组装后返回

2.分布式事务问题

分布式事务应该是分布式系统中最核心的一个问题,这个问题绝对不能出现,一般都要求零容忍,也就是所有分布式系统都必须要解决分布式事务问题,否则就有可能造成数据不一致性。

  • ①Best Efforts 1PC模式。
  • ②XA 2PC、3PC模式。
  • ③TTC事务补偿模式。(柔性事务)
  • ④MQ最终一致性事务模式。(常用)

3.部分业务库依然存在的性能问题

  • 再做水平分库即可

四、水平分库后需要解决的问题

1.聚合操作和连表问题

  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

2.数据分页问题

  • 放入第三方中间件中,然后依赖于第三方中间件完成,如ES。一些大企业选用的方案

3.ID主键的唯一性问题

  • 在业务系统中,利用特殊算法生成有序的分布式ID,比如雪花算法、Snowflake算法等。

4.流量迁移、容量规划、节点扩容

线上环境从单库切换到分库分表模式,数据该如何迁移才能保证线上业务不受影响,对于这个问题来说,首先得写脚本将老库的数据同步到分库分表后的各个节点中,然后条件允许的情况下先上灰度发布,划分一部分流量过来做运营测试

如果没有搭建完善的灰度环境,那先再本地再三测试确保没有问题后,采用最简单的方案,先挂一个公告:“今日凌晨两点后服务器会进入维护阶段,预计明日早晨八点会恢复正常运转”!然后停机更新,但前提工作做好,如:Java代码从单库到分库分表要改进完善、数据迁移要做好、程序调试一切无误后再切换,同时一定要做好版本回滚支持,如果迁移流量后出现问题,可以快捷切换回之前的老库。


根据实际情况先做垂直分库,然后再对于核心库做水平分库,水平分库的节点数量要保证的是2的整倍数,方便后续扩容。


扩容一般是指水平分库,也就是当一个业务库无法承载流量压力时,需要对相应的业务的节点数量,但扩容时必须要考虑本次增加节点会不会影响之前的业务,因为很多情况下,当节点的数量发生改变时,可能会影响数据分片的路由规则,这时就要考虑扩容是否会影响原本的路由规则。

扩容一般都是基于水平分库的基础上,进一步对水平库做节点扩容,目前业内有两种主流做法:水平双倍扩容法、异步双写扩容法。

水平双倍扩容法

想要使用双倍扩容法对节点进行扩容,首先必须要求原先节点数为2的整数倍,同时路由规则必须要为数值取模法、或Hash取模法,否则依旧会造成扩容难度直线提升。同时双倍扩容法还有一种进阶做法,被称之为从库升级法,也就是给原本每个节点都配置一个从库,然后同步主节点的所有数据,当需要扩容时仅需将从库升级为主节点即可,过程如下:

在这里插入图片描述

二倍扩容!!
在这里插入图片描述

如果你在的公司财大气粗,我推荐从库升级法,因为从库升级法不仅仅能够避免数据迁移,而且还能保证高可用,当主节点宕机时可以让从节点直接上线顶替,再配合Keepalived+VIP做重启,基本上能够让数据库真正达到7x24小时不间断运行。

异步双写扩容法(常用)

前面聊到的水平双倍扩容法,仅仅只是扩容时的一种方案,除此之外还有另一种方案称之为异步双写扩容法,大体示意图如下:

在这里插入图片描述

对于需要扩容时的情况,首先依旧把新的数据写入到老库中,然后写完之后同步给MQ一份,后续再由MQ的消费者去将新数据写到新库中,同时新库在这期间,会去同步老库中原有的数据,这个动作持续到所有旧数据全部同步完成后,再以老库作为校验基准,核对数据无误后,再将模式切换为扩容后的分库模式

稍微总结一下整个流程,如下:

  • 第一步:修改应用服务代码,加上MQ双写方案,配置新库同步老库数据,然后部署。
  • 第二步:等待新库同步复制老库中所有老数据,期间新写入的数据也会通过MQ写入新库。
  • 第三步:老库中的所有老数据全部同步完成后,以老库作为校验基准,校对新库中的数据。
  • 第四步:校对新老库之间的数据无误后,修改应用配置和代码,将双写改为路由分片,再次部署。

其实异步双写方案,也可以用来做后续的节点扩容,但会相对来说比较麻烦一些。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们处理,核实后本网站将在24小时内删除侵权内容。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2179162.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TypeScript是基于LLM上层研发的受益者

TypeScript优在哪里 TypeScript是一种由微软开发的开源编程语言,它是JavaScript的一个超集,添加了类型系统和一些其他特性。TypeScript的优势在于: 静态类型检查:TypeScript的最大卖点是它的静态类型系统。这允许开发者在编写代码…

PHP 异步编程:从入门到精通

异步编程简介 异步编程是一种允许程序在等待某些操作(如I/O操作或长时间运行的任务)完成时继续执行其他任务的编程模式。这种方式可以显著提高应用程序的效率,尤其是在处理高延迟操作时。 PHP异步编程的实现 在PHP中,实现异步编…

SpringCloud 配置 feign.hystrix.enabled: true 不生效

SpringCloud 配置 feign.hystrix.enabled: true 不生效的原因 feign 启用 hystrix feign 默认没有启用 hystrix,添加配置,启用 hystrix feign.hystrix.enabledtrue application.yml 添加配置 feign:hystrix:enabled: true启用 hystrix 后,访…

rpm方式安装jdk1.8

1、查询系统中是否已经安装jdk rpm -qa |grep java 或 rpm -qa |grep jdk 2、卸载已有的openjdk rpm -e --nodeps java-1.7.0-openjdk rpm -e --nodeps java-1.7.0-openjdk-headless rpm -e --nodeps java-1.8.0-openjdk rpm -e --nodeps java-1.8.0-openjdk-headless3、安装j…

Windows11系统下Docker环境搭建教程

目录 前言Docker简介安装docker总结 前言 本文为博主在项目环境搭建时记录的Docker安装流程,希望对大家能够有所帮助,不足之处欢迎批评指正🤝🤝🤝 Docker简介 Docker 就像一个“容器”平台,可以帮你把应用…

RuoYi框架中的数据完整性异常处理

案例:当你删除的表数据包含外键,关联其他表数据时。删除当前数据,会造成其他数据成为“孤儿”,可能会造成数据混乱。因此我们需要再MySQL中进行外键约束 具体的SQL语句: SET NAMES utf8mb4; SET FOREIGN_KEY_CHECKS 0;-- -------…

北京数字孪生工业互联网可视化技术,赋能新型工业化智能制造工厂

随着北京数字孪生工业互联网可视化技术的深入应用,新型工业化智能制造工厂正逐步迈向智能化、高效化的全新阶段。这项技术不仅实现了物理工厂与数字世界的精准映射,更通过大数据分析、人工智能算法等先进手段,为生产流程优化、资源配置合理化…

xmind怎么把左边的主题换到右边

如图,样式——结构这里改变方向即可 附录:快捷键助手:CtrlShift/ 查看快捷键 1.常规 新建思维导图------------------CtrlN 打开--------------------------CtrlO 保存--------------------------CtrlS 另存为------------------------Ct…

Servlet 3.0新特征

版权声明 本文原创作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhlServlet 3.0概述 Servlet 3.0规范是在2009年随着Java EE 6的发布而推出的。它引入了一系列新特性和改进,旨在简化Web应用的开发和部署过程,并提高Web应用的性能和可扩展性。Servlet 3.0的发布标…

科技赋能,商贸物流新速度 —— 智慧供应链商城加速企业成长

科技赋能,商贸物流新速度 —— 智慧供应链商城加速企业成长 随着科技的飞速发展,AI(人工智能)、大数据、物联网等先进技术正深刻重塑着商贸物流行业,推动其向更高效、更智能、更环保的方向迈进。这些技术的应用不仅提…

在MySQL中,要查询所有用户及其权限,您可以使用以下命令:

文章目录 1、查询所有用户1.1、登录数据库1.2、select user,host from mysql.user; 2、查看用户的权限 1、查询所有用户 1.1、登录数据库 [rootlocalhost ~]# docker exec -it spzx-mysql /bin/bash rootab66508d9441:/# mysql -uroot -p123456 mysql: [Warning] Using a pas…

详解mysql和消息队列数据一致性问题

目录 前言 保持系统数据同步(双写问题) 消息队列消息丢失的问题 总结 前言 在当今互联网飞速发展的时代,随着业务复杂性的不断增加,消息队列作为一种重要的技术手段,越来越多地被应用于各种场景。它们不仅能有效解…

CRUD 开发工具 NocoBase 与 Refine 对比

引言 今天我们来聚焦两款非常优秀的开源 CRUD 开发工具:NocoBase 和 Refine,它们分别是无代码/低代码开发平台和低代码前端开发框架的典型代表。 特别值得一提的是,NocoBase 截止目前已经在GitHub 上获得了 12k 的 Star。Refine 作为 Retool…

「OC」多线程的学习——NSThread

「OC」多线程的学习——NSThread 文章目录 「OC」多线程的学习——NSThread线程(process) 和 进程(thread) 的区别多线程NSThreadNSThread的创建NSThread的方法常见API线程状态控制方法 NSThread线程的状态 NSThread的多线程隐患售票窗口例子 synchronize关键字NSThread的线程通…

【保姆级教程】UMLS工具——MetaMap安装及使用

专家词典 https://lhncbc.nlm.nih.gov/LSG/Projects/lexicon/current/web/index.html SPECIALIST 词典是一个大型的生物医学和通用英语句法词典,旨在提供 SPECIALIST 自然语言处理系统 (NLP) 所需的词汇信息,其中包括 MetaMap 和词汇工具等。它旨在成为…

docker快速安装ELK

一、创建elk目录 创建/elk/elasticsearch/data/目录 mkdir -p /usr/local/share/elk/elasticsearch/data/ 创建/elk/logstash/pipeline/目录 mkdir -p /usr/local/share/elk/logstash/pipeline/ 创建/elk/kibana/conf/目录 mkdir -p /usr/local/share/elk/kibana/conf/ 二、创建…

软考论文《论大数据处理架构及其应用》精选试读

论文真题 模型驱动架构设计是一种用于应用系统开发的软件设计方法,以模型构造、模型转换和精化为核心,提供了一套软件设计的指导规范。在模型驱动架构环境下,通过创建出机器可读和高度抽象的模型实现对不同问题域的描述,这些模型…

算法:按既定顺序创建目标数组

力扣1389 提示&#xff1a; 1 < nums.length, index.length < 100nums.length index.length0 < nums[i] < 1000 < index[i] < i 题解&#xff1a; class Solution {public int[] createTargetArray(int[] nums, int[] index) {int[] target new int[num…

The legacy JS API is deprecated and will be removed in Dart Sass 2.0

The legacy JS API is deprecated and will be removed in Dart Sass 2.0 更新了sass版本后&#xff0c;启动项目控制台一直在报错&#xff0c;影响开发效率&#xff0c;强迫症表示忍受不了。 字面意思是&#xff1a;Sass在2.0版本将会移除legacy JS API&#xff0c;所以现在使…

Python | Leetcode Python题解之第446题等差数列划分II-子序列

题目&#xff1a; 题解&#xff1a; class Solution:def numberOfArithmeticSlices(self, nums: List[int]) -> int:ans 0f [defaultdict(int) for _ in nums]for i, x in enumerate(nums):for j in range(i):d x - nums[j]cnt f[j][d]ans cntf[i][d] cnt 1return a…