数据迁移:如何保证在不停机的情况下平滑的迁移数据

news2024/11/24 0:57:46

1. 引言

数据迁移是一个常见的需求,比如以下的场景,我们都需要进行数据迁移。

  1. 大表修改表结构
  2. 单表拆分进行分库分表、扩容
  3. 系统重构,使用新的表结构来存储数据

2. 迁移准备

2.1 备份工具

2.1.1 mysqldump

mysqldump 是 MySQL 自带的用于备份和恢复的命令行工具。它允许用户导出 MySQL 数据库的结构、数据以及表之间的关系,以便在数据库发生问题时进行恢复。它是一个逻辑备份工具,导出的内容是一条条 SQL。

mysqldump 使用介绍

2.1.2 XtraBackup

它使用了 InnoDB 存储引擎的数据备份技术,支持增量备份和恢复,并且支持多主机备份和恢复。它是一个物理备份工具,相当于直接复制 InnoDB 的底层存储文件。

2.2 innodb_autoinc_lock_mode

innodb_autoinc_lock_mode 是 InnoDB 引擎里面控制自增主键生成策略的参数,它有三个取值。

  • 0:使用表自增锁,在 INSERT 语句结束之后才会释放锁;
  • 1:使用表自增锁,如果是普通的 INSERT INTO VALUE 或者 INSERT INTO VALUES 语句,申请了主键就释放锁,而不是整个 INSERT 语句执行完毕才释放。如果是 INSERT SELECT 等语句,因为无法确定究竟要插入多少行,所以都是整个 INSERT 语句执行完毕才释放。
  • 2:使用表自增锁,所有的语句都是申请了主键就立刻释放。

在执行 INSERT INTO VALUES 的时候,不管插入多少行,都只申请一次主键,一次申请够,这些主键必然是连续的,我们可以从第一个 ID 推测出全部 ID。

CREATE TABLE `kkk` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',
  `name` varchar(10) NOT NULL COMMENT 'name',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='测试自增主键';

插入两条数据

insert into kkk(name) values('yyh'),('yqq');

查询本次插入的ID值

SELECT LAST_INSERT_ID();

+------------------+
| LAST_INSERT_ID() |
+------------------+
|                1 |
+------------------+

根据返回的结果并结合插入的条数,就可以得到全部的 ID 了。

3. 迁移方案

在真正开始数据迁移前,我们需要考虑以下几个问题

  • innodb_autoinc_lock_mode 的值,它会影响主键生成策略,在数据迁移时需要考虑处理主键问题;
  • binlog 的模式,在增量校验和修复数据里面使用的是行模式的 binlog;
  • 数据库规范,比如必须要有更新时间戳,只能逻辑删除,不能物理删除;
  • 怎么去实现双写?是否需要业务代码侵入。

迁移流程

3.1 新建目标表,并初始化数据

目标表创建后,首先就是初始化数据。

通过以下两种方式,我们可以去获取原表数据。

  1. 历史备份
  2. 导出数据

比如,我们使用 mysqldump 工具导出原表数据,当数据量特别大的情况下,导出和导入的速度都比较慢,可以进行优化。

在导出时

  • 开启 extended-insert 选项,进行SQL语句合并;

在导入时

  • 关闭唯一性检查和外键检查,原表已经保证了这两项,所以目标表并不需要检查;
  • 关闭 binlog,毕竟导入数据用不着 binlog;
  • 调整 redo log 的刷盘时机,把 innodb_flush_log_at_trx_commit 设置为 0。

3.2 首次数据校验与修复

如果在初始化目标表数据时,使用的是历史备份,此时备份数据是落后于生产数据的;

比如昨天的备份,那么今天的修改目标表就没有;

如果使用的是导出数据,那么在导出数据到导入数据这段时间,原表变化的数据,目标表是没有的。

如果表里有 update_time字段,那么在校验修复时,就可以采用增量方案。筛选出 update_time 大于 导出数据的时间点的数据,然后用原表数据覆盖目标表数据。

比如在某个时间点【T1】停止了这一步骤,在【T1】和开启双写【T2】的这一时间段的数据修改就会丢失。
因为我们后面还会持续进行增量数据校验,可以设置增量校验的起始时间从【T1】之后开始进行。

3.3 业务开启双写

比如我们采用不侵入业务代码方案,利用 AOP 切面,去捕获增删改的调用,篡改为双写模式。

同时,要保证在双写时可以在运行期随时切换状态,比如单写原表、单写目标表、先写原表、先写目标表。

可以利用一个标志位,通过配置中心或接口去修改它的值。

在双写时,有两个问题需要重点关注下,数据一致性问题和主键问题。

3.3.1 数据一致性问题

如果在双写过程中,写入原表成功,写入目标表失败了,该怎么办?

  1. 忽略不管,因为我们有数据校验和修复机制;
3.3.2 主键问题

在双写的时候,我们需要保证原表数据和目标表数据主键一致,也就是在写入原表时拿到自增主键,然后写入目标表的时候设置好主键。

为什么需要手动设置呢?因为我们保证不了在并发情况下,目标表自增的主键和原表自增的主键是同一个值。

在这里插入图片描述

3.4 增量校验和数据修复

增量校验就是一边保持双写,一边检验最新修改的数据,如果不一致,就修复。

比如我们利用更新时间戳update_time列,定时去查询表数据,找出最近更新过的记录,然后再去目标表里面找到对应的数据,如果两者不相等,就用源表的数据去修复目标表的数据。

这个方案有两个条件:所有的表都是有更新时间戳的并且是逻辑删除的

为什么是逻辑删除?

可以思考一下,比如有条数据 id=3,原表删除成功,目标表删除失败,如果是物理删除的话,在原表是找不到的,既然找不到则就比对不了,目标表的那条数据就会一直存在。

这种情况下,我们还可以进行反向全量校验,先去目标表中查找数据,再去原表比对,如果原表不存在,则目标表就可以删除数据了。

3.5 切换双写顺序

通过先写目标表且业务读目标表,再写源表这种方式,万一发现数据迁移出现了问题,还可以回滚为先写源表,再写目标表,确保业务没有问题。

如果直接切换为读写目标表,不写原表的话,万一出现问题,就回滚不了了,因为原表已经丢失数据了。

3.6 保持增量校验与修复

在切换了双写顺序之后,还要继续保持增量校验和修复,注意前面的校验和修复都是以源表为准,在这一步,要以目标表为准。

3.7 断开原表的写入

经过几轮的数据校验与恢复后,就可以断开原表的写入了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2209311.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【计网】从零开始认识https协议 --- 保证安全的网络通信

在每个死胡同的尽头, 都有另一个维度的天空, 在无路可走时迫使你腾空而起, 那就是奇迹。 --- 廖一梅 --- 从零开始认识https协议 1 什么是https协议2 https通信方案2.1 只使用对称加密2.2 只使用非对称加密2.3 双方都使用非对称加密2.4 …

Winform和WPF的技术对比

WinForms(Windows Forms)和WPF(Windows Presentation Foundation)是用于创建桌面应用程序的两种技术。尽管两者都可以用于开发功能强大的Windows应用程序,但它们的设计理念、功能和开发体验都有显著区别。在本文中&…

(亲测可行)ubuntu下载安装c++版opencv4.7.0和4.5.0 安装opencv4.5.0报错及解决方法

文章目录 🌕系统配置🌕打开终端,退出anacoda激活环境(如果有的话)🌕安装依赖🌙安装g, cmake, make, wget, unzip,若已安装,此步跳过🌙安装opencv依赖的库🌙安装可选依赖 …

Smartfusion2开发环境的搭建

Libero软件安装包括libero安装、bibero补丁安装、bibero的license添加和官方ip库的添加等4部分内容组成。具体内容如下所示: 1 Libero软件安装 1、解压LiberoSoC_v11.8的安装包到当前目录,然后运行Libero中的可执行软件进行安装; 图1 双击l…

Javascript实现Punycode编码/解码

Punycode编码/解码的Javascript实现。 用法 const punycode require(punycode); console.log(punycode.encode(用法)); //nwwn1p console.log(punycode.decode(nwwn1p)) //用法console.log(punycode.toIDN(用法.中国)); //xn--nwwn1p.xn--fiqs8s console.log(punycode.fromI…

【AAOS】Android Automotive 13模拟器源码下载及编译

源码下载 repo init -u https://android.googlesource.com/platform/manifest -b android-13.0.0_r69 repo sync -c --no-tags --no-clone-bundle 源码编译 source build/envsetup.sh lunch sdk_car_x86_64-userdebug make -j8 运行效果 emualtor HomeMapAll appsSettings…

CUDA-X

NVIDIA CUDA-X 文章目录 前言一、CUDA-X 微服务CUDA-X 微服务CUDA-X 库二、CUDA-X 数据处理三、CUDA-X AI四、CUDA-X HPC总结前言 适用于 AI 的采用 GPU 加速的微服务和库。 释放 GPU 在 AI 应用程序中的潜能 探索 NVIDIA CUDA-X AI 正在推动变革的 AI 领域和可在其中使用的 G…

win10 解决Qt编译得到的可执行文件 *.exe 无法启动的问题

问题描述 在Qt 5.12.4 写了一个服务端程序,编译可以通过,但是打开debug目录下的可执行文件,就报以下错误: 解决方案 方法一 复制缺失的dll到TCPServer.exe目录下 方法二 可能是系统环境变量没有配好 将你电脑上的Qt安装目录…

linux入门——“权限”

linux中有权限的概念,最常见的就是安装一些命令的时候需要输入sudo来提权,那么为什么要有这个东西呢? linux是一个多用户操作系统,很多东西看起来是有很多分,但是实际的存储只有一份(比如命令,不…

网站在对抗机器人攻击的斗争中失败了

95% 的高级机器人攻击都未被发现,这一发现表明当前的检测和缓解策略存在缺陷。 这表明,虽然一些组织可能拥有基本的防御能力,但他们没有足够的能力应对更复杂的攻击。 例如利用人工智能和机器学习来模仿人类行为的攻击。 这些统计数据强调…

数据结构之顺序表详解:从原理到C语言实现

引言 在上一篇文章中我们讲到了时间复杂度与空间复杂度,今天我们接着讲数据结构中的内容。 数据的存储和组织方式决定了程序的效率。而顺序表,也就是大家熟悉的数组,正是我们编程中的“起步工具”。它简单易懂,却能帮你解决许多…

python利用电脑默认打开方式打开文件,视频,图片

前言 欢迎来到我的博客 个人主页:北岭敲键盘的荒漠猫-CSDN博客 本文整理python利用os库打开本地文件的方法。 这个确实比较简单。 利用os库的 os.startfile("mp4") 函数即可用系统默认打开方式打开文件。 这里打开视频进行测试。 import os os.startfile("…

linux 虚拟环境下源码安装DeepSpeed

第一步:创建虚拟环境: conda create -n deepspeed python3.10 第二步:进入虚拟环境,安装Pytorch 2.3.1 # CUDA 12.1 conda install pytorch2.3.1 torchvision0.18.1 torchaudio2.3.1 pytorch-cuda12.1 -c pytorch -c nvidia 第…

谷粒商城(学习笔记)

配置刷新的注解 数据表中不存在的数据 gateway路径重写 CORS跨域 调整路由顺序: TODO是什么:备忘录 逻辑删除 axios有请求缓存: 请求的模版! 删除成功后,重新获取数据! 删除成功之后,还有提示消息 删除成功…

八大排序--08快速排序

现有 arr {4,8,9,2,7}数组,请用快速排序的方式实现从小到大排序: 方法: 1.定义待排序数组中的第一个值为基准数; 2.定义j游标,从后向前移动找到第一个比基准数小的值停下; 3.定义i游标,从后向…

自定义注解和组件扫描在Spring Boot中动态注册Bean(一)

​ 博客主页: 南来_北往 系列专栏:Spring Boot实战 在Spring Boot中,自定义注解和组件扫描是两种强大的机制,它们允许开发者以声明性的方式动态注册Bean。这种方式不仅提高了代码的可读性和可维护性,还使得Spring Boot应用的…

区域识别——基于python语言

目录 目录 1.水域识别 2.模型介绍 3.文件框架 4.代码示例 4.1 data_preprocess.py 4.2 model1.0.py 4.3 train2.0.py 4.4 predict.py 4.5 运行结果 5.总结 1.水域识别 人眼看见河道可以直接分辨出这是河道,但是如何让计算机也能识别出这是河道呢&#x…

无序中的秩序:Transformer模型的创新性结构解析

最近我在看论文时,发现很多都在用 Transformer 模型,我知道transformer很有名,但是我也只是听说过他的大名,不知道他具体是做什么怎么做的,因此我决定深入了解一下,并做个简单记录,方便以后参考…

TDC上YARN Web-UI 查看application日志方法

方法一 #通过浏览器访问tdc,访问的工作节点对于TDC都是外部节点。在提交给yarn任务后,YarnRM的Web UI 可以展示yarnnm上运行的application日志,但是由于跳转的svc地址,无法直接访问。 #在tdc界面上找到yarn实例,进入ya…

【Scala入门学习】集合常用方法和函数操作

1. foreach循环遍历 foreach 方法的原型: // f 返回的类型是Unit, foreach 返回的类型是Unit def foreach[U](f: Elem > U) 该方法接受一个函数 f 作为参数, 函数 f 的类型为Elem > U,即 f 接受一个参数,参数…