数据库分库分表的介绍

news2025/1/10 20:25:11

为什么要分库分表

把存于一个库的数据分散到多个库中,把存于一个表的数据分散到多个表中。如果说读写分离是为了分散数据库读写操作压力,分库分表就是为了分散存储压力,一般情况下,单表数据量到达千万级别,就可以考虑分库分表了。

分库分表的原则:能不分就不分:优先MySQL调优,能不分就不分。

分库分表基本概念

分表

比如你单表都几千万数据了,单表数据量太大,会极大影响你的 sql执行的性能,到了后面你的 sql 可能就跑的很慢了。一般来说单表到几百万的时候,性能就会相对差一些了,你就得分表了。

分表是啥意思?就是把一个表的数据放到多个表中,然后查询的时候你就查一个表。比如按照用户 id 来分表,将一个用户的数据就放在一个表中。然后操作的时候你对一个用户就操作那个表就好了。这样可以控制每个表的数据量在可控的范围内,比如每个表就固定在 200 万以内。

分库

分库是啥意思?就是你一个库一般我们经验而言,最多支撑到并发 2000,一定要扩容了,而且一个健康的单库并发值你最好保持在每秒 1000 左右,不要太大。那么你可以将一个库的数据拆分到多个库中,访问的时候就访问一个库好了。

分库分表实现

分库分表旨在,通过将大表、或大数据库的数据,切分为多个较小的部分,从而提升性能。

分库分表的方式

垂直切分

垂直分表:操作数据库中的某张表,把这张表中的一部分字段数据保存到一张新表里面,再把另一部分字段放另一张表,如:我们电商项目中的member表和member_info表

垂直分库:把单一数据库按照业务划分,(专库专用)

水平切分

水平分库:例如数据库,数据量持续增加 数据量大的问题依然存在,这样可以把一个数据库拆分为多个相同的数据库,来分担数据量多的问题

 水平分表:单表数据量过大

分表字段(sharding_key)选择

选择最佳的分表字段是一个需要仔细考虑的问题。最佳的分表字段应该是能够让数据分布均匀、频繁查询的字段以及不可变的字段。通过选择最佳的分表字段,可以提高系统的性能和查询效率

常用字段:

主键ID:频繁查询并且唯一,非常适合作分表字段。例如,在用户表中,用户ID作为分表字段是一个不错的选择,因为用户ID是唯一的,而且在查询用户信息时经常会用到。

时间字段:如果业务需要按时间范围查询数据,那么选择时间字段作为分表字段是合理的。例如,在日志表中,可以选择时间戳字段作为分表字段,以便按天、按月或按年分割数据,方便查询和维护。

地理信息字段:如果业务需要按地区查询数据,那么选择地理信息字段作为分表字段是合适的。例如,在订单表中,可以选择订单地区字段作为分表字段,以便将订单数据按地区进行拆分,方便查询和扩展。

关联字段:如果业务需要频繁进行关联查询,那么选择订单号等关联字段作为分表字段。例如,在订单表中,可以选择订单号作为分表字段,因为订单号唯一且包含业务信息,并且日常查询、关联查询都是根据订单号查询的,很少根据id查询,方便查询和维护。

选择分表字段的原则:

1. 数据分布均匀:最佳的分表字段应该是能够让数据分布均匀的字段,这样可以避免某个表的数据过多,导致查询效率降低。在用户表中,如果以地区作为分表字段,可能会导致某些地区的数据过多,而某些地区的数据过少。

2. 频繁查询的字段:尽量选择查询频率最高的字段(例如主键id),然后根据表拆分方式选择字段。在一个订单表中,如果经常需要根据用户ID查询订单信息,那么以用户ID作为分表字段是一个不错的选择。

3. 不可变字段:最佳的分表字段还应该是不可变的字段,这样可以避免在数据迁移时出现问题。在一个商品表中,如果选择以商品名称作为分表字段,那么当商品名称发生变化时,就需要将数据移动到不同的表中,这样会增加系统的复杂度。

ShardingSphere介绍

概览 :: ShardingSphere (apache.org)

         ShardingSphere是一套开源的分布式数据库中间件解决方案组成的生态圈,它由Sharding-JDBC、Sharding-Proxy和Sharding-Sidecar(计划中)这3款相互独立的产品组成。 他们均提供标准化的数据分片、分布式事务和数据库治理功能,可适用于如Java同构、异构语言、云原生等各种多样化的应用场景。

Sharding-JDBC是ShardingSphere的第一个产品,也是ShardingSphere的前身。 它定位为轻量级Java框架,在Java的JDBC层提供的额外服务。它使用客户端直连数据库,以jar包形式提供服务,无需额外部署和依赖,可理解为增强版的JDBC驱动,完全兼容JDBC和各种ORM框架。

  • 适用于任何基于JDBC的ORM框架,如:JPA, Hibernate, Mybatis, Spring JDBC Template或直接使用JDBC。

  • 支持任何第三方的数据库连接池,如:DBCP, C3P0, BoneCP, Druid, HikariCP等。

  • 支持任意实现JDBC规范的数据库。目前支持MySQL,Oracle,SQLServer,PostgreSQL以及任何遵循SQL92标准的数据库。

        配置是整个Sharding-JDBC的核心,是Sharding-JDBC中唯一与应用开发者打交道的模块。配置模块也是Sharding-JDBC的门户,通过它可以快速清晰的理解Sharding-JDBC所提供的功能。Sharding-JDBC提供了4种配置方式,用于不同的使用场景。通过配置,应用开发者可以灵活的使用分库分表、读写分离以及分库分表 + 读写分离共用。

  • java配置

  • yaml配置

  • springboot配置

  • spirng命名空间配置

        分库分表并不是由 ShardingSphere-JDBC 来做,它是用来负责操作已经分完之后的 CRUD 操作。

        分库分表是由数据库中间件来实现的。数据库中间件是位于应用程序和数据库之间的一层软件,它负责将数据库的访问请求进行拦截和解析,然后将请求分发到不同的数据库节点上进行处理。中间件会根据事先定义的规则将数据进行分片(分库分表),将数据分散存储在多个数据库节点上,从而提高数据库的扩展性和性能。

        常见的数据库中间件有MySQL的MyCAT、阿里巴巴的TDDL、蚂蚁金服的OceanBase等。这些中间件通过内置的路由规则和分片算法,可以将数据的读写请求合理地路由到对应的数据库节点上,实现透明的分库分表操作。

        因此,分库分表不是由ShardingSphere-JDBC这样的JDBC框架来完成的,而是由专门的数据库中间件来实现的。ShardingSphere-JDBC主要负责提供对分库分表后的数据进行操作的功能。

代码实例:

创建两个数据库edu_db_1,edu_db_2,每个库中创建两张表course_1,course_2

CREATE TABLE `product1` (
  `id` bigint NOT NULL,
  `cname` varchar(50) NOT NULL,
  `shelf_id` bigint NOT NULL,
  `status` varchar(10) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

CREATE TABLE `product2` (
  `id` bigint NOT NULL,
  `cname` varchar(50) NOT NULL,
  `shelf_id` bigint NOT NULL,
  `status` varchar(10) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

导入相关依赖

1.分表不分库

配置对应实体类以及 Mapper

Spring Boot配置 :: ShardingSphere (apache.org)

# sharding-jdbc 水平分表策略
# 配置数据源,给数据源起别名
spring.shardingsphere.datasource.names=m1

# 一个实体类对应两张表,覆盖
spring.main.allow-bean-definition-overriding=true

# 配置数据源的具体内容,包含连接池,驱动,地址,用户名,密码
spring.shardingsphere.datasource.m1.type=com.alibaba.druid.pool.DruidDataSource
spring.shardingsphere.datasource.m1.driver-class-name=com.mysql.cj.jdbc.Driver
spring.shardingsphere.datasource.m1.url=jdbc:mysql://localhost:3306/product_db_1?useUnicode=true&characterEncoding=utf8&useSSL=false&serverTimezone=Asia/Shanghai&tinyInt1isBit=false

spring.shardingsphere.datasource.m1.username=root
spring.shardingsphere.datasource.m1.password=123456

# 指定product表分布的情况,配置表在哪个数据库里,表的名称都是什么 m1.product_1,m1.product_2
spring.shardingsphere.sharding.tables.product.actual-data-nodes=m1.product$->{1..2}

# 指定 product 表里面主键 cid 的生成策略 SNOWFLAKE
#key-generator属性配置了他的主键列以及主键生成策略。
#ShardingJDBC默认提供了UUID和SNOWFLAKE两种分布式主键生成策略。
#spring.shardingsphere.sharding.tables.product.key-generator.column=id
#spring.shardingsphere.sharding.tables.product.key-generator.type=SNOWFLAKE

# 配置分表策略  约定 cid 值偶数添加到 product 1表,如果 cid 是奇数添加到 product2表
spring.shardingsphere.sharding.tables.product.table-strategy.inline.sharding-column=id
spring.shardingsphere.sharding.tables.product.table-strategy.inline.algorithm-expression=product$->{id % 2 + 1}

# 打开 sql 输出日志
spring.shardingsphere.props.sql.show=true

测试代码运行

@Test
public void addProduct() {
    for (int i = 1; i < 50; i++) {
        int randomInt = RandomUtil.randomInt(1, 100);
        Product product = new Product();
        product.setId(Long.valueOf(i));
        product.setCname("小米su7");
        product.setShelf_id(randomInt+1l);
        product.setStatus("小米");
        productMapper.insert(product);
    }

}
@Test
public void select(){
    QueryWrapper<Product> queryWrapper = new QueryWrapper();
    List<Product> products = productMapper.selectList(queryWrapper);
    System.out.println(products);
}

2.分库分表

配置对应实体类以及 Mapper

# sharding-jdbc 水平分库分表策略
# 配置数据源,给数据源起别名
# 水平分库需要配置多个数据库
spring.shardingsphere.datasource.names=m1,m2

# 一个实体类对应两张表,覆盖
spring.main.allow-bean-definition-overriding=true

# 配置第一个数据源的具体内容,包含连接池,驱动,地址,用户名,密码
spring.shardingsphere.datasource.m1.type=com.alibaba.druid.pool.DruidDataSource
spring.shardingsphere.datasource.m1.driver-class-name=com.mysql.cj.jdbc.Driver
spring.shardingsphere.datasource.m1.url=jdbc:mysql://localhost:3306/product_db_1?useUnicode=true&characterEncoding=utf8&useSSL=false&serverTimezone=Asia/Shanghai&tinyInt1isBit=false

spring.shardingsphere.datasource.m1.username=root
spring.shardingsphere.datasource.m1.password=123456

# 配置第二个数据源的具体内容,包含连接池,驱动,地址,用户名,密码
spring.shardingsphere.datasource.m2.type=com.alibaba.druid.pool.DruidDataSource
spring.shardingsphere.datasource.m2.driver-class-name=com.mysql.cj.jdbc.Driver
spring.shardingsphere.datasource.m2.url=jdbc:mysql://localhost:3306/product_db_2?useUnicode=true&characterEncoding=utf8&useSSL=false&serverTimezone=Asia/Shanghai&tinyInt1isBit=false

spring.shardingsphere.datasource.m2.username=root
spring.shardingsphere.datasource.m2.password=123456

# 指定数据库分布的情况和数据表分布的情况
# m1 m2   product_1 product_2
spring.shardingsphere.sharding.tables.product.actual-data-nodes=m$->{1..2}.product$->{1..2}

# 指定 course 表里面主键 id 的生成策略 SNOWFLAKE

# 指定分库策略    约定 shelf_id 值偶数添加到 m1 库,如果 shelf_id 是奇数添加到 m2 库

spring.shardingsphere.sharding.tables.product.database-strategy.inline.sharding-column=shelf_id
spring.shardingsphere.sharding.tables.product.database-strategy.inline.algorithm-expression=m$->{shelf_id % 2 + 1}

# 指定分表策略    约定 id 值偶数添加到 product_1 表,如果 id 是奇数添加到 product_2 表
spring.shardingsphere.sharding.tables.product.table-strategy.inline.sharding-column=id
spring.shardingsphere.sharding.tables.product.table-strategy.inline.algorithm-expression=product$->{id % 2 + 1}

# 打开 sql 输出日志
spring.shardingsphere.props.sql.show=true

测试代码运行

@Test
public void addProduct() {
    for (int i = 1; i < 50; i++) {
        int randomInt = RandomUtil.randomInt(1, 100);
        Product product = new Product();
        product.setId(Long.valueOf(i));
        product.setCname("小米su7");
        product.setShelf_id(randomInt+1l);
        product.setStatus("小米");
        productMapper.insert(product);
    }

}
@Test
public void select(){
    QueryWrapper<Product> queryWrapper = new QueryWrapper();
    List<Product> products = productMapper.selectList(queryWrapper);
    System.out.println(products);
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2055458.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么才能真正学好网络安全?一文搞懂网络安全体系

文章目录 前言 网络安全研发具体干什么&#xff1f;二进制安全具体干什么&#xff1f;网络渗透具体干什么&#xff1f;网络渗透方向的工作有下面几个方向&#xff1a;网络安全的学习路线网络安全的学习路线大纲网络安全初体验学习方法 如何入门学习网络安全【黑客】 【----帮助…

suricata编译安装和运行

目录 编译安装 运行 调试 编译安装 apt -y install autoconf automake build-essential cargo \ libjansson-dev libpcap-dev libpcre2-dev libtool \ libyaml-dev make pkg-config rustc zlib1g-dev apt-get install libpcre3-dev wget https://www.openin…

Python编码系列—Python数据可视化:Matplotlib与Seaborn的实战应用

&#x1f31f;&#x1f31f; 欢迎来到我的技术小筑&#xff0c;一个专为技术探索者打造的交流空间。在这里&#xff0c;我们不仅分享代码的智慧&#xff0c;还探讨技术的深度与广度。无论您是资深开发者还是技术新手&#xff0c;这里都有一片属于您的天空。让我们在知识的海洋中…

google浏览器chrome用户数据(拓展程序,书签等)丢失问题

一、问题背景 我出现这个情况的问题背景是&#xff1a;因为C盘块满了想清理一部分空间&#xff08;具体看这&#xff1a;windows -- C盘清理_c盘softwaredistribution-CSDN博客&#xff09;&#xff0c;于是找到了更改AppDatta这个方法&#xff0c;但因为&#xff0c;当时做迁移…

ZooKeeper 的四种 Znode (数据节点)类型

ZooKeeper 的四种 Znode &#xff08;数据节点&#xff09;类型 1. PERSISTENT&#xff08;持久节点&#xff09;2. EPHEMERAL&#xff08;临时节点&#xff09;3. PERSISTENT_SEQUENTIAL&#xff08;持久顺序节点&#xff09;4. EPHEMERAL_SEQUENTIAL&#xff08;临时顺序节点…

Zookeeper 如何保证事务的顺序一致性

Zookeeper 如何保证事务的顺序一致性 1、ZXID&#xff1a;唯一事务标识2、两阶段提交协议3、同步与复制 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; Apache ZooKeeper 通过几个关键机制来确保事务的顺序一致性&#xff0c;这些机制包括全…

【正点原子K210连载】第三十一章 视频播放实验 摘自【正点原子】DNK210使用指南-CanMV版指南

1&#xff09;实验平台&#xff1a;正点原子ATK-DNK210开发板 2&#xff09;平台购买地址https://detail.tmall.com/item.htm?id731866264428 3&#xff09;全套实验源码手册视频下载地址&#xff1a; http://www.openedv.com/docs/boards/xiaoxitongban 第三十一章 视频播放…

案例分析:多线程锁该如何优化?

我们在前面几篇中&#xff0c;了解到可以使用 ThreadLocal&#xff0c;来避免 SimpleDateFormat 在并发环境下引起的时间错乱问题。其实还有一种解决方式&#xff0c;就是通过对parse 方法进行加锁&#xff0c;也能保证日期处理类的正确运行 其实锁对性能的影响&#xff0c;是非…

.NET系列 定时器

net一共&#xff14;种定时器 System.Windows.Forms.Timer 类型 》》WinForm专用System.Windows.Threading.DispatcherTime类型》》WPF专用System.Threading.Timer类型》》》它使用 ThreadPool 线程来执行定时操作System.Timers.Timer类型 》》这种很老了。 它使用基于底层计时…

leetcode刷题-动态规划part02

代码随想录动态规划part02|62.不同路径 、63.不同路径II 、343. 整数拆分、 62.不同路径63.不同路径 II343. 整数拆分 再看本题思路并不容易想&#xff0c;一刷建议可以跳过。如果学有余力&#xff0c;可以看视频理解一波。 96.不同的二叉搜索树 跳过 62.不同路径 leetcode题目…

Netty源码小窥探(一)

记录背景 最近在学习Netty&#xff0c;阅读了部分源码&#xff0c;记录一下笔记&#xff0c;方便自己回顾和也希望能作为初学的小伙伴们的部分参考。 本次Netty源码小窥探会是一个小合集&#xff0c;因为个人能力有限&#xff0c;介绍程度肯定不会太深奥&#xff0c;个人是基…

记录|链接MySQL数据库实现学生管理系统

目录 前言一、管理系统的后台数据库1.1 创建DB库1.2 创建login表和student表login表student表 二、窗体创建1.1 VS项目框架1.2 窗口1设计&#xff1a;登录窗口所需控件界面效果 1.3 窗口2设计&#xff1a;学生信息管理界面添加新界面所需控件界面效果 1.4 窗口3设计&#xff1a…

用低代码平台搭建了一套贷前进件系统,1天搞定!

贷前进件系统是什么 贷前进件系统是指金融机构&#xff08;如银行、消费金融公司等&#xff09;在贷款申请过程中&#xff0c;用于收集、整理、审核和管理借款人申请资料的系统。该系统是贷款流程中的重要环节&#xff0c;主要作用在于提高贷款申请的处理效率&#xff0c;降低…

滑动变阻器的未来发展趋势和前景如何?是否有替代品出现?

滑动变阻器是常见的电子元件&#xff0c;主要用于调节电路中的电阻值。随着科技的不断发展&#xff0c;滑动变阻器的未来发展趋势和前景也引起了广泛关注。 滑动变阻器的未来发展将更加注重智能化&#xff0c;随着物联网、人工智能等技术的快速发展&#xff0c;滑动变阻器也将与…

Transformer中的位置编码:绝对位置编码、相对位置编码与旋转位置编码

1. 引言 Transformer模型自2017年提出以来&#xff0c;凭借其在序列到序列任务中的优异表现&#xff0c;迅速成为自然语言处理&#xff08;NLP&#xff09;领域的主流模型。与传统的循环神经网络&#xff08;RNN&#xff09;不同&#xff0c;Transformer模型完全基于自注意力机…

Java 入门指南:反射机制

RTTI RTTI&#xff08;Run-Time Type Identification&#xff09;是一种在运行时确定对象类型的机制。它是一种编程语言特性&#xff0c;主要用于在运行时动态识别和处理对象的实际类型。 通过 RTTI&#xff0c;可以在运行时根据对象的实际类型执行相应的操作。这在处理多态对…

sdn nce insight

SDN&#xff08;Software-Defined Networking&#xff09; 和 NFV&#xff08;Network Functions Virtualization&#xff09; 是现代网络架构中的两项关键技术&#xff0c;它们共同推动了网络的虚拟化、自动化和灵活性。尽管它们各自有不同的焦点和应用领域&#xff0c;但通常…

HarmonyOS应用四之页面加载构建以及数据请求

目录&#xff1a; 1、加载网络页面/本地页面/html页面2、页面布局3、HTTP/HTTPS的数据请求4、上传图片并保存数据 1、加载网络页面/本地页面/html页面 // xxx.ets import { webview } from kit.ArkWeb; import { BusinessError } from kit.BasicServicesKit;Entry Component s…

Java面试八股之消息队列中推模式和拉模式分别有哪些使用场景

消息队列中推模式和拉模式分别有哪些使用场景 消息队列的推模式&#xff08;Push&#xff09;和拉模式&#xff08;Pull&#xff09;各有不同的使用场景和优缺点。下面我会详细介绍这两种模式及其适用场景&#xff1a; 推模式&#xff08;Push&#xff09; 特点&#xff1a;…

进哥在线shinyapps工具(自备)

Jingle’s shinyapps toolkit – 王进的个人网站 (jingege.wang) 一些常用生物信息学分析可视化apps&#xff0c;以及一些分子生物学分析工具&#xff08;尴尬&#xff0c;一直忘记附上链接&#xff09; Jingles toolkit 可以进行多种分析&#xff1a; 1. General plots示例…