分库分表基本概念讲解

分库分表基本概念讲解

news2026/3/26 1:08:16

一、基本概念

产生背景

在数据爆炸的年代，单表数据达到千万级别，甚至过亿的量，都是很常见的情景。这时候再对数据库进行操作就是非常吃力的事情了，select个半天都出不来数据，这时候业务已经难以维系。不得已，分库分表提上日程，我们的目的很简单，减小数据库的压力，缩短表的操作时间。

分表是什么

分表是指在一个或者多个数据库实例内，将一张表拆分为多张表存储。一般来说，分表是因为该表需要存储很庞大的记录数，如果将其堆积到一起，就会导致数据量过于庞大（一般 MySQL 的表是 5000 万条记录左右）引发性能瓶颈。一般分表会按照某种算法进行拆分，如交易记录，可能按年份拆分:

分库是什么

分库是指将一套数据库的设计结构，部署到多个数据库实例的节点中去，在应用的时候，按照一定的方法通过多个数据库实例节点访问数据。请注意，这里的数据库实例节点是一个逻辑概念，不是一个物理概念，什么意思呢？简单地说，一个机器节点可以部署多个数据库实例节点，也可以一个机器节点只部署一个数据库实例节点，所以机器节点不一定等于数据库节点。而机器节点是物理概念，是看得到的真实的机器；数据库节点是逻辑概念，是看不到的东西。为了更好地说明分库的概念,如下图

二、为什么要分库分表

移动互联网时代，海量的用户每天产生海量的数量，比如：

用户表：以支付宝用户为例，8亿；微信用户更是多大10亿。
订单表：比如美团外卖，每天都是几千万的订单
交易流水表：淘宝的历史订单总量应该是百亿，甚至是千亿级别

这些海量数据远不是一张表能Hold住的

事实上MySQL单表可以存储10亿级数据，只是这时候性能比较差，业界公认MySQL单表容量在1KW以下是最佳状态，因为这是它的BTREE索引树高在3~5之间。

既然一张表无法搞定，那么就想办法将数据放到多个地方，目前比较普遍的方案有3个：

分区
分库分表
NoSQL/NewSQL：redis或mongo，TiDB

既然表的扩展有三种方案，那为什么要采用分库分表，而不采用另外两种呢？

下面将分别介绍

1、为什么不采取分区方案

分区技术与分表技术很类似，只是分区技术属于数据库内部的技术，对于开发者来说，它逻辑上
仍旧是一张表，开发时不需要改变 SQL 表名。将一张表切分为多个物理区块

由于仍然是同一张表，所以也根本解决不了单表的瓶颈问题

2、为什么不采取NoSQL/NewSQL方案

目前绝大部分项目对于NoSQL/NewSQL的定位还是为辅，真正的核心数据还是要基于事务的关系型数据库，一些缓存中间件只是对MySQL的补充、增强而已

3、为什么要进行分库分表

所以我们还是要对关系型数据库本身做扩展，真正做到把大表分离开，解决单表的瓶颈问题

三、分库分表常用中间件的介绍

分库分表之后，比如我们要插入一条数据，该插入到哪一张子表中呢，查询某条数据又该从哪一张子表查呢？这有很多的中间件来帮我们完成这些事情

常用的分库分表中间件：

阿里的TDDL,DRDS和cobar
开源社区的Sharding-jdbc
民间组织的MyCAT
360的Atlas

按照架构类型划分

Client模式
Proxy模式

Client模式

代表有阿里的TDDL，开源社区的sharding-jdbc（sharding-jdbc的3.x版本即sharding-sphere已经支持了proxy模式）。架构如下：

中间件是嵌入到我们的应用中的

Proxy模式

代表有阿里的cobar，民间组织的MyCAT。架构如下：

可以看到，中间件作为代理，替我们去与数据库进行交互

优缺点对比：

client优点：

实现简单，易于使用，因为中间件作为客户端库集成在应用程序中
天然去中心化，不需要单独部署中间件

client缺点：

无法跨语言。还有版本升级很困难，耦合度非常高，因为是与应用代码绑在一起的
对应用有一定侵入性，需要在应用代码中集成和配置中间件。

proxy优点：

多语言支持,对业务开发透明，应用可以像操作单个数据库一样操作分库分表
天然去中心化，不需要单独部署中间件

proxy缺点：

实现复杂，因为代理需要实现数据库通信协议
Proxy本身需要保证高可用，否则Proxy的故障会影响整个数据库的访问。
需要考虑租户隔离，多个应用访问Proxy代理的底层数据库时，需要处理好资源竞争问题。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2258059.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

华为自反ACL实验

华为自反ACL实验

一、实验背景做这个实验的原因是最近公司里上了三台小程序服务器，由于三台服务器的端口都映射出去了，领导要求A网段的三台服务器不能访问内网B，C网段，同时B、C网段内网用户可以访问A段的94、95、96服务器； 也就是PC4\…

阅读更多...

美图撕掉蔡文胜标签

美图撕掉蔡文胜标签

卖掉比特币的美图不投机了。作者|周立青编辑|杨舟 12月5日，比特币突破10万美元大关，曾花费1亿美元购入虚拟货币的美图宣布已出售所有加密货币。美图在港交所发布公告称，自2024年11月起，公司已开始出售其持有的加密货币&…

阅读更多...

git拉取代码报错问题:Pulling is not possible because you have unmerged files. hint

git拉取代码报错问题:Pulling is not possible because you have unmerged files. hint

我们在工作中，需要切换到另外一个分支，拉取代码的时候会报这样的问题： Pulling is not possible because you have unmerged files. hint: Fix them up in the work tree, and then use git add/rm <file> hint: as appropriate to ma…

阅读更多...

青训营-豆包MarsCode技术训练营试题解析三十七

青训营-豆包MarsCode技术训练营试题解析三十七

引言随着AI领域的发展，底层算法确实起到了决定性的作用。为了跟上这个快速发展的领域，我们需要不断学习和提升自己的技能。刷题是一种很好的方式，可以帮助我们巩固基础知识，提高解决问题的能力。介绍 ‌豆包青训营‌是由字节…

阅读更多...

openlayers地图缓存添加

openlayers地图缓存添加

//通过安装包localforage（npm install localforage）或https://cdnjs.cloudflare.com/ajax/libs/localforage/1.10.0/localforage.min.js tileCacheStore.js import localforage from localforage var tileCacheStorenull;// 从缓存中获取该瓦片 functio…

阅读更多...

《IP 电话：选型指南与应用优势》

《IP 电话：选型指南与应用优势》

《IP 电话：选型指南与应用优势》一、IP 电话概述二、IP 电话的选型1. 功能与应用2. 性能及可靠性3. 兼容及可升级性4. 外观设计及管理需求5. 性价比三、IP 电话的应用场景1. 企业办公2. 工厂和仓库3. 酒店和旅游业4. 医疗机构5. 零售业6. 教育机构7. 个人用户四、…

阅读更多...

解决Logitech G hub 无法进入一直转圈的方案（2024.12）

解决Logitech G hub 无法进入一直转圈的方案（2024.12）

如果你不是最新版本无法加载尝试以下方案：删除AppData 文件夹下的logihub文件夹具体路径：用户名根据实际你的请情况修改 C:\Users\Administrator\AppData\Local 如果你有通过lua编译脚本，记得备份！！ ↓如果你是最新…

阅读更多...

[网络爬虫] Jsoup : HTML 解析工具

[网络爬虫] Jsoup : HTML 解析工具

1 概述简介 Jsoup是一款基于Java的HTML解析器，它提供了一种简单、灵活且易于使用的API，用于从URL、文件或字符串中解析HTML文档。它可以帮助开发人员从HTML文档中提取数据、操作DOM元素、处理表单提交等。主要特点 Jsoup的主要特点包括： 简…

阅读更多...

top命令和系统负载

top命令和系统负载

1 top中的字段说明 top是一个实时系统监视工具，可以动态展现出 CPU 使用率、内存使用情况、进程状态等信息，注意这些显示的文本不能直接使用 > 追加到文件中。 [rootvv~]# top -bn 1 | head top - 20:08:28 up 138 days, 10:29, 4 users, load av…

阅读更多...

golang实现简单的redis服务4(实现过期时间功能)

golang实现简单的redis服务4(实现过期时间功能)

为什么要做过期时间?redis失效时间是如何做的redis有那些过期策略,优缺点,实现原理?redis使用的什么方案 redis 有那些内存淘汰策略?常用的是什么,为什么?noeviction: 不处理lru: 未使用时间最久的keylfu: 使用次数最少的keyrandom: 随机keyvolatile与allkeys的区别仓库地…

阅读更多...

VMware：如何在CentOS7上开启22端口

VMware：如何在CentOS7上开启22端口

打开虚拟机：【编辑】【虚拟机网络设置】其中填入的虚拟机IP地址是虚拟机中centos的IP地址，虚拟机端口为需要映射的centos端口配置好之后保存，打开宿主机 win cmd telnet 192.168.1.26 22 如果出现上述窗口，则说明已经成功开放…

阅读更多...

项目中使用AntV L7地图（五）添加飞线

项目中使用AntV L7地图（五）添加飞线

项目中使用AntV L7地图，添加飞线文档地址：https://l7.antv.antgroup.com/zh/examples/line/animate/#trip_animate 一、初始化地图使用的地图文件为四川地图JSON，下载地址:https://datav.aliyun.com/portal/school/atlas/area_selector#&…

阅读更多...

基于FPGA的智能电子密码指纹锁（开源全免）

基于FPGA的智能电子密码指纹锁（开源全免）

基于FPGA的智能电子密码指纹锁一、功能描述硬件资源需求二、整体框架知识准备AS608指纹模块4*4数字键盘模块三、Verilog代码实现以及仿真验证1.AS608_data模块2.check_hand模块3.four_four_key模块4.check_mima模块5.change_mima模块6.seg_ctrl模块7.uart_top模块8.key_debo…

阅读更多...

【Vue2+Element-ui】el-dialog宽度适配

【Vue2+Element-ui】el-dialog宽度适配

1、不适配问题分辨率100%-页面分辨率150%-页面在项目中，我开发分辨率一直是100%，但是客户使用的分辨率不相同，所以宽度要适配 2、解决-封装mixins.js 1)、封装的mixins 我将宽度设置成动态的，因为我的项目中需求不同。 expor…

阅读更多...

css矩形样式，两边圆形

css矩形样式，两边圆形

废话不多说，代码如下，直接拷贝即可使用： index.vue文件 <template><view class"wrap"><view class"tabs"><view class"tab active"><view class"name">标签</view…

阅读更多...

【OpenCV】图像阈值

【OpenCV】图像阈值

简单阈值法此方法是直截了当的。如果像素值大于阈值，则会被赋为一个值（可能为白色），否则会赋为另一个值（可能为黑色）。使用的函数是 cv.threshold。第一个参数是源图像，它应该是灰度图像。第二…

阅读更多...

使用微信小程序调用飞桨PaddleX平台自行训练的模型——微信小程序用训练的牡丹花模型Demo测试

使用微信小程序调用飞桨PaddleX平台自行训练的模型——微信小程序用训练的牡丹花模型Demo测试

🎼个人主页：【Y小夜】 😎作者简介：一位双非学校的大二学生，编程爱好者， 专注于基础和实战分享，欢迎私信咨询！ 🎆入门专栏：🎇【MySQL&#xff0…

阅读更多...

Wordpress设置固定链接形式后出现404错误

Wordpress设置固定链接形式后出现404错误

比如固定连接设置为 /archives/%post_id%.html 这种形式，看起来比较舒服。对搜索引擎也友好。出现404需要设置伪静态

阅读更多...

JavaWeb学习--cookie和session，实现登录的记住我和验证码功能

JavaWeb学习--cookie和session，实现登录的记住我和验证码功能

目录 （一）Cookie概述 1.什么叫Cookie 2.Cookie规范 3.Cookie的覆盖 4.cookie的最大存活时间 （Cookie的生命） （二） Cookie的API 1.创建Cookie：new 构造方法 2.保存到客户端浏…

阅读更多...

Linux网络测试指令

Linux网络测试指令

Ping Ping命令是一个网络工具，用于测试主机之间的可达性。它通过发送ICMP（Internet Control Message Protocol）回声请求消息到目标主机，并等待接收ICMP回声应答消息来判断目标是否可达以及测量往返时间。Ping命令对于诊断网络连接…

阅读更多...

推荐文章

最新文章