Mysql 深度分页查询优化

news2024/12/18 0:06:40

Mysql 分页优化

1. 问题根源

问题: mysql在数据量大的时候,深度分页数据偏移量会增大,导致查询效率越来越低。
问题根源:
当使用 LIMIT 和 OFFSET 进行分页时,MySQL 必须扫描 OFFSET + LIMIT 行,然后丢弃前 OFFSET 行。这意味着随着分页的深入,MySQL 需要扫描的行数会越来越多,导致查询性能下降。

例如,以下查询用于获取第 10001 到第 10010 行的数据:

SELECT * FROM table_name ORDER BY age LIMIT 10 OFFSET 10000;

在这种情况下,MySQL 必须扫描 10010 行,即使只返回 10 行。这种扫描和丢弃操作会导致大量的 I/O 操作,特别是在表数据量很大的情况下。

2. 优化方案

此问题整理出3个有效的优化方案。

2.1 方案1:索引优化

确保在用于排序和过滤的列上创建适当的索引,索引可以显著减少 MySQL 需要扫描的行数。

例如,如果 where 查询语句中包含 id 列排序,确保 id 列是索引列。否则的话,可能 MySQL 会扫描所有行,从而导致性能下降。


SELECT * FROM table_name ORDER BY id LIMIT 10 OFFSET 10000;

使用索引优化查询这种方法通过避免使用 OFFSET,减少了不必要的行扫描。

2.2 方案2:使用覆盖索引

使用联合索引,查询结果集为联合索引的列,可以提高深分页的查询效率;(但是不适用于频繁的增加查询字段的业务场景,因为需要联合索引也需要进行添加,否则添加的查询字段会进行回表,会增加执行时间)


-- 创建一个column1, column2的组合索引
CREATE INDEX idx_cover ON table_name (column1, column2);

-- 使用覆盖索引查询column1, column2
SELECT column1, column2 FROM table_name WHERE column1 = ? AND column2 = ?;

上面的示例中,查询只需从索引中获取数据,而不需要访问表的数据页,因此可以避免回表操作,从而提升性能。

2.3. 方案3:手动回表

针对优化方案2中在新增字段后,回表问题。方案3提出手动回表,提高执行效率。使用子查询查询出id的结果集,根据id手动回表查询,其他非索引字段,通过减少数据偏移量优化。(但是不适用与子查询中结果集过大,也会导致查询效率低)

2.4. 方案4:标记

结果业务场景,进行范围查询,需要前端配合,在翻页的时候将范围查询的最后一项参数传入后端
或者标记分页,通过保存上一次查询的最后一个记录的标记(通常是唯一标识符)来实现的,这种方法不使用 OFFSET,而是使用** WHERE **子句来获取下一页的数据:


SELECT * FROM table_name
WHERE id > last_id
ORDER BY id
LIMIT 20;

这种方法尤其适用于有序的、连续的分页请求。

2.5. 方案5:分区表

如果数据集非常大,可以考虑使用表分区。分区可以将表分成更小的块,从而减少每次查询需要扫描的数据量。MySQL 支持多种分区方法,如范围分区、列表分区等。

如下示例:假设有一个包含销售记录的表 sales,其中有一列 sale_date,表示销售的日期。我们希望按年份对这个表进行分区,以便更高效地进行查询。

2.5.1 创建表并按范围分区

CREATE TABLE sales (
    sale_id INT PRIMARY KEY,
    product_id INT,
    quantity INT,
    sale_date DATE
)
PARTITION BY RANGE (YEAR(sale_date)) (
    PARTITION p2021 VALUES LESS THAN (2022),
    PARTITION p2022 VALUES LESS THAN (2023),
    PARTITION p2023 VALUES LESS THAN (2024)
);

在这个示例中,sales 表被分成三个分区:

  • p2021 包含所有 sale_date 在 2021 年的记录。
  • p2022 包含所有 sale_date 在 2022 年的记录。
  • p2023 包含所有 sale_date 在 2023 年的记录。

每个分区都是独立的物理存储单元,因此查询可以只访问相关的分区。

2.5.2 插入数据

当插入数据时,MySQL 会根据 sale_date 自动将记录放入相应的分区。


INSERT INTO sales (sale_id, product_id, quantity, sale_date) VALUES
(1, 101, 5, '2021-06-15'),
(2, 102, 10, '2022-07-20'),
(3, 103, 8, '2023-03-10');

2.5.3 查询分区表

查询分区表时,MySQL 会自动确定需要访问哪些分区。例如:


SELECT * FROM sales WHERE sale_date BETWEEN '2022-01-01' AND '2022-12-31';

在这个查询中,MySQL 只会访问 p2022 分区,从而提高查询性能。

2.5.4 其他分区类型

除了范围分区(RANGE),MySQL 还支持其他几种分区类型,包括:

  • 列表分区(LIST):根据离散值列表进行分区。
  • 哈希分区(HASH):使用哈希函数将数据分布到多个分区。
  • 键分区(KEY):类似于哈希分区,但使用 MySQL 的内部哈希算法。
  • 线性哈希分区(LINEAR HASH):一种特殊的哈希分区,适用于特定的负载和数据分布。
2.5.5 缓存结果

如果分页查询的结果不会频繁变化,可以考虑缓存查询结果。缓存可以显著减少数据库的负载,尤其是在高并发的场景下。

2.6 使用外部搜索引擎

对于特别复杂或数据量巨大的场景,可以考虑使用外部搜索引擎,如 Elasticsearch 或 Solr。这些工具专为处理大数据集和复杂查询而设计,通常比传统数据库更高效。

3. 实践中的注意事项

  • 合理选择分页大小: 分页大小直接影响查询性能和用户体验。较小的分页大小可以减少每次查询的负担,但会增加分页请求的次数。选择合适的分页大小需要权衡这两者的关系。

  • *监控和分析查询性能:*使用 MySQL 的性能监控工具(如 EXPLAIN 和慢查询日志)来分析查询的执行计划和性能瓶颈。

  • 考虑用户体验:在某些情况下,用户可能并不需要非常精确的分页数据。可以考虑使用“加载更多”按钮或无限滚动来替代传统分页。

4. 总结

本文,我们分析了 MySQL 的深度分页问题以及解决方案。对于 MySQL 中的深度分页,我们可以通过合理的优化策略来提高查询效率。具体选用什么方案,我们需要具体场景具体分析,但是核心还是在于理解数据库的工作原理,利用索引、优化查询策略、使用标记分页、分区表、缓存结果等些优化技术。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2261308.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot - 动态端口切换黑魔法

文章目录 关键技术点核心原理Code 关键技术点 利用 Spring Boot 内嵌 Servlet 容器 和 动态端口切换 的方式实现平滑更新的方案,关键技术点如下: Servlet 容器重新绑定端口:Spring Boot 使用 ServletWebServerFactory 动态设置新端口。零停…

linux(CentOS8)安装PostgreSQL16详解

文章目录 1 下载安装包2 安装3 修改远程连接4 开放端口 1 下载安装包 官网下载地址:https://www.postgresql.org/download/ 选择对应版本 2 安装 #yum源 yum -y install wget https://download.postgresql.org/pub/repos/yum/reporpms/EL-8-x86_64/pgdg-redha…

spring学习(spring-bean实例化(无参构造与有参构造方法实现)详解)

目录 一、spring容器之bean的实例化。 (1)"bean"基本概念。 (2)spring-bean实例化的几种方式。 二、spring容器使用"构造方法"的方式实例化bean。 (1)无参构造方法实例化bean。 &#…

ElasticSearch学习5

基本Rest命令说明: method url地址 描述 PUT(创建,修改) localhost:9200/索引名称/类型名称/文档id 创建文档(指定文档id) POST(创建) localhost:9200/索引名称/类型名称 创建文档&…

分享本周所学——三维重建算法3D Gaussian Splatting(3DGS)

大家好,欢迎来到《分享本周所学》第十二期。本人是一名人工智能初学者,刚刚读完大二。前几天自学了一下3D Gaussian Splatting(3DGS),觉得非常有意思。写这篇文章主要是因为网上大部分关于3DGS的文章都比较晦涩&#x…

【中工开发者】鸿蒙商城app

这学期我学习了鸿蒙,想用鸿蒙做一个鸿蒙商城app,来展示一下。 项目环境搭建: 1.开发环境:DevEco Studio2.开发语言:ArkTS3.运行环境:Harmony NEXT base1 软件要求: DevEco Studio 5.0.0 Rel…

【Qt】按钮类控件:QPushButton、QRadioButton、QCheckBox、ToolButton

目录 QPushButton 例子: QRadioButton 例子: 按钮的常见信号函数 单选按钮分组 例子: QCheckButton 例子: QToolButton QWidget的常见属性及其功能对于它的派生类控件都是有效的(也就是Qt中的各种控件),包括…

UI框架DevExpress XAF v24.2新功能预览 - .NET Core / .NET增强

DevExpress XAF是一款强大的现代应用程序框架,允许同时开发ASP.NET和WinForms。DevExpress XAF采用模块化设计,开发人员可以选择内建模块,也可以自行创建,从而以更快的速度和比开发人员当前更强有力的方式创建应用程序。 在上文中…

ArrayList源码分析、扩容机制面试题,数组和List的相互转换,ArrayList与LinkedList的区别

目录 1.java集合框架体系 2. 前置知识-数组 2.1 数组 2.1.1 定义: 2.1.2 数组如何获取其他元素的地址值?(寻址公式) 2.1.3 为什么数组索引从0开始呢?从1开始不行吗? 3. ArrayList 3.1 ArrayList和和…

阿里云服务器手动部署LNMP环境【官方文档注意事项】

这是官方文档 注意&#xff1a; 要添加安全组&#xff0c;端口为80。否则最后用浏览器访问公网IP没有结果。 Mysql密码策略要求密码至少包含一个大写字母、一个小写字母、一个数字和一个特殊字符&#xff0c;并且密码总长度至少为 8 个字符。sudo mysqladmin -uroot -p<ol…

Invalid default value for ‘gender‘,mysql在idea中字符集设置,default

默认值default创建错误的&#xff0c;设置数据库字符集 我的错误&#xff1a;Invalid default value for ‘gender’ -- 修改数据库字符集 alter database db01 charset utf8;

240004基于Jamva+ssm+maven+mysql的房屋租赁系统的设计与实现

基于ssmmavenmysql的房屋租赁系统的设计与实现 1.项目描述2.运行环境3.项目截图4.源码获取 1.项目描述 该项目在原有的基础上进行了优化&#xff0c;包括新增了注册功能&#xff0c;房屋模糊查询功能&#xff0c;管理员和用户信息管理等功能&#xff0c;以及对网站界面进行了优…

使用Navicat从SQL Server导入表数据到MySQL

在表上右键选择导入向导 选择ODBC 1.内输入ip即可&#xff0c;不需要端口号 一定要勾选允许保存密码 选择需要的表&#xff0c;下一步 根据需求&#xff0c;可修改表名、是否新建表 根据需求修改不同表的字段类型和长度 按需选择导入方式

STM32F407+LAN8720A +LWIP +FreeRTOS ping通

使用STM32CUBEIDE自带的 LWIP和FreeROTS 版本说明STM32CUBEIDE 操作如下1. 配置RCC/SYS2. 配置ETH/USART3. 配置EHT_RESET/LED4. 配置FreeRTOS5. 配置LWIP6. 配置时钟7. 生成单独的源文件和头文件,并生成代码8. printf重定义9. ethernetif.c添加lan8720a复位10. MY_LWIP_Init …

用 Python Turtle 绘制经典汤姆猫:重温卡通角色的经典魅力

用 Python Turtle 绘制经典汤姆猫&#xff1a;重温卡通角色的经典魅力 &#x1f438; 前言 &#x1f438;&#x1f41e;往期绘画>>点击进所有绘画&#x1f41e;&#x1f40b; 效果图 &#x1f40b;&#x1f409; 代码 &#x1f409; &#x1f438; 前言 &#x1f438; 汤…

RabbitMQ个人理解与基本使用

目录 一. 作用&#xff1a; 二. RabbitMQ的5中队列模式&#xff1a; 1. 简单模式 2. Work模式 3. 发布/订阅模式 4. 路由模式 5. 主题模式 三. 消息持久化&#xff1a; 消息过期时间 ACK应答 四. 同步接收和异步接收&#xff1a; 应用场景 五. 基本使用 &#xff…

Y3编辑器文档4:触发器1(界面及使用简介、变量作用域、入门案例)

文章目录 一、触发器简介1.1 触发器界面1.2 ECA语句编辑及快捷键1.3 参数设置1.4 变量设置1.5 实体触发器1.6 触发器复用 二、触发器的多层结构2.1 子触发器&#xff08;在游戏内对新的事件进行注册&#xff09;2.2 触发器变量作用域 三、入门案例3.1 使用触发器实现瞬间移动3.…

【DBeaver】连接带kerberos的hive[Apache|HDP]

目录 一、安装配置Kerberos客户端环境 1.1 安装Kerberos客户端 1.2 环境配置 二、基于Cloudera驱动创建连接 三、基于Hive原生驱动创建连接 一、安装配置Kerberos客户端环境 1.1 安装Kerberos客户端 在Kerberos官网下载,地址如下&#xff1a;https://web.mit.edu/kerberos…

bug:uniapp运行到微信开发者工具 白屏 页面空白

1、没有报错信息 2、预览和真机调试都能正常显示&#xff0c;说明代码没错 3、微信开发者工具版本已经是win7能装的最高版本了&#xff0c;1.05版 链接 不打算回滚旧版本 4、解决&#xff1a;最后改调试基础库为2.25.4解决了&#xff0c;使用更高版本的都会报错&#xff0c;所…

【前端】JavaScript自定义 forEach方法详解与原理分析

博客主页&#xff1a; [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: 前端 文章目录 &#x1f4af;前言&#x1f4af;题目演示与效果演示代码控制台输出结果 &#x1f4af;代码分析与源理解释1. 构造函数 Brray2. 实例化 Brray3. 调用自定义的 forEach &#x1f4af;比较与拓展1. 比较原…