MySQL limit子句用法及优化(Limit Clause Optimization)

news2025/2/25 11:22:03

在MySQL中,如果只想获取select查询结果的一部分,可以使用limit子句来限制返回记录的数量,limit在获取到满足条件的数据量时即会立刻终止SQL的执行。相比于返回所有数据然后丢弃一部分,执行效率会更高。

文章目录

  • 一、limit子句用法示例
    • 1.1 基本用法
    • 1.2 limit和order by
      • 1.2.1 排序瓶颈优化
  • 二、limit分页优化
    • 2.1 延迟关联
    • 2.2 转换为位置查询
    • 2.3 记录偏移位置

一、limit子句用法示例

limit子句通常放在select查询的最后,语法是limit [offset,] rowcount :

  • limit m,n 返回偏移量为m之后的n条数据,即先获取m+n条记录,然后丢弃前面的m条,返回之后的n条记录
  • limit n 返回开头的n条数据,相当于limit 0, n

1.1 基本用法

新建一张测试表并填充几条数据:

create table test(
id int auto_increment primary key,
name varchar(32),
salary decimal(10,2));

insert into test values(null, 'aaa',1000),(null, 'bbb',2000),(null, 'ccc',3000),(null, 'ddd',4000),(null, 'eee',5000),(null, 'fff',6000),(null, 'ggg',7000),(null, 'hhh',8000),(null, 'iii',9000);

在这里插入图片描述

limit 0会立刻返回一个空结果集,它通常用来检测SQL语法是否正确或者快速获取结果集的字段属性。limit n用来返回最先获取的n条记录,找到足够的记录时SQL就会停止执行并返回结果:

select * from test limit 3;

在这里插入图片描述

采用limit m,n的形式,就是跳过前面的m条记录,返回之后的n条记录:

select * from test limit 3,3;

在这里插入图片描述

如果只是想跳过开头的m条记录,只需要给n一个足够大的数字即可,例如跳过开头100条记录:limit 100, 9999999999

1.2 limit和order by

如果order by子句和limit子句同时出现,那么MySQL会先对结果进行排序,对排序后的结果集应用limit子句。例如查询工资最高的3个人(按salary列倒序排列后取前3条记录):

select * from test order by salary desc limit 3;

在这里插入图片描述
如果排序的列存在重复数据,例如本例返回3条数据,但是3,4,5条记录的salary列都是相同的(它们都可以排在第三),这时返回的结果集是不确定的,查询时需注意。

1.2.1 排序瓶颈优化

与order by子句配合使用时,虽然limit子句最终获取的结果集可能很小,但需要先对所有的数据进行排序,如果这个数据量很大,那么排序操作就会成为性能瓶颈。

如果你发现limit子句加上order by之后语句执行很慢,可以尝试通过在排序列上增加索引来消除这个排序操作。由于示例表很小,优化器倾向于走全表扫描,这里找一张更大的表test1来演示,表中约有2万多条数据。观察添加索引前后的执行计划:

explain select * from test1 order by salary desc limit 3;
create index idx_salary on test1(salary);
explain select * from test1 order by salary desc limit 3;

在这里插入图片描述
可以看到索引反向扫描替代了原来的排序操作,同时扫描的行数量从24032降低到了3。

二、limit分页优化

limit子句最常用场景就是数据分页,通过变更偏移量来对数据进行分页展示。例如第一页显示100条数据,limit子句就是limit 0,100。第二页是limit 100,100,第三页是limit 200,100…. 但是当页数非常大时,limit m,n 中被丢弃的m条数据可能成为性能瓶颈。

由于前m条数据(偏移量)是最终需要的丢弃的,它们的内容我们并不关心,因此优化的思路就是"避免查询前m条数据的内容"。

2.1 延迟关联

为了避免查询偏移量m条数据的内容,我们可以先通过索引获取的n条数据的偏移量/主键(而不是对全量数据进行排序),然后通过主键直接获取n条数据的内容。这种策略叫做"延迟关联"。

例如查询:

select * from test1 order by salary desc limit 10000,100;

通过延迟关联可以改写为:

select salary from test1
join ( select id from test1 order by salary desc limit 10000,100) d on d.id=test1.id;

如果salary列上有索引,那么获取id是不需要回表的,通过索引就可以获取n条数据的主键,随后再与主表关联,通过主键取出这n条数据内容。虽然SQL看起来稍微复杂了,但是它绕过了获取前m条数据内容这个步骤,当m值比较大时,性能提升是很明显的。

2.2 转换为位置查询

这种策略是根据排序条件预先计算每行记录的顺序编号并加上索引,例如在表中新增一列position(或者单独新增一张顺序表也可以),保存的是每一行位置顺序。这相当于分页排序已经预先执行了,而偏移操作就被转换成了索引范围扫描。

例如查询:

select * from test1 order by salary desc limit 10000,100;

通过位置查询可以改写为:

select * from test1 where position between 10001 and 10100;

position列是根据order by salary desc条件预先维护好的每一列的顺序编号,此后每次分页查询都不需要计算偏移量,而是被转换成了索引范围扫描(Index Range Scan)。

2.3 记录偏移位置

记录偏移位置的方法,就是当排序列存在顺序的情况下,每次查询后将其最后的值记录下来,然后作为下一次SQL查询的过滤条件。

假设首次查询如下(id列单调递增):

select * from test1 order by id limit 9900,100;

假设上面查询返回结果集的最大id为123456,程序可以将这个值单独记录下来,那么SQL:

select * from test1 order by id limit 10000,100;

就可以改写为:

select * from test1 where id>123456 order by id limit 100;

通过条件where id>123456就可以过滤掉前m条数据,但这种方法的缺陷就是它只能一页一页的顺序往后翻,不能跳转翻页,对比上面2种方法不够灵活。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1841981.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

嵌入式Linux:Linux系统中文件类型

目录 1、普通文件 2、目录文件 3、字符设备文件 4、块设备文件 5、符号链接文件 6、套接字文件 7、管道文件 8、stat命令和ls命令 8.1、stat命令 8.2、ls命令 9、stat、fstat、lstat函数 9.1、stat函数 9.2、fstat函数 9.3、lstat函数 在Windows系统中&#xff0…

【JS重点18】原型链(面试重点)

一:原型链底层原理 以下面一段代码为例,基于原型对象(Star构造函数的原型对象)的继承使得不同构造函数的原型对象关联在一起(此处是最大的构造函数Object原型对象),并且这种关联的关系是一种链…

Java 集合框架:Vector、Stack 的介绍、使用、原理与源码解析

大家好,我是栗筝i,这篇文章是我的 “栗筝i 的 Java 技术栈” 专栏的第 015 篇文章,在 “栗筝i 的 Java 技术栈” 这个专栏中我会持续为大家更新 Java 技术相关全套技术栈内容。专栏的主要目标是已经有一定 Java 开发经验,并希望进…

哈喽GPT-4o——对GPT-4o 编程的思考与看法

GPT-4o(“o”代表“全能”)它可以接受任意组合的文本、音频和图像作为输入,并生成任意组合的文本、音频和图像输出。 👉 GPT功能: GPT-4o知识问答:支持1000token上下文记忆功能最强代码大模型Code Copilo…

多线程(总结黑马程序员)

一、什么是线程? 是一个程序内部的一条执行流程 多线程是什么? 多条线程由CPU负责调度执行 多线程的创建方式一:继承Thread类 //1.继承Thread类 public class MyThread extends Thread {//2.必须重写run方法Overridepublic void run() {…

AI 音乐大模型:创新的曙光还是创意产业的阴影?

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

课程品牌推广与传播秘籍:让你的课程火爆全网!

如今在线教育平台的竞争愈发激烈,如何让你的课程在茫茫网海中脱颖而出,吸引更多学员的关注和报名? 作为一名手工酸奶品牌的创始人,目前全国复制了100多家门店,很多都是线上授课。而且我自己还有一家传媒公司&#xff…

【C++题解】1670 - 象棋大赛

问题:1670 - 象棋大赛 类型:分支问题 题目描述: 市里要组织象棋大赛,年龄在 8∼30 周岁之间的选手可以报名参赛。为了公平起见,大赛组委会将选手们分了青年组、少年组和儿童组,大赛组委会规定&#xff1a…

heygen的前世今生

heygen 关于徐卓&梁望国内创业&诗云科技成立heygen为什么原班人马在国内做和国外做产品,造成的结果如此迥异?技术原理 关于徐卓&梁望 徐卓本科毕业于同济大学,硕士毕业于卡内基梅隆大学计算机专业,之后在 Snap 工作了…

ITSS案例分享 — 强化网络安全保障水平

某科技有限公司成立于2001年,是中国网络安全产业领跑者,于2000年发力安全业务,在云安全、身份安全、终端安全、态势感知、高级威胁治理,以及威胁情报领域等拥有多项全球领先技术,在核心技术领域持续领跑;同…

【每日刷题】Day70

【每日刷题】Day70 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 922. 按奇偶排序数组 II - 力扣(LeetCode) 2. 905. 按奇偶排序数组 - 力扣&…

【会议征稿,CPS出版】第四届管理科学和软件工程国际学术会议(ICMSSE 2024,7月19-21)

第四届管理科学和软件工程国际学术会议(ICMSSE 2024)由ACM珠海分会,广州番禺职业技术学院主办;全国区块链行业产教融合共同体,AEIC学术交流中心承办,将于2024年7月19-21日于广州召开。 会议旨在为从事管理与软件工程领域的专家学…

瑞尼克RNK聚四氟乙烯注射器刻度清晰纯净

四氟注射器用于抽取或者注入气体或者液体,四氟注射器由前端带有小孔的针筒以及与之匹配的活塞芯杆组成,用来将少量的液体或其注入到其它方法无法接近的区域或者从那些地方抽出,在芯杆拔出的时候液体或者气体从针筒前端小孔吸入,在…

程控漏电流测试电阻箱的应用

程控漏电流测试电阻箱是用于测量和控制电流的设备,广泛应用于电力系统、电子设备、自动化设备等领域。它的主要功能是通过改变电阻值来控制电流的大小,从而实现对设备的保护和控制。 程控漏电流测试电阻箱在电力系统中有着重要的应用,电力系统…

数据分析第十讲:pandas 应用入门(五)

pandas 应用入门(五) 我们再来补充一些使用DataFrame做数据分析时会使用到的操作,这些操作不仅常见而且也非常重要。 计算同比环比 我们之前讲过一个统计月度销售额的例子,我们可以通过groupby方法做分组聚合,也可以…

火爆全网 LLM大模型教程:从零开始构建大语言模型,git突破18K标星

什么!一本书的Github仓库居然有18.5k的星标!(这含金量不必多说) 对GPT大模型感兴趣的有福了!这本书的名字叫 《Build a Large Language Model (From Scratch)》 也就是 从零开始构建大语言模型! 虽然这是一…

软件构造 | Equality in ADT and OOP

软件构造 | Equality in ADT and OOP 🧇1 Three ways to regard equality 1.1 Using AF to define the equality ADT是对数据的抽象, 体现为一组对数据的操作 抽象函数AF:内部表示→抽象表示 基于抽象函数AF定义ADT的等价操作&#xff0…

MySQL----事务的隔离级别(附带每一级别实例截图)

先来回顾一下事务并发可能存在的三大问题: 脏读(Dirty Read)–不能接受 一个事务读取了另一个事务未提交的数据。例如当事务A和事务B并发执行时,当事务A更新后,事务B查询读取到A尚未提交的数据,此时事务A…

探索客户端-服务器架构:网络应用和分布式系统的基石

目录 前言1 客户端-服务器架构概述1.1 客户端的角色1.2 服务器的角色 2 客户端-服务器架构的工作原理3 客户端-服务器架构的应用4 客户端-服务器架构的优缺点4.1 优点方面4.2 缺点方面 5 客户端-服务器架构的未来发展结语 前言 在当今信息技术飞速发展的时代,客户端…

【数据结构】第十八弹---C语言实现堆排序

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】 目录 1、堆排序 1.1、基本思想 1.2、初步代码实现 1.3、代码优化 1.4、代码测试 总结 1、堆排序 在博主数据结构第十二弹---堆的应用有详细讲解堆…