第48讲:SQL优化之ORDER BY排序查询的优化

news2024/9/22 13:34:00

文章目录

    • 1.ORDEY BY排序查询优化方面的概念
    • 2.ORDER BY排序的优化原则
    • 3.ORDER BY排序优化的案例
      • 3.1.准备排序优化的表以及索引
      • 3.2.同时对nl和lxfs字段使用升序排序
      • 3.3.同时对nl和lxfs字段使用降序排序
      • 3.4.排序时调整联合索引中字段的位置顺序
      • 3.5.排序时一个字段使用升序一个字段使用降序
      • 3.6.解决两个字段不同排序规则出现Using filesort
    • 4.ORDER BY多字段多排序方式的索引结构图

1.ORDEY BY排序查询优化方面的概念

在MySQL数据库中,有两种排序类型:

  • Using filesort:
    • 通过表的索引或者全表扫描,读取满足条件的数据行,然后在排序缓冲区sortbuffer中完成排序的操作,所有不是通过索引直接返回的排序结果都是filesort排序,效率相对来说比较低。
    • 索引本身具有排序的功能,如果索引的排序没有满足我们的排序条件,此时读取到满足条件的数据后,还需要在缓冲区中重新排序,最后完成排序的操作,这类的排序都是filesort。
    • 就和回表查询一样,本来可以在二级索引中拿到数据,但是还需要走回表查询才能完成需求,filesort也一样,如果不能再索引排序中拿到结果,就需要在缓冲区中再次排序。
  • Using index:
    • 通过有序索引排序扫描后,直接就能返回有序的数据,满足排序需求,这类的排序都是using index,不需要额外的排序,效率很高。
    • 索引排序默认是ASC升序排序,如果我们的排序规则都是升序,并且排序的字段也是索引字段,此时就是using index排序。

对于这两种排序方式,Using index的性能最高,Using filesort的性能较低,我们再优化排序操作时,尽量的使用Using index。

索引的默认排序规则是升序排序,下面来观察几种排序需求,看看哪些是Using filesort,那些是Using index。

  • 当排序的字段都是升序时,排序方式就是Using index。

  • 当排序的字段都是降序时,排序方式就是Using index,因为还是在一个索引排序集里,只不过反向排序即可。

  • 当排序的字段一个是升序、一个是降序,此时就会出现Using filesort,因为第一个字段是升序,也是默认的规则,直接返回排序即可,但是第二个字段是降序,相当于又要重新读取一遍数据,然后拿到缓冲区里再次排序。

2.ORDER BY排序的优化原则

  • 将需要排序的字段建立联合索引,多字段排序时也是需要遵循最左前缀法则的。
  • 查询返回的字段尽量使用覆盖索引的字段,此时不需要回表查询,效率很高。
  • 多字段排序时,如果一个字段升序、一个字段降序,那么就在创建联合索引时,为字段设置排序规则。
  • 如果不能避免出现filesort,那么可以适当的增大排序缓冲区的大小,参数是sort_buffer_size,默认为256k。

3.ORDER BY排序优化的案例

3.1.准备排序优化的表以及索引

1)表数据

image-20220603141608777

2)索引

我们主要以nl和lxfs两个字段排序,将这两个字段创建一个联合索引。

mysql> create index idx_user_nl_lxfs on tb_user(nl,lxfs);

image-20220603141824047

3.2.同时对nl和lxfs字段使用升序排序

同时对nl和lxfs字段进行升序排序,观察执行计划中排序方式是什么。

mysql> explain select nl,lxfs from tb_user order by nl,lxfs;

根据执行计划的输出,我们可以看到同时对nl和lxfs字段进行升序排序时,都走了索引,排序方式是Using index,此时的效率最高。

image-20220603142641016

当然如果我们只根据nl排序,排序方式也是Using index,因为nl字段也在联合索引中。

image-20220603142626946

3.3.同时对nl和lxfs字段使用降序排序

同时对nl和lxfs字段进行降序排序,观察执行计划中的排序方式是什么。

mysql> explain select nl,lxfs from tb_user order by nl desc,lxfs desc;

根据执行计划的输出,我们可以看到也是走的Using index,但是还多了个一个Backward index scan,这个代表使用了反向扫描索引,因为我们使用的降序排序,默认是升序排序,叶子节点从小到大排序,所以就会反向扫描整个索引结构。

image-20220603142613663

3.4.排序时调整联合索引中字段的位置顺序

我们在排序时,调整一下排序字段的位置顺序,在创建联合索引时,nl字段在最左侧,lxfs字段在右侧。

在3.2.中排序时nl字段在左侧,lxfs字段在右侧,观察会有什么样的排序方式。

mysql> explain select nl,lxfs from tb_user order by lxfs,nl;

观察执行计划的输出,我们可以看到既出现了Using index又出现了Using filesort,原因就是调整了索引字段的位置,nl字段是最左前缀,我们将lxfs放在最前面,相当于违背了最左前缀法则,就会出现Using filesort。

image-20220603143310188

3.5.排序时一个字段使用升序一个字段使用降序

排序时一个字段采用升序排序,一个字段使用降序排序,观察效果。

mysql> explain select nl,lxfs from tb_user order by nl asc,lxfs desc;

观察执行计划的输出,我们可以看到既出现了Using index又出现了Using filesort,那么为什么会出现这样的现象呢?原因就是nl字段使用升序排序没问题,只需要在索引结构中顺序拿到结果,但是lxfs字段是降序排序,只能拿着结果去排序缓冲区中再进行降序排序,最终拿到结果。

image-20220603144406234

3.6.解决两个字段不同排序规则出现Using filesort

针对3.5中排序后的现象,两个字段不同的排序规则,索引默认是升序排序,nl字段的升序排序没有任何效率问题,但是lxfs字段当下拿到的是nl字段升序后的结果集,还想要对lxfs字段降序排序,只能拿到排序缓冲区中进行额外的排序,因为在nl字段升序后的结果集里,lxfs字段也是升序的,但是我们要的是降序的效果,所以只能额外排序了。

想要解决这个问题其实非常简单,只要能够实现一个索引结构里不同字段有不同的排序方式就行了,例如nl字段在索引结构里走升序排序,lxfs字段在索引结构里走降序就可以完美解决了。

不同字段的排序方式可以在创建索引时指定即可。

mysql> create index idx_user_nl_lxfs_ad on tb_user (nl asc,lxfs desc);

Column_name一列是该索引字段的排序规则,A表示asc升序排序,D表示desc降序排序。

image-20220603150220213

创建完索引后,我们再执行相同的SQL,观察执行计划。

mysql> explain select nl,lxfs from tb_user order by nl asc,lxfs desc;

观察执行计划,此时已经是Using index了。

image-20220603150343463

4.ORDER BY多字段多排序方式的索引结构图

为不同的字段设置了不同的排序规则后,在索引的叶子节点里就已经排序好了,上面图的所有字段排序规则都是升序,下面图中lxfs字段是降序,可以看到每个索引元素中手机号都是降序排序了。

image-20220603151321373

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/351694.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ChatGPT 的出现意味着什么?

老于笔记02.16选中一天的美好,删除不满的忧虑。前言ChatGPT 的出现是自然语言处理技术的一个重要里程碑。它是 OpenAI 推出的一个基于 Transformer 模型的大型语言模型,被训练于大量的文本数据,以使其能够生成人类般的文本响应。ChatGPT 的出…

2023.2.6-2.12 AI行业周刊(第136期):住院

周末把父亲送到医院,安顿下来,这周还是决定做膝关节的手术了。 一辈子长期的劳累,加上前两年搬家时的辛苦,最终导致膝关节受损严重。 这两年来,走路每一步都很疼,纠结了很久,去了上海&#xf…

VS实用调试技巧

一.什么是BUG🐛Bug一词的原意是虫子,而在电脑系统或程序中隐藏着的一些未被发现的缺陷或问题,人们也叫它"bug"。这是为什么呢?这就要追溯到一个程序员与飞蛾的故事了。Bug的创始人格蕾丝赫柏(Grace Murray H…

sql复习(视图、Top-N分析、其他数据库对象)

一、视图view 1.视图定义 视图是一种虚表。 视图建立在已有表的基础上, 视图赖以建立的这些表称为基表。 向视图提供数据内容的语句为 SELECT 语句, 可以将视图理解为存储起来的 SELECT 语句。 视图向用户提供基表数据的另一种表现形式。 2.使用视图的好处 控制数据访问 简…

【离线数仓-1-数仓前期建设准备工作】

离线数仓-1-数仓前期建设准备工作离线数仓-1-数仓前期建设准备工作1.数仓概念1. 数据仓库概念2. 数据分类3.数据仓库总视图4.数据仓库项目需求分析5.数仓搭建技术基础分析1.项目技术如何选型:2.框架版本如何选型;3.服务器使用物理机还是云主机&#xff1…

C++:模板初阶(泛型编程、函数模板、类模板)

文章目录1 泛型编程2 函数模板2.1 函数模板概念2.2 函数模板格式2.3 函数模板的原理2.4 函数模板的实例化2.5 模板参数的匹配原则3 类模板3.1 类模板的定义格式3.2 类模板的实例化1 泛型编程 所谓泛型,也就是通用型的意思。 在以往编写代码时,我们常常…

Greenplum的两阶段提交

注:本文章引自终于把分布式事务讲明白了! 在前面的文章中,我们了解了单机库中的事务一致性实现以及分布式事务中的两阶段提交协议。大多数分布式系统都是采用了两阶段提交塄来保证事务的原子性,Greenplum也是采用了两阶段提交&am…

ChatGPT直播课听不够?微软ATP教你系统化入门人工智能

爆火的ChatGPT直播课听不过瘾?系统化AI知识在哪学?国际TOP科技公司AI算法工程师团队来为你支招!▍微软AI算法专家助力系统化学习人工智能「微软ATP」Microsoft AI Talent Program是微软(亚洲)互联网工程院下属的提供专…

【测试】自动化测试02

努力经营当下,直至未来明朗! 文章目录前言 回顾 预告一、常见的元素操作1. 输入文本sendKeys()2. 点击click3. 提交submit(通过回车键提交)4. 清除clear5. 获取文本getText()6. 获取属性对应的值getAttribute()7. 查看title和ur…

(二十四)ATP应用测试平台——springboot集成fastdfs上传与下载功能

前言 本节内容我们主要介绍一下如何在springboot项目中集成fastdfs组件,实现文件的上传与下载。关于fastdfs服务中间键的安装过程,本节内容不做介绍。fastdfs是一个轻量级的分布式文件系统,也是我们文件存储中常常使用的组件之一&#xff0c…

酷开系统壁纸模式,将氛围感死死拿捏!

古希腊哲学家柏拉图曾经说过:“美感是起于视觉、听觉产生的快感,以人的感官所能达到的范围为极限。”而电视则恰恰就是视觉听觉的完美融合体,当一台开启的电视可以给我们带来视听享受的时候,一台待机状态下的电视又如何取悦于我们…

Kotlin新手教程三(类与继承)

一、类 1.类的声明 与Java中类似,Kotlin中的类声明使用关键字class: class Person {var height: Int185 //规范写法:冒号后需要紧跟一个空格 }当你定义的类没有类体时,可以省略花括号: class Person2.构造函数…

多云和混合云场景下的 API 管理:挑战与选择

作者张超,API7 Cloud 产品负责人,Apache APISIX PMC 成员。 原文链接 一、多云和混合云 如今微服务已经成为最流行的一种软件架构,人们通过自己对业务的理解,和科学方法(比如领域驱动设计的理论)的加持将…

算法刷题打卡第93天: 最大的以 1 为边界的正方形

最大的以 1 为边界的正方形 难度:中等 给你一个由若干 0 和 1 组成的二维网格 grid,请你找出边界全部由 1 组成的最大 正方形 子网格,并返回该子网格中的元素数量。如果不存在,则返回 0。 示例 1: 输入&#xff1a…

c++11 标准模板(STL)(std::multimap)(九)

定义于头文件 <map> template< class Key, class T, class Compare std::less<Key>, class Allocator std::allocator<std::pair<const Key, T> > > class multimap;(1)namespace pmr { template <class Key, class T…

【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架

【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架 【论文原文】&#xff1a;A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction 【作者信息】&#xff1a;Sheng, Jiawei and Guo, Shu and Yu, Bowen and Li, Qian…

Python登陆系统

前言 #源码见文末公众号哈# 登录系统 一个简单的登录系统包含了登录账户、注册账户、修改密码以及注销账户的操作。 1. 登录账户 登录系统主要需要判断账户是否存在&#xff0c;不存在就注册一个账户&#xff0c;如果第一次登录系统&#xff0c;我们需要先新建一个文件&…

解密Teradata与中国市场“分手”背后的原因!国产数据库能填补空白吗?

2月15日&#xff0c;西方的情人节刚刚过去一天&#xff0c;国内IT行业就爆出一个大瓜。 继Adobe、甲骨文、Tableau、Salesforce之后&#xff0c;又一个IT巨头要撤离中国市场。 Teradata天睿公司官宣与中国市场“分手”&#xff0c;结束在中国的直接运营。目前&#xff0c;多家…

MySQL Study Notes Design in 2023

文章目录1 概述1.1 MySQL相关概述1.2 数据模型1.3 SQL分类2 数据库设计-DDL2.1 约束2.2 字段3 数据库操作-DML3.1 增加(insert)1 概述 1.1 MySQL相关概述 数据库&#xff1a;英文为 DataBase&#xff0c;简称DB&#xff0c;它是存储和管理数据的仓库。 数据库管理系统&#xf…

为什么重写equals必须重写hashCode

关于这个问题&#xff0c;看了网上很多答案&#xff0c;感觉都参差不齐&#xff0c;没有答到要点&#xff0c;这次就记录一下&#xff01; 首先我们为什么要重写equals&#xff1f;这个方法是用来干嘛的&#xff1f; public boolean equals &#xff08;Object object&#x…