『MySQL 实战 45 讲』16 - “order by” 是怎么工作的

news2025/1/20 5:46:16

“order by” 是怎么工作的

  1. 首先创建一个表
CREATE TABLE `t` ( 
	`id` int(11) NOT NULL, 
	`city` varchar(16) NOT NULL, 
	`name` varchar(16) NOT NULL, 
	`age` int(11) NOT NULL, 
	`addr` varchar(128) DEFAULT NULL, 
	PRIMARY KEY (`id`), 
	KEY `city` (`city`)
) ENGINE=InnoDB;

全字段排序

  1. city 字段上创建索引,然后执行下面语句
select city,name,age from t where city='杭州' order by name limit 1000 ;
  1. 通过 explain 结果会出 Extra 字段中,出现 Using filesort,表示需要排序,MySQL 会给每个线程分配一块内存用于排序,称为 sort_buffer
    在这里插入图片描述
  2. 上述语句执行流程如下
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/05312064b47d43b18a5e5ff5a538aa55.png
  • 初始化 sort_buffer,确定放入 name、city、age 这三个字段
  • 从索引 city 找到第一个满足 city='杭州’ 条件的主键 id,也就是图中的 ID_X
  • 到主键 id 索引取出整行,取 name、city、age 三个字段的值,存入 sort_buffer 中
  • 从索引 city 取下一个记录的主键 id
  • 重复步骤 3、4 直到 city 的值不满足查询条件为止,对应的主键 id 也就是图中的 ID_Y
  • 对 sort_buffer 中的数据按照字段 name 做快速排序
  • 按照排序结果取前 1000 行返回给客户端
  1. 其中,排序的时候可能会用到外部排序,就需要设置 sort_buffer_size,避免导致 sort_buffer 太小而不得不利用磁盘临时文件来辅助排序
  2. 确定排序语句是否使用了临时文件的方法
/* 打开optimizer_trace,只对本线程有效 */
SET optimizer_trace='enabled=on'; 

/* @a保存Innodb_rows_read的初始值 */
SELECT VARIABLE_VALUE INTO @a FROM  performance_schema.session_status WHERE variable_name = 'Innodb_rows_read';

/* 执行语句 */
SELECT city, NAME,age FROM t WHERE city='杭州' ORDER BY NAME LIMIT 1000; 

/* 查看 OPTIMIZER_TRACE 输出 */
SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G

/* @b保存Innodb_rows_read的当前值 */
SELECT VARIABLE_VALUE INTO @b FROM performance_schema.session_status WHERE variable_name = 'Innodb_rows_read';

/* 计算Innodb_rows_read差值 */
SELECT @b-@a;
  • 其中,在 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G 的内容中如果出现 number_of_tmp_files,就表明用了临时表的份数(8.0 版本好像没看着)
    在这里插入图片描述
  1. 而 SELECT @b-@a; 代表的是查询前后获取的值的相减,得到的意思是整个过程扫描了多少行
  • 如果发现值和预期值多 1,就需要设置 internal_tmp_disk_storage_engine 属性为 MyISAM(默认 InnoDB),可能是因为查询 OPTIMIZER_TRACE 时,用到了临时表,所以会加 1

rowid 排序

  1. 全字段排序会把要返回的字段放到 sort_buffer 中,如果字段太多,就会分成多个临表
  2. 当排序单行太大,MySQL 会用另外一种算法,例如更改 max_length_for_sort_data 专门用于控制排序的行数据参数
SET max_length_for_sort_data = 16;
  1. city、name、age 这三个字段的定义总长度是 36 > 16,所以 sort_buffer 只会放入 排序的列主键 id
    在这里插入图片描述
  • 初始化 sort_buffer,确定放入两个字段,即 name 和 id
  • 从索引 city 找到第一个满足 city=‘杭州’ 条件的主键 id,也就是图中的 ID_X
  • 到主键 id 索引取出整行,取 name、id 这两个字段,存入 sort_buffer 中
  • 从索引 city 取下一个记录的主键 id
  • 重复步骤 3、4 直到不满足 city='杭州’条件为止,也就是图中的 ID_Y
  • 对 sort_buffer 中的数据按照字段 name 进行排序
  • 遍历排序结果,取前 1000 行,并按照 id 的值回到原表中取出 city、name 和 age 三个字段返回给客户端
    • 其中 “结果集” 是逻辑概念,实际上 MySQL 服务端从排序后的 sort_buffer 中依次取出 id,然后到原表查到 city、name 和 age 这三个字段的结果,不需要在服务端再耗费内存存储结果,是直接返回给客户端的
  1. 如果用刚刚的 确定临时文件的方法,会发现比以前多了一些值,就是因为要 id 去原表取值

联合索引与索引覆盖

  1. 对表的字段 city 和 name 的联合索引
alter table t add index city_user(city, name);
  1. 查询过程就变成下面这样
    在这里插入图片描述
  • 从索引 (city,name) 找到第一个满足 city='杭州’条件的主键 id
  • 到主键 id 索引取出整行,取 name、city、age 三个字段的值,作为结果集的一部分直接返回
  • 从索引 (city,name) 取下一个记录主键 id
  • 重复步骤 2、3,直到查到第 1000 条记录,或者是不满足 city=‘杭州’ 条件时循环结束
  1. 通过 explain 查询,就发现没有出现 Using filesort
  2. 如果想更快,就进行索引覆盖吧
alter table t add index city_user_age(city, name, age);
  1. 执行流程将会如下
    在这里插入图片描述
  • 从索引 (city,name,age) 找到第一个满足 city=‘杭州’ 条件的记录,取出其中的 city、name 和 age 这三个字段的值,作为结果集的一部分直接返回
  • 从索引 (city,name,age) 取下一个记录,同样取出这三个字段的值,作为结果集的一部分直接返回
  • 重复执行步骤 2,直到查到第 1000 条记录,或者是不满足 city=‘杭州’ 条件时循环结束

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/554247.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

正确甄别API、REST API、RESTful API和Web Service之间的异同

看到API你会想起什么?是接口、第三方调用、还是API文档?初看你可能会觉得这太熟悉了,这不是系统开发日常系列吗?但你仔细想一想,你会发现API的概念在你脑海里是如此的模糊。如何你通过搜索引擎检索API,你会…

目标检测数据预处理——部件截图,按一定比例进行外扩

本片是截图的篇的升级版本,简单版本的截图请参考根据目标框外扩一定比例进行截图(连带标签)。 对目标框(类别名称)进行分类,将同一类的目标框进行截图并分类保存在不同的文件夹中。 在本篇当中,…

Vue3中响应式Reactive的独特之处:它在哪些场景下胜出Ref?

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: 三十天精通 Vue 3 文章目录 一、Vue 3中响应式Reactive的独特之处1.1 引言1.2 Vue 3中的响应式…

算法leetcode|51. N 皇后(rust重拳出击)

文章目录 51. N 皇后:样例 1:样例 2:提示: 分析:题解:rust:go:c:python:java: 51. N 皇后: 按照国际象棋的规则,皇后可以…

详解c++STL—STL常用算法

目录 1、常用遍历算法 1.1、for_each 1.2、transform 2、常用查找算法 2.1、find 2.2、find_if 2.3、adjacent_find 2.4、binary_search 2.5、count 2.6、count_if 3、常用排序算法 3.1、sort 3.2、random_shuffle 3.3、merge 3.4、reverse 4、常用拷贝和替换算…

在MyBatis XML文件中处理特殊符号的方法,如“>”、“<”、“>=”、“<=”这些符号XML会报错如何处理

前言 在MyBatis的XML映射文件中,我们经常需要使用特殊符号,比如"大于"、"小于"、"大于等于"、"小于等于"等比较操作符。然而,这些符号在XML中具有特殊的含义,因此需要进行特殊处理&…

nginx缓存及rsync远程访问控制

nginx缓存功能 http{ proxy_cache_path /data/nginx/cache/levels1:2 keys_zonemy_cache:10m max_size10g inactive60m use_temp_pathoff; path强制参数,指定缓存文件的存放路径。 levels: 定义了缓存目录的层级。每层可以用1(最多16种选择,0-f)或2(最…

2023年认证杯SPSSPRO杯数学建模A题(第一阶段)碳板跑鞋全过程文档及程序

2023年认证杯SPSSPRO杯数学建模 A题 碳板跑鞋 原题再现: 在专业运动鞋上使用的碳板,也可被称为碳纤维增强环氧树脂材料,事实上是将碳纤维织成布,再浸入环氧树脂固化后形成的板材。它以较轻的重量达到了相当好的弹性和刚度。在上…

【jvm系列-13】jvm性能调优篇---参数设置以及日志分析

JVM系列整体栏目 内容链接地址【一】初识虚拟机与java虚拟机https://blog.csdn.net/zhenghuishengq/article/details/129544460【二】jvm的类加载子系统以及jclasslib的基本使用https://blog.csdn.net/zhenghuishengq/article/details/129610963【三】运行时私有区域之虚拟机栈…

【腾讯云FinOps Crane 集训营】让我看看还有谁没用过crane这个降本利器

近几年云原生概念的发展如雨后春笋,势如破竹,而devops和k8s(Kubernetes)两兄弟也搭上云原生的车先后火了起来 devops:如字面意思Development&Operations,它的理念是开发即运维,目的是消除开发者们与运维之间的隔阂…

OpenCV:从 CMake 产生 VS2019 项目和解决方案

CMake 是一个跨平台的自动化编译程序,它用于管理代码的构建过程。使用 CMake 可以简化跨平台项目的构建和移植,提供简单而强大的语法来描述构建过程,并生成多种不同的构建系统,如 GNU Make、Ninja 和 Visual Studio。因为 CMake 具…

shell编程(编写、执行,shell变量、传参、字符串、运算符使用)

来认识一下吧 Shell 是一个用 C 语言编写的程序,通过 Shell 用户可以访问操作系统内核服务。 Shell 既是一种命令语言,又是一种程序设计语言。 Shell script 是一种为 shell 编写的脚本程序。Shell 编程一般指 shell 脚本编程,不是指开发 she…

Python实现ACO蚁群优化算法优化卷积神经网络回归模型(CNN回归算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 蚁群优化算法(Ant Colony Optimization, ACO)是一种源于大自然生物世界的新的仿生进化算法&#xff0c…

快速部署一套K8s集群-参考阿良老师

1、前置知识点 1.1 生产环境可部署Kubernetes集群的两种方式 目前生产部署Kubernetes集群主要有两种方式: kubeadm Kubeadm是一个K8s部署工具,提供kubeadm init和kubeadm join,用于快速部署Kubernetes集群。 二进制包 从github下载发行…

节省维护成本,提高效率!接口自动化测试框架热加载技术解析

目录 一、简介 二、实现热加载技术的具体操作 1. 借助Java类加载器实现热加载 2. 应用热加载技术动态更新代码 三、封装热加载技术 四、总结 前言 现如今,接口自动化测试已经成为了软件开发过程中不可或缺的一部分,通过使用接口自动化框架可以在效…

cpp 类成员函数delete this 会发生什么?

如题 this 简介: 每个非静态的类成员函数默认参数都会压栈一个this,它指向的是调用改成员函数的对象, 也是就className的object this 被隐含声明为 className* const this; 1.意味着不能改变this的指向2.this是个右值,不能取地址 ,不能&this 那我…

vue实现用户动态权限登录

一、使用vueelementUI搭登录框架,主要就是1、2、3、4 配置: ①vue.config.js use strict const path require(path)function resolve(dir) {return path.join(__dirname, dir) }// All configuration item explanations can be find in https://cli.v…

想自学写个操作系统,有哪些推荐看的书籍?

前言 哈喽,我是子牙,一个很卷的硬核男人。喜欢研究底层,聚焦做那些大家想学没地方学的课程:手写操作系统、手写虚拟机、手写编程语言… 今天我们将站在一个自学者的角度来聊聊如何实现自己的操作系统。并为大家推荐几本能够帮助你…

Ubuntu20.04配置静态IP地址,开启远程连接

本文操作演示为windows系统使用虚拟机安装的ubuntu系统进行:操作系统为ubuntu20.04,VMware15.5.0 build-14665864,内容分为两部分,第一部分为配置ubuntu系统的静态ip地址,第二部分内容为修改配置开启远程连接功能 一、…

第16章_变量、流程控制与游标

第16章_变量、流程控制与游标 1. 变量 在MySQL数据库的存储过程和函数中,可以使用变量来存储查询或计算的中间结果数据,或者输出最终的结果数据。 在 MySQL 数据库中,变量分为系统变量以及用户自定义变量。 1.1 系统变量 1.1.1 系统变量分…