MySQL EXPLAIN查询执行计划

news2024/11/20 8:35:31

 EXPLAIN 可用来查看SQL执行计划,常用来分析调试SQL语句,来使SQL语句达到更好的性能。

1 前置知识

在学习EXPLAIN 之前,有些基础知识需要清楚。

1.1 JSON类型

MySQL 5.7及以上版本支持JSON数据类型。可以将数组存为JSON格式的字符串,并使用JSON函数来提取元素。

-- 定义JSON数据类型变量
SET @json_str = '{"name":"黄先生","age": 28, "address": {"city": "深圳"}}';

1.1.1 JSON_VALUE 与 JSON_EXTRACT

JSON_VALUE: 返回json类型的键值。(返回字符串)

JSON_EXTRACT: 返回的是JSON某路径下的值。(返回JSON类型)

路径是一种字符串,类似于文件路径,用于指定JSON对象的特定位置,由一些列的键和路径组成,用于定位JSON对象中的值。

键,是JSON 用于定义对象的属性,每个键对应一个值。

路径支持

JSON_EXTRACT 允许使用JSON路径来提取值

JSON_VALUE 只能提取具有指定键的值。

错误处理

JSON_EXTRACT 如果指定路径不存在,则返回NULL

JSON_VALUE 如果键不存在,则返回NULL或报错(取决于是否启用了non_strict模式)。

用途

JSON_EXTRACT 通常用于更复杂的JSON结构。

性能

某些情况下,因为JSON_VALUE更简单,可能比JSON_EXTRACT更快。

图 JSON_VALUE 与 JSON_EXTRACT的区别

-- 数据库版本 8.0.29
DROP TABLE IF EXISTS e_student_course_grade;
DROP TABLE IF EXISTS e_course;
DROP TABLE IF EXISTS e_student;
DROP TABLE IF EXISTS e_class;
DROP TABLE IF EXISTS e_teacher;

CREATE TABLE e_teacher(
   id INT NOT NULL AUTO_INCREMENT COMMENT '教师id',
	 `name` VARCHAR(20) NOT NULL,
	 `age` VARCHAR(20) NOT NULL,
	 PRIMARY KEY(id)
)  COMMENT '教师';

CREATE TABLE e_class(
	id INT NOT NULL AUTO_INCREMENT COMMENT '班级号',
	`name` VARCHAR(20) NOT NULL,
	teacher_id INT NOT NULL COMMENT '班主任id',
	PRIMARY KEY(id),
	FOREIGN KEY(teacher_id) REFERENCES e_teacher(id) ON DELETE CASCADE
) COMMENT '班级';

CREATE TABLE e_student(
	id INT NOT NULL AUTO_INCREMENT COMMENT '学号',
	`name` VARCHAR(20) NOT NULL,
	`age` VARCHAR(20) NOT NULL,
	class_id INT NOT NULL COMMENT '班级id',
	PRIMARY KEY(id),
	FOREIGN KEY(class_id) REFERENCES e_class(id) ON DELETE CASCADE
) COMMENT '学生';

CREATE TABLE e_course(
	id INT NOT NULL AUTO_INCREMENT COMMENT '学科号',
	`name` VARCHAR(20) NOT NULL,
	teacher_id INT NOT NULL COMMENT '教师id',
	PRIMARY KEY(id),
	FOREIGN KEY(teacher_id) REFERENCES e_teacher(id) ON DELETE CASCADE
) COMMENT '学科';


CREATE TABLE e_student_course_grade(
	student_id INT NOT NULL COMMENT '学生id',
	course_id INT NOT NULL COMMENT '课程id',
	grade DOUBLE NOT NULL COMMENT '成绩',
	PRIMARY KEY(student_id,course_id),
	FOREIGN KEY(student_id) REFERENCES e_student(id) ON DELETE CASCADE,
	FOREIGN KEY(course_id) REFERENCES e_course(id) ON DELETE CASCADE
) COMMENT '学生课程成绩';



-- 数据插入函数
DROP PROCEDURE IF EXISTS eDataInsert; 
CREATE PROCEDURE eDataInsert(IN json_data JSON, IN sql_str TEXT) 
BEGIN
	DECLARE pos INT DEFAULT 0;
	SET @json_count := JSON_LENGTH(json_data);
	fetch_loop: LOOP
	IF pos >= @json_count THEN
		LEAVE fetch_loop; 
	END IF; 
	SET @json := JSON_EXTRACT(json_data,CONCAT("$[",pos,"]"));
	SET @query = sql_str; 
	PREPARE stmt FROM @query;  
  EXECUTE stmt;  
  DEALLOCATE PREPARE stmt;  
	SET pos := pos + 1;
  END LOOP fetch_loop;
END;

-- 教师数据
SET @teacher_json_data := '[{"name": "刘老师","age": 29},{"name": "黄老师","age": 28},{"name": "陈老师","age": 29},{"name": "李老师","age": 32},{"name": "张老师","age": 25}]';
SET @teacher_sql_str = 'INSERT INTO e_teacher(`name`,age) VALUES(JSON_VALUE(@json,"$.name"),JSON_VALUE(@json,"$.age"))';
CALL eDataInsert(@teacher_json_data,@teacher_sql_str);
-- 班级数据
SET @class_json_data := '[{"name": "实验班","teacherName": "刘老师"},{"name": "平衡班","teacherName": "黄老师"},{"name": "基础班","teacherName": "陈老师"}]';
SET @class_sql_text = 'INSERT INTO e_class(`name`,teacher_id) VALUES(JSON_VALUE(@json,"$.name"), (SELECT id FROM e_teacher WHERE `name` = JSON_VALUE(@json,"$.teacherName") LIMIT 0,1));';
CALL eDataInsert(@class_json_data,@class_sql_text);
-- 学生数据
SET @student_json_data := '[{"name": "黄兮言","className":"实验班","age":10},{"name": "胡沛煊","className":"实验班","age":10},{"name": "李正国","className":"平衡班","age":11},{"name": "陈青青","className":"基础班","age":10},{"name": "刘丽丽","className":"平衡班","age":11},{"name": "张小五","className":"平衡班","age": 10},{"name":"孙小","className":"基础班","age":10},{"name":"周欣欣","className":"实验班","age":11},{"name":"吴郑立","className":"平衡班","age":11},{"name": "李亚楠","className":"基础班","age":11},{"name": "邓贤","className":"基础班","age":10},{"name": "谢正华","className":"平衡班","age":10}]';
SET @student_sql_text := 'INSERT INTO e_student(`name`,age,class_id) VALUES(JSON_VALUE(@json,"$.name"),JSON_VALUE(@json,"$.age"),(SELECT id FROM e_class WHERE `name` = JSON_VALUE(@json,"$.className") LIMIT 0,1));';
CALL eDataInsert(@student_json_data, @student_sql_text);
-- 学科数据
SET @course_json_data := '[{"name":"英语","teacherName":"刘老师"},{"name":"数学","teacherName":"黄老师"},{"name":"语文","teacherName":"陈老师"},{"name":"物理","teacherName":"李老师"},{"name":"化学","teacherName":"张老师"}]';
SET @course_sql_text := 'INSERT INTO e_course(`name`,teacher_id) VALUES(JSON_VALUE(@json,"$.name"),(SELECT id FROM e_teacher WHERE `name` = JSON_VALUE(@json,"$.teacherName") LIMIT 0,1));';
CALL eDataInsert(@course_json_data, @course_sql_text);
-- 学科成绩数据
INSERT INTO e_student_course_grade ( student_id, course_id, grade ) SELECT
studentId,
courseId,
(
	CASE
			className 
			WHEN '实验班' THEN
			ROUND( 80 + RAND() * 20, 0 ) 
			WHEN '平衡班' THEN
			ROUND( 60 + RAND() * 20, 0 ) ELSE ROUND( 10 + RAND() * 20, 0 ) 
		END 
		) 
	FROM
		(
		SELECT
			s.id AS studentId,
			co.id AS courseId,
			cl.`name` AS className 
		FROM
			e_student s
			JOIN e_course co
		LEFT JOIN e_class cl ON s.class_id = cl.id 
	) temp;

1.2 连接查询原理

SELECT e.`name`  AS courseName, t.`name` AS teacherName
FROM `e_course` e
LEFT JOIN e_teacher t ON e.teacher_id = t.id 
WHERE e.`name` != '化学';

上面是简单的左连接查询,其中LEFT JOIN 左边的表是驱动表(e_course表),而右边的表是从表(e_teacher)。

上面语句的查询步骤是:1)从驱动表中找到符合where条件的数据;2)对步骤1的数据遍历从表,根据on条件找到匹配的数据,然后放到结果池。3)重复步骤1及步骤2,直到遍历完整张驱动表。伪代码如下:

for (int i = 0; i < 驱动表.length; i++) {
   let item = 驱动表[i];
   if (item 符合 where 条件) {
        for (int j = 0; j < 从表.length; j++) {
             let it = 从表[j];
             if (it 符合 on 条件) {
                将item及it 放到结果池;
             }
         }
    }
}

由上面伪代码可知,在连接查询的时候,会对驱动表每个符合的数据都遍历一遍从表。两张表相当于双层循环,三张表相当于三层循环。联表越多时间复杂度呈指数级别增长,联表的性能开销会非常大。在设计上,尽量选择驱动表为小表,用小表驱动大表。

1.2.1 连接查询优化方式

优化连接查询可以从两方面出发:1)减少访问从表的次数;2)加快查询从表。MySQL提供了三种方案:

1)BNL算法,Block Nested Loop 块嵌套循环,适用于从表无法使用索引的场景,通过减少访问从表的次数来进行优化。

使用一块缓存池(join buffer)记录满足驱动表的记录,将缓存池装满后再去从表中遍历查询。

注意join buffer 存储需要查询的列和查询条件的列,因此不要使用select * ,避免浪费join buffer的空间。

2)BKA算法,Block Key Access,适用于从表能使用索引的场景。驱动表中满足条件的记录,其id不一定有序,使用乱序的id去从表查找可能发生随机IO。

BKA 算法是基于MRR的,对驱动表结果的id进行排序后,再去从表中查找。

3)hash join 哈希连接。MySQL 8.0 默认使用hash的join buffer,通过空间换时间的方式来加速查找被驱动表。

分为构建阶段和探测阶段:

  1. 构建阶段(build过程):选择较小的表作为驱动表,并将其加载到内存中的哈希表中,哈希表通过使用连接条件中的列作为键,将驱动表中的记录映射到不同的桶中。
  2. 探测阶段(probe过程):遍历从表记录,对于每个别驱动的记录,算法使用连接条件中的列作为键,再哈希表中查找匹配的捅,如果找到了,就会将记录连接在一起并返回结果。

2 EXPLAIN 命令

MySQL的EXPLAIN命令能帮助你识别查询中的瓶颈,并据此优化查询或数据库的结构。

执行在SQL查询语句前面加上 EXPLAIN关键字,即可查询该语句的执行计划。

id

执行语句的唯一标识。如果结果包含多个id值,则数字越大越先执行,对于相同id的行,则从上往下依次执行。为NULL表示结果集,不需要使用它来进行查询。

select_type

查询类型。

table

表名,表示当前正在访问哪张表,如果定义了别名,则显示别名。

partitions

匹配的分区。

type

连接类型。

possible_keys

可能使用的索引。展示的是当前查询(在优化前)可能使用哪些索引,这列数据是早期创建的,因此有些索引可能对于后续的优化过程没用。

key

实际使用的索引。

key_len

索引长度。

ref

索引的哪一列被引用了。

rows

估计要扫描的行,数值越小越好。

filtered

符合查询条件的数据百分比。

extra

附加信息。

表 EXPLAIN 命令结果的相关字段

2.1 select_type 查询类型

SIMPLE

简单查询,未使用UNION或子查询。

PRIMARY

最外层的查询,如果包含子查询,最外层的SELECT被标记未PRIMARY。

UNION

在UNION中的第二个及随后的SELECT被标记为UNION。如果UNION被FROM子句的子查询包含,那么它的第一个SELECT会被标记为DERIVED。

DEPENDENT UNION

DEPENDENT UNION 中的第二个及随后的SELECT被标记为DEPENDENT UNION。

UNION RESULT

UNION的结果。

SUBQUERY

子查询中的第一个SELECT。

DEPENDENT SUBQUERY

子查询中的第一个SELECT,并依赖了外面的查询。

DERIVED

包含在FROM子句的子查询中的SELECT。

DEPENDENT DERIVED

包含在FROM子句的子查询中的SELECT,并依赖了外面的查询。

MATERIALIZED

物化子查询。

UNCACHEABLE

SUBQUERY

无法缓存结果的子查询。

UNCACHEABLE

UNION

无法缓存的UNION查询。

表 EXPLAIN命令的select_type 的查询类型含义

2.1.1 MATERIALIZED 物化子查询

物化子查询(MATERIALIZED Subquery)是一种特殊的子查询,它在查询过程中将子查询的结果先计算处理,并存储在一个临时表中,然后再对临时表进行进一步查询操作。

内部临时表:MySQL借助临时表处理中间的结果,此时使用的临时表称为内部临时表,对用户不可见也不能直接操作。 create temporary table 创建外部临时表,仅对当前会话可见,会话退出后会自动删除临时表。

派生表:是FROM子句的子查询的结果集。优化器对派生表的有两种优化策略:1)合并到外层查询;2)物化,这个过程产生了物化表。

物化表:物化是指将子查询的结果集保存到临时表的过程。该表称为物化表。

2.2 type 连接类型

system

该表只有一行(相当于系统表),system是const类型的特例。

const

针对主键或唯一索引等值查询,最多只返回一行数据。

eq_ref

使用索引的全部组成部分,并且索引是PRIMARY KEY 或 UNIQUE NOT NULL。

ref

满足索引最左前缀规则,并且索引不是主键也不是唯一索引。

fulltext

全文索引。

ref_or_null

类似于ref,但会额外搜索那些包含了NULL的空行。

index_merge

使用了索引合并优化,表示一个查询用到了多个索引。

unique_subquery

与eq_ref类似,但是使用了IN查询,并且子查询是主键或唯一索引。

index_subquery

与uinque_subquery类似,只是子查询使用的是非唯一索引。

range

范围扫描,检索指定范围的行,主要用于有限制的索引扫描。

index

全索引扫描。

ALL

全表扫描。

表 连接类型,性能由好到坏排序

2.3 key_len 计算索引长度

了解key_len的计算方式对于优化查询和索引非常重要。

不同的存储引擎及字符集可能会对其值产生影响。对于复合索引,key_len 是复合索引每一列的索引长度。如果指定了索引前缀长度,例如:INDEX(column(10)),那么key_len 只会考虑这10个字符。

不同的字段类型,索引长度的计算方式也不同:

  1. 固定长度的字段,例如INT是4个字节。char(10) 表示10个字符。Date,TIMESTAMP 是3个字节。
  2. 可变长度的字段。VARCHAR(100)最大是100个字符长度。实际使用的长度取决于存储的值的长度。但是,在索引中,VARCHAR的长度可能有一个最大前缀限制,例如前N个字符。而key_len 表示索引中使用的字节的最大长度。

注意,VARCHAR和char括号内的数字表示的是最大的字符串长度,不是字节。如果字段类型允许为null,则计算索引长度时还需要+1(NULL);如果是可变长度的字段,计算时还需要+2(变长长度)。

图 explain实战,演示key_len的值

图 e_course 表结构及索引字段

utf8_bin 字符集下varchar 类型需要3个字节。所以索引index_name的 ken_ken = 20 * 3 + 2(变长长度)。而teacher_id 是int类型,字节长度为4。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1427972.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【CSS】css选择器和css获取第n个元素(:nth-of-type(n)、:nth-child(n)、first-child和last-child)

:nth-of-type、:nth-child的区别 一、css选择器二、:nth-of-type、:nth-child的区别:nth-of-type(n)&#xff1a;选择器匹配属于父元素的特定类型的第N个子元素:nth-child(n)&#xff1a;选择器匹配属于其父元素的第 N 个子元素&#xff0c;不论元素的类型:first-child&#xf…

2017 年全国职业院校技能大赛高职组“信息安全管理与评估”赛项任务书(笔记解析)

1. 网络拓扑图 2. IP 地址规划表 3. 设备初始化信息 阶段一 任务1:网络平台搭建 1 根据网络拓扑图所示,按照 IP 地址参数表,对 WAF 的名称、各接口 IP 地址进 行配置。 主机名称 模式选择:透明模式 IP 地址:匹配参数表 WAF IP 地址 子网掩码 网口列表: eth0 和 eth1 2…

【操作宝典】IntelliJ IDEA新建maven项目详细教程

目录 &#x1f33c;1. 配置maven环境 &#x1f33c;2. 创建maven项目 &#x1f33c;3. 创建maven项目完整示例 a. 导入spring boot环境 b. 修改maven配置 c. 下载jar包 d. 创建Java类 &#x1f33c;1. 配置maven环境 【安装指南】maven下载、安装与配置详细教程-CSDN博客…

Vue3+vite引入Tailwind CSS

Tailwind CSS 是一个为快速创建定制化 UI 组件而设计的实用型框架。与其他 CSS 框架或库不同&#xff0c;Tailwind CSS 组件没有预先设置好样式。可以使用 Tailwind 的低级实用类来为 CSS 元素设置样式&#xff0c;如 margin、flex、color 等。 自从 2017 年发布以来&#xff…

基于python flask茶叶网站数据大屏设计与实现,可以做期末课程设计或者毕业设计

基于Python的茶叶网站数据大屏设计与实现是一个适合期末课程设计或毕业设计的项目。该项目旨在利用Python技术和数据可视化方法&#xff0c;设计和开发一个针对茶叶行业的数据大屏&#xff0c;用于展示和分析茶叶网站的相关数据。 项目背景 随着互联网的快速发展&#xff0c;越…

【Java程序设计】【C00196】基于(JavaWeb+SSM)的旅游管理系统(论文+PPT)

基于&#xff08;JavaWebSSM&#xff09;的旅游管理系统&#xff08;论文PPT&#xff09; 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于ssm的旅游平台 本系统分为前台、管理员2个功能模块。 前台&#xff1a;当游客打开系统的网址后&#xff0c;首先看到的…

使用 Dockerfile 定制镜像详解

使用 Dockerfile 定制镜像详解 1.DockerfileFROM 指定基础镜像RUN 执行命令构建镜像 2.COPY 复制文件3.ADD 更高级的复制文件4.CMD 容器启动命令5.ENTRYPOINT 入口点6.ENV 设置环境变量7.ARG 构建参数8.VOLUME 定义匿名卷9.EXPOSE 暴露端口10.WORKDIR 指定工作目录11.USER 指定…

鸿道(Intewell)操作系统是什么?

科东软件自主研发的鸿道&#xff08;Intewell&#xff09;新型工业操作系统历经30多年研发积累&#xff0c;采用业界领先的微内核架构&#xff0c;具备高实时、高安全及强扩展的特性&#xff0c;与自主研发的Hypervisor虚拟化技术相结合&#xff0c;既能满足工业现场对设备控制…

Ray on ACK 实践探索之旅 - RayCluster 篇

作者&#xff1a;张杰、霍智鑫、行疾 什么是 Ray&#xff1f; Ray 是一个开源框架&#xff0c;专为构建可扩展的分布式应用程序而设计&#xff0c;旨在通过提供简单直观的 API&#xff0c;简化分布式计算的复杂性&#xff0c;让开发者能够便捷高效地编写并行和分布式 Python …

Git 指令

Git 安装 操作 命令行 简介&#xff1a; Git 是一个开源的分布式版本控制系统&#xff0c;用于敏捷高效地处理任何或小或大的项目。 Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。 Git 与常用的版本控制工具 CVS, Subversion …

Iceberg从入门到精通系列之二十一:Spark集成Iceberg

Iceberg从入门到精通系列之二十一&#xff1a;Spark集成Iceberg 一、在 Spark 3 中使用 Iceberg二、添加目录三、创建表四、写五、读六、Catalogs七、目录配置八、使用目录九、替换会话目录十、使用目录特定的 Hadoop 配置值十一、加载自定义目录十二、SQL 扩展十三、运行时配置…

avast网页随机密码生成器

随机密码生成器 | 告别 12345 | Avast 可以生成随机密码 按需调整

Vue3学习记录(二)--- 组合式API之计算属性和侦听器

一、计算属性 1、简介 ​ 计算属性computed()&#xff0c;用于根据依赖的响应式变量的变化&#xff0c;进行自动的计算&#xff0c;并返回计算后的结果。当依赖的响应式变量发生变化时&#xff0c;computed()会自动进行重新计算&#xff0c;并返回最新的计算结果。如果依赖的…

Open CASCADE学习|球面上曲线长度计算

球和球面是数学和物理学中非常重要的概念&#xff0c;它们在许多领域都有广泛的应用。 球面是指所有与固定点等距离的点的集合&#xff0c;这个固定点被称为球心&#xff0c;而这个等距离的长度就是球的半径。球面是一个二维曲面&#xff0c;它是三维空间中点与距离之间关系的…

大数据平台-可视化面板介绍-Echarts

应对现在数据可视化的趋势&#xff0c;越来越多企业需要在很多场景(营销数据&#xff0c;生产数据&#xff0c;用户数据)下使用&#xff0c;可视化图表来展示体现数据&#xff0c;让数据更加直观&#xff0c;数据特点更加突出。 目录 01-使用技术 02- 案例适配方案 03-基础…

在IDEA中使用git(教程)

目录 第一章、快速了解git和idea1.1&#xff09;git安装使用教程1.2&#xff09;idea安装使用教程 第二章、在IDEA中使用git2.1&#xff09;安装插件和git设置2.2&#xff09;基础操作2.2.1&#xff09;使用IDEA初始化本地仓库&#xff0c;2.2.2&#xff09;关联本地仓库和远程…

XGB-1:XGBoost安装及快速上手

XGBoost是“Extreme Gradient Boosting”的缩写&#xff0c;是一种高效的机器学习算法&#xff0c;用于分类、回归和排序问题。它由陈天奇&#xff08;Tianqi Chen&#xff09;在2014年首次提出&#xff0c;并迅速在数据科学竞赛和工业界获得广泛应用。XGBoost基于梯度提升框架…

人工智能基础-Numpy的arg运算-Fancy Indexing-比较

索引 获取最小值最大值索引 np.argmin(x) np.argmax(x)排序和使用索引 np.sort(x)Fancy Indexing 索引 二维数组的应用 numpy.array 的比较 比较结果和Fancy Indexing

爱、自由与创造——教育改革的三大基石

爱、自由与创造——教育改革的三大基石 Love, Freedom, and Creativity: The Three Pillars of Educational Reform 在当今社会快速发展的背景下&#xff0c;创造性思维的重要性日益凸显。然而&#xff0c;我们必须认识到&#xff0c;创造性并非凭空产生&#xff0c;而是深深植…

Android Studio非UI线程修改控件——定时器软件

目录 一、UI界面设计 1、UI样式 2、XML代码 二、功能编写 1、定义 2、实现方法 3、功能实现 一、UI界面设计 1、UI样式 2、XML代码 <?xml version"1.0" encoding"utf-8"?> <RelativeLayout xmlns:android"http://schemas.android…