一、概述
sql语句是有具体的执行过程的,通过查看这个执行过程,可以针对性的优化某一步骤,以加快SQL语句的执行效率。
通过MySQL调优系列(一)——性能监控我们可以知道,有一个查询优化器,查询优化器:优化客户端请求query,根据客户端请求的 query 语句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个 query 语句的结果。 (交由优化器将请求转化成执行计划,然后与存储引擎交互。)
这里的执行计划, 可以使用explain+SQL语句来模拟查询优化器,从而知道mysql是如何处理sql语句的。
二、执行计划中包含的信息
我们随意写个sql查询语句:explain select * from video_user;
结果如下:
我们参考下官网:https://dev.mysql.com/doc/refman/8.0/en/explain-output.html
如下:
1、id
select查询的序列号,包含一组数字,表示查询中执行select子句或者操作表的顺序。
(1)id数字相同,从上到下执行:
explain select * from video_user a join video_role b on a.role_id = b.role_id where a.role_id = 0;
(2)如果id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行。
explain select * from video_user a where a.role_id = (select b.role_id from video_role b where b.role_id = 0);
(3)id相同和不同的,同时存在:相同的,从上往下顺序执行,在所有组中,id值越大,优先级越高,越先执行。
explain select * from video_user a join video_role b on a.role_id = b.role_id where a.role_id = (select b.role_id from video_role b where b.role_id = 0);
2、select_type
用来分辨查询的类型,是普通查询还是联合查询还是子查询。
(1)SIMPLE:简单的查询,不包含子查询和union。
explain select * from video_user;
(2)PRIMARY:查询中若包含任何复杂的子查询,最外层查询则被标记为Primary。
(3)UNION:若第二个select出现在union之后,则被标记为union。
explain select * from video_user where role_id = 0 UNION select * from video_user where role_id = 1;
(4)DEPENDENT UNION:跟union类似,此处的depentent表示union或union all联合而成的结果会受外部表影响。
(5)UNION RESULT:从union表获取结果的select。
(6)SUBQUERY:在select或者where列表中包含子查询。
explain select * from video_user a join video_role b on a.role_id = b.role_id where a.role_id = (select b.role_id from video_role b where b.role_id = 0);
(7)DEPENDENT SUBQUERY:subquery的子查询要受到外部表查询的影响。
(8)DERIVED:from子句中出现的子查询,也叫做派生类。
explain select * from ( select role_id from video_user) t;
(9)UNCACHEABLE SUBQUERY:表示使用子查询的结果不能被缓存。
(10)UNCACHEABLE UNION :表示union的查询结果不能被缓存。
3、table
表示对应语句正在访问哪个表,可能是表名、别名、临时表、union合并结果集等。
4、type
表示访问类型,怎么样的方式去访问表数据,比如全表扫描。效率从好到坏如下:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
加粗的是要重点关注的,一般情况下,得保证查询至少达到range级别,最好能达到ref。
(1)all:全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。
explain select * from video_user;
(2)index:全索引扫描,这个比all的效率要好,主要有两种情况:一种是当前的查询是覆盖索引,即我们需要的数据在索引中就可以索取,二是使用了索引进行排序,这样就避免数据的重排序。
explain select user_id from video_user;
(3)range:表示利用索引查询的时候限制了范围,在指定范围内进行查询,这样避免了index的全索引扫描,适用的操作符: =, <>, >, >=, <, <=, IS NULL, BETWEEN, LIKE, or IN()
explain select user_id from video_user where user_id >= 100;
(4)ref:使用了非唯一性索引进行数据的查找
create index idx_3 on video_user(role_id);
explain select * from video_user where role_id =0;
(5)const:这个表至多有一个匹配行。常量。通常情况下,如果将一个主键放置到where后面作为条件查询,mysql优化器就能把这次查询优化转化为一个常量。
explain select * from video_role where role_id =0;
5、possible_keys
显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用。
参考上图。
6、key
实际使用的索引,如果为null,则没有使用索引,查询中若使用了覆盖索引,则该索引和查询的select字段重叠。
7、key_len
表示索引中使用的字节数,可以通过key_len计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。
8、ref
显示索引的哪一列被使用了,如果索引查找的是一个常量值,则ref是const,如果查找的是范围值,则ref是null。
9、row
根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的sql找了多少数据,在完成目的的情况下越少越好。
explain select * from video_user;
10、extra
额外信息。
(1)using index:这个表示当前的查询是覆盖索引的,直接从索引中读取数据,而不用访问数据表。如果同时出现using where 表明索引被用来执行索引键值的查找,如果没有,表明索引被用来读取数据,而不是真的查找。
(2)using where:使用where进行条件过滤。
(3)impossible where:where语句的结果总是false。
(4)using join buffer:使用连接缓存。
(5)using filesort:说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置。
explain select * from video_user ORDER BY role_id ;
(6)using temporary:建立临时表来保存中间结果,查询完成之后把临时表删除。