一、mysql的逻辑架构
1. 逻辑架构剖析
1.1 服务器处理客户端请求
mysql是典型的c/s架构,即 client/server 架构,不论是客户端进程和服务器进程是采用哪种方式进行通信,最后实现的效果都是:客户端进程向服务器进程发送一段文本(sql语句),服务器进程处理后再向客户端进程发送一段文本(处理结果)
下面具体展开看一下:
系统(客户端)访问 MySQL 服务器前,做的第一件事就是建立 TCP 连接。
经过三次握手建立连接成功后, MySQL 服务器对 TCP 传输过来的账号密码做身份认证、权限获取。
- 用户名或密码不对,会收到一个Access denied for user错误,客户端程序结束执行
赖于此时读到的权限 - 用户名密码认证通过,会从权限表查出账号拥有的权限与连接关联,之后的权限判断逻辑,都将依
思考一个问题:一个系统只会和mysql服务器建立一个连接么?只能有一个系统和mysql服务器建立连接么?
当然不是,多个系统哦都可以和mysql服务器建立连接,每个系统建立的连接肯定不止一个,所以,为了解决tcp无限创建与tcp频繁连创建销毁带来的资源耗尽,性能下降问题,mysql服务器里有专门的tcp连接池限制连接数,采用长连接模式服务tcp连接,来解决上述问题
TCP 连接收到请求后,必须要分配给一个线程专门与这个客户端的交互。所以还会有个线程池,去走后面的流程。每一个连接从线程池中获取线程,省去了创建和销毁线程的开销。
第2层:服务层
- SQL Interface: SQL接口
- 接收用户的SQL命令,并且返回用户需要查询的结果。比如SELECT ... FROM就是调用SQL Interface
- MySQL支持DML(数据操作语言)、DDL(数据定义语言)、存储过程、视图、触发器、自定义函数等多种SQL语言接口
- Parser: 解析器
- 在解析器中对 SQL 语句进行语法分析、语义分析。将SQL语句分解成数据结构,并将这个结构传递到后续步骤,以后SQL语句的传递和处理就是基于这个结构的。如果在分解构成中遇到错误,那么就说明这个SQL语句是不合理的。
- 在SQL命令传递到解析器的时候会被解析器验证和解析,并为其创建 语法树 ,并根据数据字典丰富查询语法树,会 验证该客户端是否具有执行该查询的权限 。创建好语法树后,MySQL还会对SQl查询进行语法上的优化,进行查询重写。
- Optimizer: 查询优化器
- SQL语句在语法解析之后、查询之前会使用查询优化器确定 SQL 语句的执行路径,生成一个执行计划 。
- 这个执行计划表明应该 使用哪些索引 进行查询(全表检索还是使用索引检索),表之间的连接顺序如何,最后会按照执行计划中的步骤调用存储引擎提供的方法来真正的执行查询,并将查询结果返回给用户。
- 它使用“ 选取-投影-连接 ”策略进行查询。例如:
SELECT id,name FROM student WHERE gender = ' 女 ' ;
- Caches & Buffers: 查询缓存组件
- MySQL内部维持着一些Cache和Buffer,比如Query Cache用来缓存一条SELECT语句的执行结果,如果能够在其中找到对应的查询结果,那么就不必再进行查询解析、优化和执行的整个过程了,直接将结果反馈给客户端。
- 这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等
- 这个查询缓存可以在 不同客户端之间共享 。
- 从MySQL 5.7.20开始,不推荐使用查询缓存,并在 MySQL 8.0中删除 。
举例:
比如现在有一个查询过来 ,我们的执行顺序是:
1、首先从客户端发起对服务端的连接,建立连接。
2、建立连接之后,需要专门分配一个线程来处理sql语句
3、对接sql Interface,相当于出入口
4、5.7的mysql中会先去 查询缓存中是都之前这个sql已经查过了,如果查过了就不会往下执行了,会直接把结果返回给客户端。(但是8.0中已废除)
5、然后会经过解析器来判断sql有没有问题,然后创建语法树
6、解析器是分析出来你要做什么,优化器可以对sql进行逻辑上的优化, 例如能不能使用索引或者使用哪个索引,就是我们优化器来做的事情。
7、需要调用对应存储api,体现的就是具体的存储引擎,然后去文件系统中做具体数据的查找,将数据加载到那内存中操作。
8、将结果缓存起来。
9、查询结果经过sql Interface,将数据返回。
10、线程用完了放回线程池当中,结果返回给客户端
简化为三层结构:
1. 连接层:客户端和服务器端建立连接,客户端发送 SQL 至服务器端;
2. SQL 层(服务层):对 SQL 语句进行查询处理;与数据库文件的存储方式无关;
3. 存储引擎层:与数据库文件打交道,负责数据的存储和读取。
二、sql执行流程
2.1 MySQL 中的 SQL执行流程:
SELECT employee_id,last_name FROM employees WHERE employee_id = 101;
查询缓存是提前把查询结果缓存起来,这样下次不需要执行就可以直接拿到结果。需要说明的是,在MySQL 中的查询缓存,不是缓存查询计划,而是查询对应的结果。这就意味着查询匹配的 鲁棒性大大降低 ,只有 相同的查询操作才会命中查询缓存 。两个查询请求在任何字符上的不同(例如:空格、注释、大小写),都会导致缓存不会命中。因此 MySQL 的 查询缓存命中率不高 。
同时,如果查询请求中包含某些系统函数、用户自定义变量和函数、一些系统表,如 mysql 、information_schema、 performance_schema 数据库中的表,那这个请求就不会被缓存。以某些系统函数 举例,可能同样的函数的两次调用会产生不一样的结果,比如函数 NOW ,每次调用都会产生最新的当前时间,如果在一个查询请求中调用了这个函数,那即使查询请求的文本信息都一样,那不同时间的两次查询也应该得到不同的结果,如果在第一次查询时就缓存了,那第二次查询的时候直接使用第一次查询的结果就是错误的!
此外,既然是缓存,那就有它 缓存失效的时候 。MySQL的缓存系统会监测涉及到的每张表,只要该表的结构或者数据被修改,如对该表使用了 INSERT 、 UPDATE 、 DELETE 、 TRUNCATE TABLE 、 ALTER TABLE 、 DROP TABLE 或 DROP DATABASE 语句,那使用该表的所有高速缓存查询都将变为无效并从高速缓存中删除!对于 更新压力大的数据库 来说,查询缓存的命中率会非常低。
总之,因为查询缓存往往弊大于利,查询缓存的失效非常频繁,所以一般建议在静态表中使用查询缓存,而且只有8以下的版本才有这个功能,所以自行了解即可。
select department_id,job_id,avg(salary) from employees group by department_id;
select * from test1 join test2 using (ID)where test1 .name = 'zhangwei' and test2 .name = 'mysql 高级课程 ' ;
方案 1 :可以先从表 test1 里面取出 name='zhangwei' 的记录的 ID 值,再根据 ID 值关联到表 test2 ,再判 断 test2 里面 name 的值是否等于 'mysql 高级课程 ' 。方案 2 :可以先从表 test2 里面取出 name='mysql 高级课程 ' 的记录的 ID 值,再根据 ID 值关联到 test1 , 再判断 test1 里面 name 的值是否等于 zhangwei 。这两种执行方法的逻辑结果是一样的,但是执行的效率会有不同,而优化器的作用就是决定选择使用哪一个方案。优化 器阶段完成后,这个语句的执行方案就确定下来了,然后进入执行器阶段。如果你还有一些疑问,比如优化器是怎么选择索引的,有没有可能选择错等。后面讲到索引我们再谈。
select * from test where id= 1 ;
调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 1 ,如果不是则跳过,如果是则将这行存在结果集中; 调用引擎接口取“ 下一行 ” ,重复相同的判断逻辑,直到取到这个表的最后一行。执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
2.2 MySQL8中SQL执行原理
1. 确认profiling 是否开启
了解查询语句底层执行的过程:select @@profiling; 或者 show variables like 'profiling'; 查看是否开启计划。开启它可以让mysql ,收集在sql执行是所使用的资源情况,命令如下:
mysql> select @@profiling ;mysql> show variables like 'profiling' ;
mysql> set profiling= 1 ;
mysql> select * from employees;
mysql> show profiles ; # 显示最近的几次查询
mysql> show profile ;
当然你也可以查询指定的 Query ID,比如:
mysql> show profile for query 7;
query_cache_type = 1
systemctl restart mysqld
mysql> set profiling= 1 ;
mysql> select * from locations;mysql> select * from locations;
6. 查看profile
mysql> show profile for query 1 ;
mysql> show profile for query 2;
结论不言而喻。执行编号2时,比执行编号1时少了很多信息,从截图中可以看出查询语句直接从缓存中获取数据。
2.4 查询其他的性能
mysql> show profile cpu,block io for query 6 ;
查询cpu的相关开销和io的相关开销。
继续:
mysql> show profile cpu,block io for query 7 ;