MYSQL基础架构
- 连接器
- 查询缓存
- 分析器
- 优化器
- 执行器
- 存储引擎
比如说,我们经常能够在mysql的查询语句中看到如下的查询语句:
mysql> select * from T where ID=10;
在了解它在mysql中的执行流程之前,首先我们来看一下mysql中的基本架构:
大体来说,MySQL 可以分为 Server 层和存储引擎层两部分。
Server 层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖MySQL 的大多数核 心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等。 而存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持 InnoDB、MyISAM、 Memory 等多个存储引擎。现在最常用的存储引擎是 InnoDB,它从 MySQL 5.5.5 版本开 始成为了默认存储引擎。
- 连接器:管理连接,权限验证
- 查询缓存:命中直接返回结果
- 分析器:词法分析,语法分析
- 优化器:执行计划生成,索引选择
- 存储引擎:存储数据,提供读写接口
连接器
在使用数据库之前,我们首先需要连接到这个数据库上,这个时候就用到了连接器。
连接器负责跟客户端建立连接,获取权限,维持和管理连接。
这个连接过程是使用的TCP连接,所以在经历过TCP的三次握手之后,我们的连接建立成功,然后连接器就需要认证身份,判断用户名和密码是否正确。
- 若验证成功,连接器会查出用户的权限,之后在这个连接里面做的操作都依赖于这个权限。这就意味着,一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置。
- 若验证失败,就返回错误提示“Access denied for user”,然后客户端程序结束执行。
客户端如果太长时间没动静,连接器就会自动将它断开。这个时间是由参数 wait_timeout
控制的,默认值是 8 小时
数据库的连接有短连接和长连接:
- 长连接是指连接成功后,如果客户端持续有请求,就一直使用同一个连接
- 短连接是指每次执行完很少的几次查询就断开连接,下次查询再重新建立连接
因为mysql在执行过程中临时使用的内存是管理在连接对象里面的,虽然长连接可以减少建立连接的动作,但是长时间使用会占用内存过大。
解决方式:
- 定期断开长连接。使用一段时间,或者程序里面判断执行过一个占用内存的大查询后,
断开连接,之后要查询再重连。 - 如果你用的是 MySQL 5.7 或更新版本,可以在每次执行一个比较大的操作后,通过执行mysql_reset_connection 来重新初始化连接资源。这个过程不需要重连和重新做权限验证,但是会将连接恢复到刚刚创建完时的状态。
查询缓存
MySQL 拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。之前执
行过的语句及其结果可能会以 key-value 对的形式,被直接缓存在内存中。key 是查询的语句,value 是查询的结果。如果你的查询能够直接在这个缓存中找到 key,那么这个value 就会被直接返回给客户端。
但是只要对表的内容有更新,这个表上的缓存就会被清空,因此使用查询缓存的效率并不高,在8.0之后mysql中已经将其废弃了。
分析器
分析器先会做“词法分析”。你输入的是由多个字符串和空格组成的一条 SQL 语句,MySQL 需要识别出里面的字符串分别是什么,代表什么。
MySQL 从你输入的"select"这个关键字识别出来,这是一个查询语句。它也要把字符串“T”识别成“表名 T”,把字符串“ID”识别成“列 ID”。
做完了这些识别以后,就要做“语法分析”。根据词法分析的结果,语法分析器会根据语法规则,判断你输入的这个 SQL 语句是否满足 MySQL 语法。
优化器
优化器是在表里面有多个索引的时候,决定使用哪个索引;或者在一个语句有多表关联
(join)的时候,决定各个表的连接顺序。
优化器会选择一个执行效率最高的合适的顺序进行执行。
执行器
执行器调用存储引擎执行语句
比如最开头的那个查询语句的执行流程如下:(假设没有索引)
- 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 10,如果不是则跳过,如
果是则将这行存在结果集中; - 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
- 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
存储引擎
MyISAM是MySQL的默认数据库引擎(5.5版之前)。虽然性能极佳,而且提供了大量的特性,包括全文索引、压缩、空间函数等,但MyISAM不支持事务和行级锁,而且最大的缺陷就是崩溃后无法安全恢复。不过,5.5版本之后,MySQL引入了InnoDB(事务性数据库引擎),MySQL 5.5版本后默认的存储引擎为InnoDB。
两者的对比:
- 是否支持行级锁 : MyISAM 只有表级锁(table-level locking),而InnoDB 支持行级锁(row-level locking)和表级锁,默认为行级锁。
- 是否支持事务和崩溃后的安全恢复: MyISAM 强调的是性能,每次查询具有原子性,其执行速度比InnoDB类型更快,但是不提供事务支持。但是InnoDB 提供事务支持,外部键等高级数据库功能。 具有事务(commit)、回滚(rollback)和崩溃修复能力(crash recovery capabilities)的事务安全(transaction-safe (ACID compliant))型表。
- 是否支持外键: MyISAM不支持,而InnoDB支持。
- 是否支持MVCC :仅 InnoDB 支持。应对高并发事务, MVCC比单纯的加锁更效;MVCC只在
READ COMMITTED
和REPEATABLE READ
两个隔离级别下工作;MVCC可以使用 乐观(optimistic)锁 和 悲观(pessimistic)锁来实现;各数据库中MVCC实现并不统一。