整体架构
server层包括连接器、查询缓存、分析器、优化器、执行器;存储引擎层负责数据的存储和提取,支持InnoDB、MyISAM、Memory等多个存储引擎。现在最常用的存储引擎是InnoDB,它从MySQL 5.5.5版本开始成为了默认存储引擎,如果在create table后面加一个“engine=”的话可以指定引擎,不然默认的是innodb。
查询语句执行
连接器
负责跟客户端建立连接、获取权限、维持和管理连接。
# -h 指定 MySQL 服务得 IP 地址,如果是连接本地的 MySQL服务,可以不用这个参数;
# -u 指定用户名,管理员角色名为 root;
# -p 指定密码,如果命令行中不填写密码(为了密码安全,建议不要在命令行写密码),就需要在交互对话里面输入密码
mysql -h$ip -u$user -p
一个用户成功建立连接之后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在的权限。修改完成之后,只有再新建的连接才会使用新的权限设置。
连接完成之后如果没有后续的动作,这个连接就处于空闲状态,客户端如果太长时间没有动静,连接器就会自动将他断开,这个事件是由wait_timeout控制的,默认值是8个小时。
长连接和短链接
- 长连接:连接成功之后,如果客户端持续有请求,则一直使用同一个连接。
- 短连接:每次执行完很少的几次查询就断开连接,下次查询重新建立一个。
尽量使用长连接,但是全部使用长连接,内存会涨的很快,然后OOM。可以定期断开长连接,或者执行mysql_reset_connection(MySQL5.7或者更新版本)来重新初始化连接资源,这个过程不需要重连和重新做权限验证,但是会将连接恢复到刚刚创建完的状态。
查询缓存
之前执行过的语句和结果有可能会以key-value的形式被直接缓存在内存中。但是不建议使用查询缓存。因为查询缓存失效非常频繁,除非你的业务就是一张静态表很久才会更新一次,比如一张系统配置表。MySQL8.0之后就没有查询缓存这个功能了。
分析器
- 词法分析:识别里面的字符串是什么,代表什么
- 语法分析:根据语法规则判断语法是否正确
优化器
决定使用哪个索引、决定各个表的连接顺序 。
执行器
- 判断你对这个表有没有执行查询的权限
- 打开表执行,执行器根据表的引擎定义去使用这个引擎提供的接口
举个例子:
select * from T where ID=10;
表T中,如果ID字段没有索引,那么执行器的执行流程是这样的:
1、调用InnoDB引擎接口取这个表的第一行,判断ID值是不是10,如果不是则跳过,如果是则
将这行存在结果集中;
2、 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
3、执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
至此,这个语句就执行完成了。对于有索引的表,执行的逻辑也差不多。第一次调用的是“取满足条件的第一行”这个接口,之后循环取“满足条件的下一行”这个接口,这些接口都是引擎中已经定义好的。
更新语句执行
创建一个表:
mysql> create table T(ID int primary key, c int);
如果要将ID=2这一行的值加1
mysql> update T set c=c+1 where ID=2;
首先,更新语句也会将查询语句的流程走一遍:
- 连接器连接数据库
- 查询缓存失效,这条语句将表T上所有缓存清空
- 分析器通过词法分析和语法分析知道这是一条更新语句
- 优化器决定使用ID这个索引
- 执行器负责具体执行,找到这一行然后更新
更新流程涉及两个日志模块redo log 和binlog。
redo log
WAL技术:Write-Ahead Loogin ,先写日志,再写磁盘。
有一条记录需要更新的时候,InnoDB引擎会先把记录写到redo log里面,并且更新内存,适当的时候,InnoDB会将这个操作记录更新到磁盘里面。redo log是固定大小的,如下图:
- write pos是当前记录的位置,一边写一边后移,写到第3号文件末尾后就回到0号文件开头。
- checkpoint是当前要擦除的位置,也是往后推移并且循环的,擦除记录前要把记录更新到数据文
件。 - write pos和checkpoint之间的是还空着的部分,可以用来记录新的操作。
- 如果write pos追上checkpoint,这时候不能再执行新的更新,得停下来先擦掉一些记录,把checkpoint推进一下。
crash-safe:有了redo log,InnoDB就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失这也是为什么需要两份日志的原因,因为binlog没有这个能力。
binlog归档日志
redo log是InnoDB引擎特有的性质,server层也有自己的日志称为binlog.
binlog和redo log的区别
- redo log是InnoDB引擎特有的;binlog是MySQL的Server层实现的,所有引擎都可以使用。
- redo log是物理日志,记录的是“在某个数据页上做了什么修改”;binlog是逻辑日志,记录的是这个语句的原始逻辑,比如“给ID=2这一行的c字段加1 ”。
- redo log是循环写的,空间固定会用完;binlog是可以追加写入的。“追加写”是指binlog文件写到一定大小后会切换到下一个,并不会覆盖以前的日志。
执行器和InnoDB引擎执行更新语句的时候的内部流程
- 执行器先找引擎取ID=2这一行。ID是主键,引擎直接用树搜索找到这一行。如果ID=2这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。
- 执行器拿到引擎给的行数据,把这个值加上1,比如原来是N,现在就是N+1,得到新的一行数据,再调用引擎接口写入这行新数据。
- 引擎将这行新数据更新到内存中,同时将这个更新操作记录到redo log里面,此时redo log处于prepare状态。然后告知执行器执行完成了,随时可以提交事务。
- 执行器生成这个操作的binlog,并把binlog写入磁盘。
- 执行器调用引擎的提交事务接口,引擎把刚刚写入的redo log改成提交(commit)状态,更新完成。
两阶段提交:prepare和commit
为什么需要两阶段提交?
- 如果先写redo log后写binlog:如果binlog没有写完就crash了,binlog里面没有记录这个语句,所以之后备份日志的时候binlog就没有这个语句。
- 先写binlog后写redo log ,redo log还没有写的时候就崩溃了,恢复之后,binlog就多出来了一个事务。
这样会导致数据库的状态和用它的日志恢复出来的库的状态不一致。
- redo log用于保证crash-safe能力。innodb_flush_log_at_trx_commit这个参数设置成1的时候,表示每次事务的redo log都直接持久化到磁盘。建议设置成1,这样可以保证MySQL异常重启之后数据不丢失。
- sync_binlog这个参数设置成1的时候,表示每次事务的binlog都持久化到磁盘。建议设置成1,这样可以保证MySQL异常重启之后binlog不丢失。