第二十二章:逻辑架构

news2024/10/5 15:27:09

第二十二章:逻辑架构

22.1:逻辑架构剖析

  1. 服务器处理客户端请求

    MySQL是典型的C/S架构,即Client/Server架构,服务端程序使用的mysqld。不论客户端进程和服务器进程是采用哪种方式进行通信,最后实现的效果都是:客户端进程向服务器进程发送一段文本(SQL语句),服务器进程处理后再向客户端进程发送一段文本(处理结果)。
    在这里插入图片描述

    下面具体展开看一下:
    在这里插入图片描述
    在这里插入图片描述

  2. Connectors

    ​ 是不同语言中SQL的交互。MySQL首先是一个网络程序,在TCP之上定义了自己的应用层协议。所以要使用MySQL,我们可以编写代码,MySQL Server建立TCP连接,之后按照其定义好的协议进行交互。或者比较方便的办法是调用SDK但通过SDK来访问MySQL,本质上还是在TCP连接上通过MySQL协议跟MySQL进行交互

  3. 第一层:连接层

    ​ 系统(客户端)访问MySQL服务器前,做的第一件是就是建立TCP连接。经过三次握手建立连接成功后,MySQL服务器对TCP传输过来的账号密码做身份认证、权限获取。

    • 用户名或密码不对,会受到一个Access denied for user错误,客户端程序结束执行。
    • 用户名密码认证通过,会从权限表查出账号拥有的权限与连接关联,之后的权限判断逻辑,都将依赖于此时读到的权限。

    ​ 多个系统都可以和MySQL服务器建立连接,每个系统建立的连接肯定不止一个。所以,为了解决TCP无限创建与TCP频繁创建销毁带来的资源耗尽、性能下降问题。MySQL服务器里有专门的TCP连接池限制连接数,采用长连接模式复用TCP连接。
    在这里插入图片描述

  4. 第二层:服务层

    ​ 主要完成大多数的核心服务功能,【sql接口、缓存的查询】在该层,服务器会解析查询并创建相应的内部解析树,并对其完成相应的优化。如果是SELECT语句,服务器还会查询内部缓存

    • SQL InterfaceSQL接口

      1. 接收用户的SQL命令,并且返回用户需要查询的结果。比如SELECT ... FROM就是调用SQL Interface
      2. MySQL支持DML(数据操作语言)、DDL(数据定义语言)、存储过程、视图、触发器、自定义函数等多种SQL语言接口。
    • Parser:解析器

      1. 在解析器中对SQL语句进行语法分析、语义分析。将SQL语句分解成数据结构,并将这个结构传递到后续步骤,以后SQL语句的传递和处理就是基于这个结构的。
      2. SQL命令传递到解析器的时候会被解析器验证和解析,并为其创建语法树,并根据数据字典丰富查询语法树,会验证该客户端是否具有执行查询的权限
    • Optimizer:查询优化器

      1. SQL语句在语法解析之后、查询之前会使用查询优化器确定SQL语句的执行路径,生成一个执行计划。

      2. 这个执行计划表名应该使用哪些索引进行查询(全表检索还是使用索引检索),表之间的连接顺序如何,最后会按照执行计划中的步骤调用存储引擎提供的方法来真正的执行查询,并将查询结果返回给用户。

      3. 它使用选取-投影-连接策略进行查询

        # 这个SELECT查询显示根据WHERE语句进行选取,而不是将表全部查询出来以后再进行gender过滤。
        # 这个SELECT查询先根据id和name进行属性投影,而不是将属性全部取出来以后再进行过滤,
        # 将这个两个查询条件连接起来生成最终查询结果
        SELECT id, name FROM student WHERE gender = '女';
        
    • Caches & Buffers:查询缓存组件

      1. MySQL内部维持着一些CacheBuffer,比如Query Cache用来缓存一条SELECT语句的执行结果,如果能够在其中找到对应的查询结果,那么就不必再进行查询解析、优化和执行的整个过程了,直接将结构反馈给客户端。
      2. 这个缓存机制是由一些列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等。
      3. 这个查询缓存可以在不同客户端之间共享
      4. MySQL 5.7.20开始,不推荐使用查询缓存,并在MySQL 8.0中删除
  5. 第三层:引擎层

    # 查看mysql的默认支持存储引擎
    SHOW engines;
    

    ​ 他的架构可以在多种不同场景中应用并发挥良好作用,主要体现在存储引擎的架构上,插件式的存储引擎架构将查询处理和其他的系统任务以及数据的存储提取相分离。这种架构可以根据业务的需求和实际需要选择合适的存储引擎。同时开源的MySQL还允许开发人员设置自己的存储引擎

    ​ 插件式存储引擎层(Storage Engines),真正的负责了MySQL中数据的存储和提取,对物理服务器级别维护的底层数据执行操作,服务器通过API与存储引擎进行通信。不同的存储引擎具有的功能不同,这样我们可以根据自己的实际需要进行选取。

  6. 存储层

    ​ 所有的数据、数据库、表的定义,表的每一行的内容,索引,都是存在文件系统上,以文件的方式存在的,并完成与存储引擎的交互。当前有些存储引擎【InnoDB】也支持不使用文件系统直接管理裸设备,但现代文件系统的实现使得这样做没有必要了。在文件系统之下,可以使用本地磁盘,也可以使用DASNASSAN等各种存出系统。

22.2:SQL执行流程

  1. MySQL中的SQL执行流程
    在这里插入图片描述

    • 查询缓存

      Server如果在查询缓存中发现了这条SQL语句,就会直接将结果返回客户端,如果没有,就进入解析器阶段。需要说明的是,因为查询缓存往往效率不高,所以在MySQL 8.0之后就抛弃了这个功能。

    • 解析器:在解析器中对SQL语句进行语法分析、语义分析。
      在这里插入图片描述

      ​ 如果没有命中查询缓存,就要开始真正执行语句了。首先,MySQL需要知道你要做什么,因此需要对SQL语句做解析。

      ​ 分析器先做词法分析。你输入的是由多个字符串和空格组成的一条SQL语句,MySQL需要识别出里面的字符串分别是什么,代表什么。

      ​ 接着,要做语法分析。根据词法分析的结构,语法分析器会根据语法规则,判断你输入的这个SQL语句是否满足MySQL语法。如果你的语句不对,就会收到You have an error in your SQL syntax的错误提醒。如果SQL语句正确,则会生成一个语法树。
      在这里插入图片描述

      SQL词法分析的过程步骤:
      在这里插入图片描述

    • 优化器

      ​ 在优化器中会确定SQL语句的执行路径,比如是根据全表检索,还是根据索引检索等。经过了解析器,MySQL就知道你要做什么了。在开始执行之前,还要先经过优化器的处理。一条查询可以有很多种执行方式,最后都返回相同的结果。优化器的作用就是找到这其中最好的执行计划

      在查询优化器中,可以分为逻辑查询优化阶段和物理查询优化阶段。

      • 逻辑查询优化就是通过改变SQL语句的内容来使得SQL查询更高效,同时为物理查询优化提供更多的时候执行计划。通常采用的方式是对SQL语句进行等价变换,对查询进行重写,而查询重写的数学基础就是关系代数。对条件表达式进行等价谓词重写、条件简化,对视图进行重写,对子查询进行优化,对连接语义进行了外连接消除、嵌套连接消除等。
      • 物理查询优化是基于关系代数的查询重写,而关系大财叔的每一步都对应着物理计算,这些物理计算往往存在多种算法,因此需要计算各种物理路径的代价,从中选择代价最小的作为执行计划。在这个阶段里,对于表单和多表连接的操作,需要高效地使用索引,提升查询效率。
    • 执行器

      ​ 截止到现在,还没有真正去读写真实的表,仅仅只是产出一个执行计划。于是就进入了执行器阶段。在执行之前需要判断该用户是否具备权限。如果没有,就会返回权限错误。如果具备权限,就执行SQL查询并返回结果。在MySQL8.0以下的版本,如果设置了查询缓存,这时会将查询结果进行缓存。
      在这里插入图片描述

      SQL语句在MySQL中的流程是:SQL语句——查询缓存——解析器——优化器——执行器。
      在这里插入图片描述

  2. MySQL 8.0SQL执行原理

    ​ 既然一条SQL语句会经历不同的模块,那我们就来看下,在不同的模块中,SQL执行所使用的资源(时间)是怎样的。如何在MySQL中对一条SQL语句的执行时间进行分析。

    • 确认profiling是否开启

      # 查看是否开启计划
      SELECT @@profiling;  # 0代表关闭, 1代表开启
      SHOW VARIABLES LIKE 'profiling';  # 默认是OFF(关闭状态)
      
      # 打开profiling
      SET profiling=1;
      
    • 多次执行相同的SQL查询

      USE atguigudb;
      SHOW TABLES;
      SELECT * FROM employees;
      SELECT * FROM employees;
      
    • 执行profiles

      # 查看当前会话产生的所有profiles
      SHOW profile;
      
      # 查询指定的Query ID
      SHOW profile for query 7;
      
      # 查询结果更丰富
      SHOW profile cpu, block, io for query 6;
      

在这里插入图片描述
在这里插入图片描述

  1. MySQL5.7SQL执行原理

    上述操作在MySQL 5.7中测试,发现前后两次相同的sql语句,执行查询过程仍然是相同的。这里我们需要显示开启查询缓存模式

    • 配置文件中开启查询缓存

      # 在/etc/my.cnf中新增一行
      query_cache_type=1
      
    • 重启mysql服务

      systemctl restart mysqld
      
    • 开启查询执行计划

      SET profiling=1;
      
    • 执行语句两次

      SELECT * FROM locations;
      SELECT * FROM locations;
      
    • 查看profiles
      在这里插入图片描述

    • 查看profile

      显示执行计划,查看程序的执行步骤:
      在这里插入图片描述
      在这里插入图片描述

    • 注意1

      # SQL必须是一致的,否则,不能命中缓存
      SELECT * FROM employees;
      SELECT * FROM     employees;
      
    • 注意2:同样的开启缓存配置信息如果在MySQL8中添加。重启服务时会报错。

22.3:数据缓冲池

InnoDB存储引擎是以页为单位来管理存储空间的,我们进行的增删改查操作其实本质上都是在访问页面(包括读页面、写页面、创建新页面等操作)。而磁盘I/O需要消耗的时间很多,而在内存中进行操作,效率则会高很多,为了能让数据表或者索引中的数据随时被我们所用,DBMS会申请占用内存来作为数据缓冲池,在真正访问页面之前,需要把磁盘上的页缓存到内存中的Buffer Pool之后才可以访问。

​ 这样做的好处是可以让磁盘活动最小化,从而减少与磁盘直接进行I/O的时间。要知道,这种策略对提升SQL语句的查询性能来说至关重要。如果索引的数据在缓冲池里,那么访问的成本就会降低很多。

  1. 缓冲池VS查询缓存

    • 缓冲池

      InnoDB存储引擎中有一部分数据会放到内存中,缓冲池则占了这部分内存的大部分,它用来存储各种数据的缓存。
      在这里插入图片描述

      1. 缓存池的重要性

        ​ 对于使用InnoDB作为存储引擎的表来说,不管是用于存储用户数据的索引(包括聚簇索引和二级索引),还是各种系统数据,都是以的形式存放在表空间中的,而所谓的表空间只不过是InnoDB对文件系统上一个或几个实际文件的抽象,也就是说我们的数据说到底还是存储在磁盘上的。磁盘的速度慢的跟乌龟一样,这里缓冲池可以帮助我们消除CPU和磁盘之间的鸿沟。

        ​ 所以,InnoDB存储引擎在处理客户端的请求时,当需要访问某个页的数据时,就会把完整的页的数据全部加载到内存中,也就是说即使我们只需要访问一个页的一条记录,那也需要先把整个页的数据加载到内存中。将整个页加载内存中后就可以进行读写访问了,在进行读写访问之后并不着急把该页对应的内存空间释放掉,而是将其缓存起来,这样将来有请求再次访问该页面时,就可以**省去磁盘IO**的开销了。

      2. 缓存原则

        位置*频次这个原则,可以帮我们对I/O访问效率进行优化。首先,位置决定效率,提供缓冲池就是为了在内存中可以直接访问数据。其次频次决定优先级顺序。因为缓冲池的大小是有限的,会优先对使用频次高的热数据进行加载

      3. 缓冲池的预读特性

        ​ 缓冲池的作用就是提升I/O效率,而我们进行读取数据的时候存在一个"局部性原理",也就是说我们使用了一些数据,大概率还会使用它周围的一些数据,因此采用预读的机制提前加载,可以减少未来可能的磁盘I/O操作。

    • 查询缓存

      ​ 查询缓存是提前把查询结果缓存起来,这样下次不需要执行就可以直接拿到结果。需要说明的是,在MySQL中的查询缓存,不是缓存查询计划,而是查询对应的结果。因为命中条件苛刻,而且只要数据表发生变化,查询缓存就会失效,因此命中率低。

      ​ 缓冲池服务于数据库整体的I/O操作,它们的共同点都是通过缓存的机制来提升效率。

  2. 缓冲池如何读取数据

    ​ 缓冲池管理器会尽量将经常使用的数据保存起来,在数据库进行页面读操作的时候,首先会判断该页面是否在缓冲池中,如果存在就直接读取,如果不存在,就会通过内存或磁盘将页面放到缓冲池中在进行读取。
    在这里插入图片描述

    ​ 实际上,当我们对数据库中的记录进行修改的时候,首先会修改缓冲池中页面里的记录信息,然后数据库会以一定的频率刷新到磁盘上。注意并不是每次发生更新操作,都会立刻进行磁盘回写。缓冲池会采用一种叫做**checkpoint的机制**将数据回写到磁盘上,这样做的好处就是提升了数据库的整体性能。

    ​ 如果缓冲池不够用时,需要释放掉一些不常用的页,此时就可以强行采用checkpoint的方式,将不常用的脏页【缓冲池被修改过的页,与磁盘上的数据页不一致】回写到磁盘上,然后在从缓冲池中将这些页释放掉。

  3. 查看、设置缓冲池的大小

    如果你使用的是MySQL MyISAM存储引擎,它只缓存索引,不缓存数据,对应的键缓存参数为key_buffer_size

    如果你使用的是InnoDB存储引擎,可以通过查看innodb_buffer_pool_size变量来查看缓冲池的大小。

    # 查看缓冲池大小
    SHOW VARIABLES LIKE 'innodb_buffer_pool_size';
    
    # 修改缓冲池大小
    SET GLOBAL innodb_buffer_pool_size = 数值; # 单位是B
    # 在my.cnf中修改
    [server]
    innodb_buffer_pool_size=数值
    
  4. 多个Buffer cache实例

    Buffer Pool本质是InnoDB向操作系统申请的一块连续的内存空间,在多线程环境下,访问Buffer Pool中的数据都需要加锁处理。在Buffer Pool特别大而且多线程并发访问特别搞的情况下,单一的Buffer Pool可能会影响请求的处理速度。所以在Buffer Pool特别大的时候,我们可以把他们拆分成若干个小的Buffer Pool,每个Buffer Pool都称为一个实例,它们都是独立的,独立的去申请内存空间,独立的管理各种链表。所以在多线程并发访问时并不会相互影响,从而提高并发处理能力。

    # 在my.cnf配置文件中修改Buffer Pool的个数
    [server]
    innodb_buffer_pool_instances=2
    
    # 查看缓冲池的个数
    SHOW VARIABLES LIKE 'innodb_buffer_pool_instances';
    
    # 若果缓冲池的总空间小于1G,Buffer Pool设置多个实例是无效的, 只有缓冲池的总空间大于1G时,设置多个Buffer Pool才能生效
    # 每个Buffer Pool占用的空间:总空间/Buffer Pool的个数
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/743268.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VoLTE信令流程

文章目录 VoLTE概述VoLTE 协议栈IMS(IP Multimedia Subsystem),IP多媒体子系统会谈边界控制器(Session Border Controller, SBC)QCI (QoS Class Identifier),QoS类标识符 SIP(Session initialization Protocol&#xf…

Android mac 交叉编译与ffmpeg编译踩坑记 (v7a 与 v8a and 动态库与静态库)

Android mac 交叉编译与ffmpeg编译踩坑记 环境: system: mac NDK: android-ndk-r17c Fffmpeg: ffmpeg-4.0.2 Cmake: 3.10.2 Gradle: 4.1.3 tips: 本文记录踩坑过程,具体细节如果感兴趣可以在评论区留言交流讨论! mac 编译 (动态库(so)) 首先来回顾一下,mac原始库是如何…

Redis常见命令和使用示例

目录 1.使用官方文档学习redis 2.核心命令 SET GET 3.全局/通用命令 KEYS EXISTS DEL EXPIRE TTL TYPE 1.使用官方文档学习redis redis官网 点击搜索,输入,比如输入ping,会显示Commands,是一个命令,点击ping&#xff…

新版2021等启动unity包管理器本地服务器进程失败解决

1、问题 2、解决办法 最后我发现每个unity版本都有一个包管理器,也就是图中的路径,而且都是相同的路径,只是因为版本不同或多或少存在一些小差异,其他版本可以正常启动,就2021不行会不会是2021的包管理器这个文件夹出…

YOLOv5 实现 10 种热力图可视化方式教程

效果展示 GradCAMEigenCAMEigenGradCAMGradCAMElementWiseGradCAMPlusPlusHiResCAMLayerCAM

前端下载PDF内容空白且大小偏大问题解决

前端使用React框架axios请求后端接口下载文件,请求返回正常但文件大小和内容异常。经排查,其原因是使用了mockjs用作数据模拟,导致了请求异常,将其注释掉后,文件大小与内容恢复正常。 目录 1.文件异常 2.定位问题 3…

【C语言进阶技巧】指针解密:炼金术士的秘密面试题揭秘

【C语言进阶技巧】指针解密:炼金术士的秘密面试题揭秘 1. 主要涉及sizeof与strlen函数的使用的笔试题1.1 笔试题一(一维整形数组)1.2 笔试题二(不带\0的字符数组)1.3 笔试题三(带\0的字符数组)1.4 笔试题四 &#xff0…

【C#】默认打开图片、文件下载

系列文章 【C#】编号生成器(定义单号规则、固定字符、流水号、业务单号) 本文链接:https://blog.csdn.net/youcheng_ge/article/details/129129787 【C#】日期范围生成器(开始日期、结束日期) 本文链接:h…

Linux(centos7)系统关闭 virbr0

背景: 在使用 VMware 虚拟机安装 centos7 操作系统中,经常出现将 IP 地址分配到虚拟网桥接口virbr0 上,引起虚拟机不能正常访问网络的问题。 我是在学习 docker 网络分析这块遇到的问题,教程上在虚拟机上输入 ip addr 并没有出现 …

linux开发工具:repo

1:repo简单介绍 repo是Google开发的用于管理Android版本库的一个工具,它是由一系列的Python脚本组成,封装了一系列的Git命令,用来统一管理多个Git仓库。repo不是用于取代git,而是简化了对多个Git版本库的管理。 repo…

6 种方式读取 Springboot 的配置(原理+实战)

从配置文件中获取属性应该是SpringBoot开发中最为常用的功能之一,但就是这么常用的功能,仍然有很多开发者在这个方面踩坑。 我整理了几种获取配置属性的方式,目的不仅是要让大家学会如何使用,更重要的是弄清配置加载、读取的底层…

搭建Promethues + grafana +alertManager+blakbox 监控springboot 健康和接口情况

一。概述 架构图: 拓扑图: prometheus 是一个开源系统,用于构建监控和报警的工具包。 Prometheus 收集其指标并将其存储为时间序列数据,即指标信息与记录它的时间戳一起存储,以及称为标签的可选键值对。 特点&#…

003.PADS VX2.4选项设置及显示颜色设置

文章目录 一、PADS颜色设置及选项设置二、选项设置1.全局2.设计3.栅格和捕获4.显示5.布线选项页6.覆铜平面选项页7.文本和线选项页8.文本和线选项页9.过孔样式选项页 一、PADS颜色设置及选项设置 一、颜色设置 1.点击设置—显示颜色)(快捷键…

Kkfileview | Docker | 文件预览kkfile配置

文章目录 简介DockerRedis部署 简介 kkFileView为文件文档在线预览解决方案,该项目使用流行的spring boot搭建,易上手和部署,基本支持主流办公文档的在线预览,如doc,docx,xls,xlsx,ppt,pptx,pdf,txt,zip,rar,图片,视频,音频等等 …

SQLSERVER 临时表 和 表变量 有区别吗

一:背景 1. 讲故事 今天和大家聊一套面试中经常被问到的高频题,对,就是 临时表 和 表变量 这俩玩意,如果有朋友在面试中回答的不好,可以尝试看下这篇能不能帮你成功迈过。 二:到底有什么区别 1. 前置思…

十五、flex弹性元素的样式

目录&#xff1a; 1. 基本布局 2. 弹性元素的属性&#xff1a;flex-grow 3. 弹性元素的属性&#xff1a;flex-shrink 4. 弹性元素的属性&#xff1a;flex-basis 5. flex 统一设置这3个属性&#xff08;常用&#xff09; 6. order 一、基本布局 <style>*{margin: 0;paddin…

【Maven】类或者包提示找不到,报红

背景 使用IDEA&#xff0c;类或者包提示找不到&#xff0c;报红 解决方法 1. maven reload 2. 检查profiles是否对 3. 不要选中offline模式 4. 检查本地仓库位置 5. 清掉idea缓存 6. 到本地maven仓库删掉出错的包然后重新maven reload 7. update本地仓库 8. 排查是不是别人没…

智慧用电安全监控管理系统

智慧用电安全监控管理系统是一种基于物联网技术的用电安全管理系统&#xff0c;它通过远程通信技术和云计算平台&#xff0c;实现了对电气设备的实时监控、数据采集、费用计算、远程控制等功能。该系统不仅可以提高用电安全管理的效率&#xff0c;还可以为用户提供更加便捷、可…

Linux(centos 7)将 ens33 改为 eth0

背景&#xff1a; 先说明一下 eth0 与 ens33 的关系&#xff0c;目前的主流网卡为使用以太网络协定所开发出来的以太网卡&#xff08;Ethernet)&#xff0c;因此我们 Linux 就称呼这种网络接口为 ethN (N为数字)。 举个例子&#xff1a;就是说主机上面有一张以太网卡&#xff0…

C++线性表、单链表

概述 在先说链表前&#xff0c;我们先来理清几个概念。 什么是线性表、顺序表和链表&#xff1f;三者有什么关系&#xff1f; 线性表&#xff1a;元素线性排列&#xff0c;在逻辑上具有次序的存储结构。 顺序表&#xff1a;线性表的顺序存储称为线性表。它是用一组地址连续(逻…