MySQL之性能分析和系统调优

news2025/1/9 1:19:00

MySQL之性能分析和系统调优

性能分析

查看执行计划 EXPLAIN

EXPLAIN作为MySQL的性能分析神器,可以用来分析SQL执行计划,需要理解分析结果可以帮助我们优化SQL

explain selectfrom[where ...]

TABLE

表名 查询的每一行记录都对于着一张表

id

该语句的唯一标识。如果explain的结果包括多个id值,则数字越大越先执行;而对于相同id的行,则表示从上往下依次执行。

select_type

每一个子查询在语句中扮演的角色

  • simple: 不包含union或者子查询的语句
  • primary :最外层的查询
  • union: union中第二个后随后的select被标记为union;如果union被from子句中的子查询包含,那么它的第一个select会被标记为derived
  • dependent union: union中第二个或后面的的查询依赖了外面的查询
  • subquery: 子查询的第一个select
  • dependent subquery: 子查询的第二个或后面的select 依赖了外面的查询
  • derived :表示包含在from子句的子查询中的select,MySQL会将执行结果放在一个临时表中;MySQL内部将其称为derived table,因为该表是从临时查询中派生出来的
  • materialized:将子查询物化之后供外层连接使用

partitions

当前查询匹配记录的分区

type

执行查询时的访问方法

  • system:表中只有一个数据并且使用的存储引擎的统计数据是精确的,有一个变量记录(比如myisam memory)

  • const:根据主键或者唯一的二级索引列等值匹配时

  • eq_ref:被驱动表是通过主键或者唯一的二级索引进行匹配的

  • ref:普通的二级索引进行等值匹配

  • ref_or_null:该类型类似于ref,但是MySQL会额外搜索哪些行包含了NULL。这种类型常见于解析子查询

  • index_merge:此类型表示使用了索引合并优化,表示一个查询里面用到了多个索引

  • unique_subquery:该类型和eq_ref类似,但是使用了IN查询,且子查询是主键或者唯一索引

  • index_subquery:和unique_subquery类似,只是子查询使用的是非唯一索引

  • range:范围扫描,表示检索了指定范围的行,主要用于有限制的索引扫描

  • index:全索引扫描,和ALL类似,只不过index是全盘扫描了索引的数据

    查询仅使用索引中的一部分列时,可使用此类型。有两种场景会触发:

    • 如果索引是查询的覆盖索引,并且索引查询的数据就可以满足查询中所需的所有数据,则只扫描索引树。此时,explain的Extra 列的结果是Using index。index通常比ALL快,因为索引的大小通常小于表数据。
    • 按索引的顺序来查找数据行,执行了全表扫描。此时,explain的Extra列的结果不会出现Uses index。
  • all:全表扫描,性能最差

possible_keys

展示当前查询可以使用哪些索引,这一列的数据是在优化过程的早期创建的,因此有些索引可能对于后续优化过程是没用的。

key

表示MySQL实际选择的索引

key_len

索引使用的字节数。由于存储格式,当字段允许为NULL时,key_len比不允许为空时大1字节
主要针对联合索引,是否充分利用索引

ref

表示将哪个字段或常量和key列所使用的字段进行比较。

如果ref是一个函数,则使用的值是函数的结果。要想查看是哪个函数,可在EXPLAIN语句之后紧跟一个SHOW WARNING语句。

rows

MySQL估算会扫描的行数,数值越小越好。

filtered

表示符合查询条件的数据百分比,最大100。用rows × filtered可获得和下一张表连接的行数。例如rows = 1000,filtered = 50%,则和下一张表连接的行数是500。

extra

  • no tables used:没有from子句
  • impossible where:where始终为false
  • using where:不使用索引;使用索引但包含不使用索引的条件
  • no match min/max:使用聚合函数但没有匹配的where、
  • using index:查询到数据使用二级索引不需要进行回表操作;如果进行回表则是null
  • using index condition:Index condition pushdown索引条件下推

EXPLAIN格式

  • 传统格式:缺少一个衡量执行计划好坏的重要信息–成本
  • JSON格式:在explain和语句之间加上format=JSON 多一些详细信息如成本
  • TREE格式:在8.0.16新增格式 主要由各部分之间的关系和执行顺序决定
  • 可视化输出:workbench

show warmings

展示真实执行的sql语句

数据库设计规范

数据库主键的设计

自增ID

自增ID的问题(缺点太多)核心业务不推荐使用

1.可靠性不高,在集群模式下存在自增ID回溯的问题

2.安全性不高,容易被被爬虫获取数据

3.性能差,需要占用数据库服务端的资源(有AUTO-INC锁来完成)

4.交互多

5.局部唯一性(在一台机器下)

业务字段

与业务有关的字段不能设计为主键,对于数据库维护造成很大困难

UUID

优点:性能高;不依赖网络;使用简单;全局唯一

缺点:占用36个字节,长度过长,没有含义,无序

有序UUID

将时间高位和地位互换,这样时间保证了单调递增,去掉无用‘-’并使用二进制存储

雪花算法

时间戳(数据单调递增)+数据中心ID+机器编码(全局唯一性)+序列号(1ms内生成多个ID的问题)

缺点:

依赖了机器ID的分配,集群的扩容和缩容需要重新分配,可能会导致ID重复

(解决:可以使用zookeeper的临时顺序节点分配ID)

依赖了系统时间,如果集群中的机器时间被回拨,也可能造成ID重复

(解决:一个客户端:在取到新ID后与之前最大的ID比较,如果ID变小则报错或者等待)

(集群:美团的leaf每次有新节点接入zk时会将节点上报的时间和集群平均的时间对比,如果新加入的节点的时间落后于平均时间则报错)

范式

1NF

确保每一个字段的值都有原子性,属性的原子性有主观性(字段不可再分)

2NF

得有主键,且非主键字段必须完全依赖于主键,不能只依赖主键的一部分

一个表只表达一个意思

如果不完全依赖候选键会导致

1.数据冗余(重复数据记录多次)

2.插入异常

3.删除异常

4.更新异常

应该将表拆分直到满足2NF

3NF

非主键字段不能依赖于其他非主键字段(非主键字段之间相互独立)不存在传递性

反范式化

遵循业务优先的原则,为了减少关联查询可以适当增加冗余字段来增强读性能,以空间换时间

一个表中的字段修改那么也应该同步修改另一张表,保证数据一致性

适用场景

增加的冗余字段不需要经常进行修改,查询的时候不可或缺

SQL语句调优

逻辑查询优化

关联查询优化

联接算法

联接算法是MySQL数据库用于处理联接的物理策略。目前MySQL数据库仅支持Nested-Loops Join算法。

两张表的Join的过程:

在这里插入图片描述

上图的Fetch阶段是指当内表关联的列是辅助索引时,但是需要访问表中的数据,那么这时就需要再访问主键索引才能得到数据的过程,不论表的存储引擎是InnoDB存储引擎还是MyISAM,这都是无法避免的,只是MyISAM的回表速度要快点,因为其辅助索引存放的就是指向记录的指针,而InnoDB存储引擎是索引组织表,需要再次通过索引查找才能定位数据。

Fetch阶段也不是必须存在的,如果是聚集索引联接,那么直接就能得到数据,无需回表,也就没有Fetch这个阶段。另外,上述给出了两张表之间的Join过程,多张表的Join就是继续上述这个过程。

接着计算两张表Join的成本,这里有下列几种概念:

外表的扫描次数,记为O。通常外表的扫描次数都是1,即Join时扫描一次外表(驱动表)的数据即可

内表的扫描次数,记为I。根据不同Join算法,内表(被驱动表)的扫描次数不同

读取表的记录数,记为R。根据不同Join算法,读取记录的数量可能不同

Join的比较次数,记为M。根据不同Join算法,比较次数不同

回表的读取记录的数,记为F。若Join的是辅助索引,可能需要回表取得最终的数据

  • Simple Nested-Loops Join(SNLJ,简单嵌套循环联接)

没有索引,小表驱动大表;暴力循环查找

  • Index Nested-Loops Join(INLJ,基于索引的嵌套循环联接)

在内表建立索引,以此降低Nested-Loop Join算法的开销,减少内表扫描次数

外连接消除

我们前边说过,内连接的驱动表和被驱动表的位置可以相互转换,而左(外)连接和右(外)连接的驱动表和被驱动表是固定的,因为有些不满足联接条件的记录会通过外部表行的方式再次添加到结果中。这就导致内连接可以通过优化表的连接顺序来降低整体的查询成本,而外连接却无法优化表的连接顺序。

外连接和内连接的本质区别就是:对于外连接的驱动表的记录来说,如果无法在被驱动表中找到匹配ON子句中的过滤条件的记录,那么该记录仍然会被加入到结果集中,对应的被驱动表记录的各个字段使用NULL值填充;而内连接的驱动表的记录如果无法在被驱动表中找到匹配ON子句中的过滤条件的记录,那么该记录会被舍弃。

  • Block Nested-Loops Join(BNL,基于块的嵌套循环联接)

引入join buffer缓冲区不是一次一条取驱动表数据而是一块一块取减少IO次数,在8.0.2版本被hash join替代

整体效率:INLJ>BNLJ>SNLJ

优化策略

1.用小的结果集驱动大的结果集

2.为被驱动表的匹配条件字段增加索引减少内层循环次数

3.使用BNLJ时可以适当增大join buffer的大小

4.hash join大数据连接时常用方式:优化器使用较小的表的join key在内存中建立散列表,通过扫描较大的表并探测散列表找出匹配的行

子查询优化

子查询可以帮准我们通过一个SQL来实现较为复杂的的查询但子查询的效率一般都不高

缺点:

1.执行子查询时内层查询会建立一个临时表,撤销临时表都会消耗资源产生大量慢查询

2.产生的临时表没有索引,效率低

建议:使用连接查询JOIN来代替子查询

排序优化

可以通用filesort和index两种方式排序

index :通过有序索引顺序扫描直接返回有序数据,不需要额外的排序,操作效率较高。

filesort:通过对返回数据进行排序,filesort 并不代表通过磁盘文件排序,而是说明进行了一个排序操作,至于排序操作是否使用了磁盘文件或临时表等,则取决于MySQL服务器对排序参数的设置和需要排序数据的大小。

有两种排序算法:

1.双路排序算法:从磁盘取排序的字段,在buffer中排序后再从磁盘中取排好序的数据

2.单路排序算法:从磁盘读取所有需要排序字段的排序数在buffer中排好序输出,内存空间占用大,sort_buffer_size适当调大

sort_buffer_size设置的排序区是每个线程独占的,所以同一时刻,MySQL中存在多个sort buffer排序区。

GROUP BY优化

先排序再分组 遵循最佳左前缀原则

无法使用索引列时增加sort_buffer_size和max_length_for_sort_data

where效率高于having

减少使用order by尽量在客户端进行数据排序,数据库的CPU资源是宝贵的

使用覆盖索引和索引下推

(在索引篇已经说明)

物理查询优化

索引优化

sql语句是否使用索引与优化器的选择有关(数据库版本,数据量,数据选择度),不基于语义,也不基于规则,而是基于const开销

什么会导致索引失效

>、<范围查询(一般将范围查询条件放在最后)

mysql 会一直向右匹配直到遇到索引搜索键使用>、<就停止匹配。一旦权重最高的索引搜索键使用>、<范围查询,那么其它>、<搜索键都无法用作索引。即索引最多使用一个>、<的范围列,因此如果查询条件中有两个>、<范围列则无法全用到索引。

like %xx

如搜索键值以通配符%开头(如:like '%abc'),则索引失效,直接全表扫描;若只是以%结尾,则不影响索引构建

类型转换导致索引失败

如果列是字符串类型,传入条件是必须用引号引起来,不然报错或索引失效

计算或者函数导致索引失效

如果查询条件中含有函数或表达式,将导致索引失效而进行全表扫描

不等于索引失效情况

普通索引使用 !=索引失效,主键索引没影响。
where语句中索引列使用了负向查询,可能会导致索引失效。
负向查询包括:NOT、!=、<>、NOT IN、NOT LIKE等。

or 条件索引问题

or 的条件列除了同时是主键的时候,索引才会生效。其他情况下的,无论条件列是什么,索引都失效。

联合索引违背最左匹配原则

联合索引中,where中索引列违背最左匹配原则,一定会导致索引失效

其他优化策略

exists和in的区别

主要由表的大小决定,in适合用于驱动表比被驱动表小的情况,exists适合用于驱动表比被驱动表大的情况

count*和count(具体字段)的区别

如果是myisam存储引擎,在每一张表都有一个row_count字段存储表数据行数,那么查询数据行数的时间复杂度是o(1)的,但由于InnoDB中支持行级锁和MVCC机制,无法维护这样的变量,所以是全表扫描时间复杂度是o(n)的

count(具体字段)一般推荐使用二级索引,因为二级索引存储的字段更小count(*)和count(1)一般自动选择key_length小的索引

关于select*

mysql中将*通过查询数据字段转变为对应的字段需要花费时间和资源

不能使用覆盖索引

limit 1

对于会进行全表扫描的sql,如果我们确定结果集只有一个,那么加上limit 1后查询到一条数据后就不会再进行查询,加快查询速度

但是如果针对已经是唯一索引的字段就没有必要了

多使用commit

commit会释放相应的资源

1.回滚段记录的用于恢复数据

2.被程序获得的锁

3.redo/undo log buffer中的空间

4.管理上述资源花费的资源

数据库其他调优

选择合适的DBMS

如果对数据安全性以及事务性处理要求高的话可以使用SQL Server或者Oracle

选择合适的存储引擎,innodb支持事务,行锁外键等,适用于事务性要求高,myisam处理大量的更新操作

优化表的设计

表要求遵循第三范式

如果查询应用较多,进行的大量的多表查询操作,可以将经常查询的字段增加来换取查询的效率也是反范式化

表的字段类型的选择

优化查询逻辑

逻辑查询优化:改变SQL语句的内容让SQL执行更高效

物理查询优化:索引优化

使用Redis作为缓存

库级优化

读写分离

数据分片,对数据库分库分表

优化MySQL服务器

服务器硬件优化

优化数据库结构

拆分表:冷热数据的分离(一个页中可以存储更多数据减少磁盘IO)

增加中间表

增加冗余字段(反范式化)

优化数据类型:
1.比如对于非负型整数可以使用unsigned来存储

2.对于文本数据类型大整数占用空间更少

3.避免使用text blog,MySQL内存临时表不支持,必须使用磁盘临时表,性能差

4.避免使用enum,修改enum需要使用alter语句,尽量用tinyint来替代

5.使用timestamp

6.使用decimal避免float double

优化插入记录的速度

myisam:

1.禁用索引

2.禁用唯一性

3.检查使用批量插入

innodb:

1.禁用唯一性检查

2.禁用外键检查

3.禁止自动提交

使用非空约束
分析表检查表优化表

分析表:ANALYZE 分析表各个字段

检查表:CHECK

优化表:OPTIMIZE

大表优化

限定查询范围

读写分离

垂直拆分 分库分表 水平拆分

其他调优策略

服务器语句超时处理

创建全局通用表空间

隐藏索引

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1275236.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CCC数字车钥匙(八)——BLE配对相关字段

2.1 配对连接协议 2.1.3 所有者配对广播 对于所有者配对&#xff0c;仅支持Legacy LE 1M PHY。ADV_IND需要按照Section 2.3.1.1 Volume 6 Part B。 事件类型&#xff1a;无指向可连接和可扫描。 ADV_IND中包含广播地址和广播数据&#xff0c;如下所示&#xff0c;其中广播地址…

火狐插件(附加组件)发布流程

1、进入开发者中心 开发者中心 :: Firefox 附加组件https://addons.mozilla.org/zh-CN/developers/ 路径&#xff1a; 2、首次使用会自动打开注册登录页 3、注册登录后点击 提交你的第一个附加组件 4、此时需要进行两步验证 5、点击身份验证应用 在打开的页面中根据个人实际…

外包搞了3年,感觉技术退步很明显......

先说情况&#xff0c;大专毕业&#xff0c;18年通过校招进入湖南某软件公司&#xff0c;干了接近6年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&#xf…

数据结构-错题整理(1)-23/11/27

一&#xff1a; 题目&#xff1a; 广义表即我们通常所说的列表&#xff08;lists)。它放松了对表元素的原子性限制&#xff0c;允许他们有自身结构。那么广义表E((a,(a,b),((a,b),c)))的长度和深度分别为&#xff1f; 答案为1和4 知识点&#xff1a; 广义表的长度和深度 长…

【RT-DETR改进】InnerIoU思想结合传统 EIoU、SIoU、WIoU损失思想(小目标涨点效果明显)

论文地址&#xff1a;官方Inner-IoU论文地址点击即可跳转 官方代码地址&#xff1a;官方代码地址-官方只放出了两种结合方式CIoU、SIoU 本位改进地址&#xff1a; 文末提供完整代码块-包括InnerEIoU、InnerCIoU、InnerDIoU等七种结合方式和其AlphaIoU变种结合起来可以达到二十…

卡码网15 .链表的基本操作III

链表的基础操作III 时间限制&#xff1a;1.000S 空间限制&#xff1a;128MB 题目描述 请编写一个程序&#xff0c;实现以下链表操作&#xff1a;构建一个单向链表&#xff0c;链表中包含一组整数数据。 1. 实现在链表的第 n 个位置插入一个元素&#xff0c;输出整个链表的…

有IP没有域名可以申请证书吗?

一、IP证书是什么&#xff1f; ip证书是用于公网ip地址的SSL证书&#xff0c;与我们通常所讲的SSL证书并无本质上的区别&#xff0c;但由于SSL证书通常颁发给域名&#xff0c;而组织机构需要公共ip地址的SSL证书&#xff0c;这类SSL证书就是我们所说的ip证书。ip证书具有安全、…

C++ 学习 之 类的初始化与逗号运算符的联动

我们来看一个代码 class A { public:A(int x) {cout << "123" << endl;}A(int x, int y) {cout << "456" << endl;}}a (1, 2); int main() {} 这个代码的输出结果是什么&#xff1f; 答案是 123 因为编译器把 ( 1 , 2 ) 识别…

mysql区分大小写吗

mysql在windows下默认是不区分大小写的&#xff0c;在linux下默认是区分大小写的。 所以&#xff0c;为了避免出问题&#xff0c;许多公司的数据库编程规范中明确规定&#xff1a;库名、表名、列名、索引名一律小写&#xff0c;不同单词之间以下划线分割&#xff0c;且控制在3…

Python+Requests模块添加cookie

请求中添加cookies 对于某些网站&#xff0c;登录然后从浏览器中获取cookies&#xff0c;以后就可以直接拿着cookie登录了&#xff0c;无需输入用户 名密码。 一、在参数中添加cookie 在发送请求时使用cookies 代码示例&#xff1a; import requests # 1&#xff0c;在参数…

如何选择 Facebook 代理?

Facebook上从事业务推广、广告或资料推广以及群组的用户需要高质量且可靠的代理。使用代理&#xff0c;用户可以在账号被封锁的情况下访问自己的资料&#xff0c;同时与多人进行即时通信&#xff0c;并能够&#xff1a; 自动发送邀请参加各种活动&#xff1b; 通过特殊的机器人…

Java流处理之序列化和打印流

文章目录 序列化概述ObjectOutputStream类构造方法序列化操作 ObjectInputStream类构造方法反序列化操作1**反序列化操作2** 案例&#xff1a;序列化集合案例分析案例实现 打印流概述PrintStream类构造方法改变打印流向 序列化 概述 Java 提供了一种对象序列化的机制。用一个…

无人巡检 | AIRIOT变电站无人机运防一体管理解决方案

传统的变电站安全管理存在着人力成本高、效率低、安全风险难以全面控制等问题&#xff0c;主要依靠人工巡检和监控设备&#xff0c;往往存在如下的运维问题和管理痛点&#xff1a; 巡检监控能力差&#xff1a;传统变电站管理系统无法对变电站进行全面的巡检监控&#xff0c;以…

使用Xshell启动远程服务器上的tensorboard:本地浏览器打开

在远程服务器上启动的tensorboard产生的localhost网址用本地浏览器一般不能直接打开&#xff0c;我们需要建立本地PC与远程服务器的通信&#xff0c;将tensorboard的映射端口与本地端口连接起来&#xff08;参考解决方案&#xff09;。 一、连接远程服务器设置 二、添加SSH隧道…

SSM项目实战-service实现

1、SysUserService.java package com.atguigu.schedule.service;import com.atguigu.schedule.pojo.SysUser;public interface SysUserService {SysUser getSysUser(SysUser sysUser); }2、SysUserServiceImpl.java package com.atguigu.schedule.service.impl; import com.atg…

7nm项目之顶层规划——01数据导入

1.创建workspace 创建workspace后&#xff0c;在其目录下产生。 CORTEXA53.json文件是将有默认配置的文件master.json、有library的.config.json文件、tunes下CORTEXA53.tunes.json文件合并 注&#xff1a;tunes下的CORTEXA53.tunes.json文件可以覆盖一些master.json的设置…

Vue+Element-ui实例_在form中动态校验tag标签

1.开发需求 在日常开发中&#xff0c;我们会遇到form表单的动态添加和校验&#xff0c;当我们需要在动态添加的内容中再次动态使用输入框的时候&#xff0c;就会变得很繁琐&#xff0c;我在网上找了很多案例&#xff0c;没有符合自己需求的内容&#xff0c;只好闲暇时间自己搞…

Unity UGUI控件之Horizontal Layout Group

Horizontal Layout Group是Unity中的UGUI控件&#xff0c;用于在水平方向上对子对象进行布局。 主要有一下作用&#xff1a; 水平布局&#xff1a;Horizontal Layout Group将子对象按照水平方向进行布局&#xff0c;可以控制子对象的排列顺序和间距。自动调整尺寸&#xff1a…

MOS管的静电击穿问题

MOS管输入电阻很高&#xff0c;为什么一遇到静电就不行了&#xff1f; 静电击穿&#xff1a;由于静电的积累导致电压超过了原本MOS的绝缘能力&#xff0c;导致电流突然增大的现象。 MOS管基础知识了解&#xff1a; G极(gate)—栅极&#xff0c;不用说比较好认 S极(source)—源…

Mybatis相关API(Sqlsession和sqlsessionFactroy)

代码 private static SqlSessionFactory sqlSessionFactory;static { ​try { // 获得核心配置文件String resource "mybits-config.xml"; // 加载核心配置文件InputStream inputStream Resources.getResourceAsStream(resource…