四、MySQL性能优化

news2024/9/30 11:30:19

1、SQL性能优化

1、如何分析SQL的性能?

我们可以使用EXPLAIN命令来分析SQL的执行计划 ,执行计划是指一条SQL语句在经过MySQL查询优化器的选择后具体的执行方式

EXPLAIN并不会真的去执行相关的语句,而是通过查询优化器 对语句进行分析,找出最优的查询方案,并显示对应的信息。

2、**查询SQL尽量不要使用SELECT * ** ,而是 select 具体字段

select*会消耗更多CPU,无用字段增加网络带宽资源消耗,增加数据传输时间,可能导致索引失效

3、分页优化

普通的分页在数据量小的时候耗费时间还是比较短的,但如果数据量变大,达到百万甚至是千万级别,普通的分页耗费的时间就非常长了:

select 'score','name'from 'cur_order' order by 'score' desc limit 1000000,10 ;

如何优化?可以将上述SQL语句修改为子查询 ,先子查询出大于1000000的数据,然后从这里开始分页,分页的数据量会少很多。先查询出limit第一个参数对应的主键值,再根据这个主键值去过滤并分页,效率更快

select 'socre','name'from 'cur_order' where id >=(select id from 'cus_order'limit 1000000,1)limit 10

4、避免多表做join

超过三个表禁止join,需要join的字段,数据类型保持绝对一致;多表关联查询时,保证被关联的字段需要有索引

实际业务场景避免多表join的做法:

  • 单表查询后在内存中自己做关联:对数据库做单表查询,再根据查询结果进行二次查询,以此类推,最后再进行关联

5、建议不要使用使用外键与级联

外键对分库分表不友好,维护起来很麻烦

6、选择合适的字段类型

  • 可以将IP地址转换成整型数据存储,性能更好,占用空间也更小

MySQL提供了两个方法来处理IP地址:

INET_ATON() : 把ip转为无符号整型(4-8位)

INET_NTOA():把整型的ip转为地址

插入数据前,先用INET_ATON() 把ip地址转为整型,显示数据时,使用INET_NTOA() 把整型转换为ip地址.。

  • 对于非负型的数据(自增ID,整型IP,年龄)来说,要优先使用无符号整型来存储
  • 小数值类型(比如年龄,状态表示如0/1)优先使用TINYINT 类型
  • 对于日期类型来说,DateTime类型耗费空间更大且没有时区信息,建议使用Timestamp
  • 金额字段用decimal ,避免精度丢失
  • 尽量使用自增id作为主键

自增id插入数据时,是有序的,不需要重新排序;如果是非自增id,在数据插入到B+树的叶子节点时,会先进行排序,性能非常低。所以主键id一定要自增。

不过,像分库分表这类场景就不建议使用自增id作为主键,应该使用分布式ID比如uuid

7、尽量用UNION ALL 代替 UNION

UNION会把两个结果集的所有数据放到临时表中后再进行去重操作 ,更耗时,更消耗CPU资源

UNION ALL 不会再对结果集进行去重操作,获取到的数据包含重复的项

8、批量操作

对于数据库中的数据更新,如果能使用批量操作就要尽量使用,减少请求数据库的次数,提高性能(例如插入数据时,一次性插入多条,而不是一条一条的插入)

9、优化慢SQL

首要要找到哪些SQL语句执行速度比较慢

开启慢查询日志功能(默认是关闭的)

set global slow_query_log = 'ON';

找到了慢SQL语句之后,通过EXPLAIN 命令分析对应的SELECT语句

MySQL慢查询如何优化?

  • 检查是否走了索引,如果没有则优化SQL利用索引
  • 检查所利用的索引,是否是最优索引
  • 检查所查字段是否都是必须的,是否查询了过多字段,查出来了多余数据
  • 检查表中数据是否过多,是否应该进行分库分表
  • 检查数据库实例所在机器的性能配置,是否太低,是否可以适当增加资源

10、分页优化

  • 如果知道查询结果只有一条或者只要最大/最小一条记录,建议用limit 1,加上limit 1 后只要找到对应的一条记录就不会继续往下扫描了,效率会大大提高
-- 反例
selectid,namefrom employee wherename='jay';

-- 正例
selectid,namefrom employee wherename='jay'limit1;

11、联表查询

  • Inner join ,left join , right join ,优先使用Inner join ,如果是left join,左边表结果尽量小;同理如果是right join,右表表结果尽量小

12、慎用distinct

  • 慎用distinct关键字,因为当查询很多字段时,如果使用distinct,数据库引擎就会对数据进行比较,过滤掉重复数据,这个比较、过滤的过程会占用系统资源

2、MySQL性能优化

1、数据库命名规范

  • 所有数据库对象名称必须使用小写字母并用下划线分割
  • 所有数据库对象名称禁止使用MySQL关键字
  • 数据库对象的命名要能做到见名识意,并且最好不要超过32个字符
  • 临时库表必须以temp_ 为前缀并以日期为后缀,备份表必须以bak_ 为前缀并以日期为后缀
  • 所有存储相同数据的列名和列类型必须一致(一般作为关联列,如果查询时关联列类型不一致会自动进行数据类型隐式转换 ,会造成列上的索引失效,导致查询效率降低)

2、数据库基本设计规范

  • 所有表必须使用InnoDB存储引擎
  • 数据库和表的字符集统一使用UTF8

如果数据库中有存储emoji表情的需要,字符集需要采用utf8mb4字符集

  • 所有表和字段都需要添加注释

使用comment从句添加表和列的备注,维护数据字典

  • 控制单表数据量的大小,建议控制在500万以内

数据量过大会造成修改表结构,备份,恢复都会有很大问题

可以用历史数据归档(应用于日志数据),分库分表(应用与业务数据)等手段控制数据量大小

  • 经常一起使用的列放到一个表中,避免更多的关联操作

  • 禁止在数据库中存储文件(比如图片)这类大的二进制数据

MySQL数据库可以存储文件(图片),是直接存储文件对应的二进制数据

不过还是建议不要在数据库中存储文件,会严重影响数据库性能,消耗过多存储空间

可以选择云服务厂商提供的开箱即用的文件存储服务,如阿里云的OSS对象存储,数据库只存储文件地址信息

3、数据库字段设计规范

  • 优先选择符合存储需要的最小的数据类型
  • 避免使用TEXT,BLOB数据类型,最常见的TEXT类型可以存储64K的数据

MySQL内存临时表不支持TEXT、BLOB这样的大数据类型,如果查询中包含这样的数据,在排序等操作时就不能使用内存临时表,必须使用磁盘临时表进行,对于这样的数据,MySQL还要进行二次查询,会使sql性能变得很差

  • 避免使用ENUM类型

修改ENUM类型需要使用ALTER语句

ENUM类型的ORDER BY操作效率低,需要额外操作

ENUM数据类型存在一些限制,比如建议不要使用数值作为ENUM的枚举类

  • 尽可能把所有列定义为 NOT NULL

除非有特别的原因使用NULL值,应该总是让字段保持NOT NULL

索引NULL列需要额外的空间来保存,所以要占用更多的空间

进行比较和计算时要对NULL值做特别的处理

  • 单表不要包含过多字段

4、索引设计规范

  • 限制每张表上的索引数量,建议单张表索引不超过5个
  • 禁止使用全文索引
  • 禁止给表中每一列 都建立单独的索引

如果要用到多个列可以建立联合索引

  • 每个InnoDB表必须有个主键

InnoDB是一种索引组织表,数据的存储的逻辑顺序和索引的顺序是相同的

InnoDB是按照主键索引的顺序来组织表的:

a. 不要使用更新频繁的列作为主键,不使用多列主键

b.不要使用UUID,MD5,字符串列作为主键(无法保证数据的顺序增长)

c.主键建议使用自增id值

  • 选择索引列的顺序

建立索引的目的是:希望通过索引进行数据查找,减少随机IO,增加查询性能,索引能过滤出越少的数据,则从磁盘中读入的数据就越少,查询效率越高

a. 区分度最高的放在联合索引的最左侧

b.尽量把字段长度小的列放在联合索引的最左侧(字段长度越小,一页能存储的数据量越大,IO性能越好)

c.使用最频繁的列放到联合索引的左侧(比较少的建立一些索引)

  • 避免建立冗余索引和重复索引

因为查询优化器是根据所有索引去选择执行方案,冗余索引或重复索引会增加优化器生成执行计划的时间,影响查询性能

  • 对于频繁的查询优先考虑使用覆盖索引

覆盖索引就是包含了所有查询字段 的索引

比如,创建索引{a,b,c},查询语句:select b from user where b>1;索引覆盖了查询字段,会使用到覆盖索引,即不用进行回表查询

覆盖索引的好处:

a. 避免InnoDB表进行索引的二次查询 :对于非聚簇索引,叶子节点中保存的是索引字段和主键信息,当用非聚簇索引查询数据时,先找到对应的主键信息,然后通过主键信息回表到主键索引表中查具体数据 ,二次查询会降低查询效率。而覆盖索引,索引覆盖了查询字段,在非聚簇索引的叶子节点就能查到需要的数据,避免了对主键的二次查询,减少了IO操作,提升查询效率

b. 可以把随机IO变成顺序IO,加快查询效率 :由于覆盖索引是按键值的顺序存储的,对于IO密集型的范围查找来说,对比随机从磁盘读取每一行的数据IO要少的多,因此利用覆盖索引在访问时也可以把磁盘的随机读取的IO转变成索引查找的顺序IO

5、数据库SQL开发规范

  • 优化对性能影响较大的SQL语句

优化慢查询SQL语句

  • 充分利用表上已经存在的索引
  • 禁止使用select *
  • 禁止使用不含字段列表的insert语句
  • 避免数据类型的隐式转换
  • 避免使用子查询,可以把子查询优化为join操作
  • 避免使用join关联太多的表
  • 禁止使用order by rand()进行随机排序
  • where从句中禁止对列进行函数转换和计算
  • 拆分复杂的大SQL为多个小SQL
  • 程序连接不同的数据库使用不同的账号,禁止跨库查询

6、数据库操作行为规范

  • 超100万行的批量写操作,要分批多次进行操作

大批量操作可能会造成严重的主从延迟

binlog日志为row格式时会产生大量的日志

会产生大事务操作

  • 禁止为程序使用的账号赋予super权限

super权限只能留给DBA处理问题的账号使用

  • 对于程序连接数据库账号,遵循权限最小原则

程序使用数据库账号只能在一个DB下使用,不准跨库

程序使用的账号原则上不准有drop权限

3、读写分离

1、读写分离是什么?

读写分离主要是为了将对数据库的读写操作分散到不同的数据库节点上 ,大幅提升读性能

在这里插入图片描述

一般我们会选择一主多从,也就是一台主数据库负责写,其他的从数据库负责读。主库和从库之间会进行数据同步,以保证从库中数据的准确性,这样的架构实现起来比较简单,符合系统的写少读多的特点。

2、读写分离会带来什么问题?

读写分离对于提升数据库的并发非常有效,但是,同时会引来的问题:主库和从库的数据存在延迟,比如在写完主库之后,主库的数据同步到从库是需要时间的,这个时间差就导致了主库和从库的数据不一致的问题。这就是主从同步延迟

解决方法:

  • 强制读请求到主库处理

既然更改后,从库的数据过期,那就直接到主库中读取。通过Sharding-JDBC的HintManager分片键值管理器,我们可以强制使用主库

对于这种方案,我们可以将那些必须获取最新数据的读请求都交给主库处理

  • 延迟读取

主库的数据同步到从库需要时间,那我们就等待时间之后再去从库读取数据。

3、实现读写分离

  • 部署多台数据库,选择其中的一台作为主数据库,一台或多台作为从数据库
  • 保证主数据库和从数据库之间的数据是实时同步的,这个过程也就是主从复制
  • 系统将写请求交给主数据库处理,读请求交给从数据库处理

如何分离读写请求?

代理方式:在应用和数据中间加一个代理层,应用程序所有得到数据请求都交给代理层处理,代理层负责分离读写请求,将它们路由到对应的数据库中。类似功能的中间件有MySQL Router、Atlas等

组件方式:通过引入第三方组件来帮助我们读写请求,推荐使用sharding-jdbc,直接引入jar包即可使用,非常方便。

4、主从复制的原理

MySQL的binlog日志主要记录了MySQL数据库中数据的所有变化(数据库执行的所有DDL和DML语句),因此我们根据主库的binlog日志就能够将主库的数据同步到从库中

  • 主库将数据库中数据的变化写入到binlog
  • 从库连接主库
  • 从库创建一个I/O线程向主库请求更新的binlog
  • 主库会创建一个binlog dump线程来发送binlog,从库中的I/O线程负责接收
  • 从库的I/O线程将接收到的binlog写入到relay log中
  • 从库的SQL线程读取relay log 同步到数据本地(再执行一遍SQL)

4、分库分表

当数据库不足以支撑并发量,当表无法装下再多的数据,这时候采用分库分表来进行优化----前提是,SQL优化都已经用过了,还需要优化的情况下,才选择实现分库分表

1、分库

分库就是将数据库的数据分散到不同的数据库上,可以垂直分库,也可以水平分库

  • 垂直分库:单一数据库按照业务进行划分,不同的业务使用不同的数据库,进而将一个数据库的压力分担到多个数据库。比如将一个数据库的用户表、订单表、商品表分别单独拆分为各自的数据库,用户数据库、订单数据库、商品数据库

  • 水平分库:同一张表按一定规则拆分到不同的数据库中,两个数据库中的这张表字段是一样的,解决了单表的存储和性能瓶颈的问题。比如当订单表数据量太大,可以对订单表水平分表,然后将切分好的2张订单表分别放在两个不同的数据库

2、分表

分表就是对单表的数据进行拆分,可以是垂直拆分,也可以是水平拆分

  • 垂直分表:对数据表列的拆分,把一张列比较多的表拆分为多张表,不同表的结构不一样;比如可以将用户表的一些字段单独抽出来作为一个表
  • 水平分表:对数据表行的拆分,解决单一表数据量过大的问题。比如可以将用户表拆分为多张用户表,字段一样表结构一样。

水平拆分只能解决数据量大的问题,表的结构并没有改变。为了提升性能,我们通常会将拆分后的多张表放在不同的数据库中,水平分表通常和水平分库同时出现

例如,当一个表有几百万条数据,有十几个字段,水平拆分就是,将几百万条数据分出一部分在另一个分库里,分库和原库结构完全一样,分表和原表结构也一样,就是数据不同;垂直拆分则是,将表中的字段分出一部分到分表里,这样分库和原库的结构和数据都不一样,分表和原表的结构和数据也不一样。水平是按照行来拆分,垂直是按照列来拆分

3、什么情况下需要分库分表?

  • 单表的数据达到千万级别以上,数据库读写速度比较缓慢
  • 数据库中的数据占用的空间越来越大,备份时间越来越长
  • 应用的并发量太大

4、分库分表会带来什么问题?

  • join操作,同一个数据库中的表分布在了不同的数据库,导致无法使用join操作。这样导致我们需要手动进行数据的封装,比如在一个数据库中查询到一个数据之后,再根据这个数据去另外一个数据库中找对应的数据
  • 事务问题:同一个数据库中的表在不同的数据库,如果单个事务的操作涉及到多个数据库,数据库自带的事务就无法满足需求了
  • 分布式id:分库之后,数据遍布在不同服务器上的数据库,数据库的自增主键已经没办法满足生成的主键唯一了。为不同的数据节点生成去哪聚唯一主键,这就需要引入分布式id了
  • 需要更多的数据库服务器,成本很高

尽量不做分库分表,会带来很多问题,如查询等都要重新排序

5、分布式数据层中间件

1、分布式数据层中间件是什么?

分布式数据访问层中间件,旨在为一个通用数据访问层服务,支持MySQL动态数据源、读写分离、分布式唯一主键生成器、分库分表、动态化配置 等功能。并且支持从客户端角度对数据源的各方面(比如连接池、SQL等)进行监控。

2、常见的数据层中间件:

  • TDDL

淘宝根据自己的业务特点开发了TDDL框架,主要解决了分库分表对应用的透明化以及异构数据库之间的数据复制,它是一个基于集中式配置的JDBC datasource实现

实现动态数据源、读写分离、分库分表

缺点:分库分表功能还未开源,当前公布文档较少,需要diamond(淘宝内部使用的一个管理持久配置的系统)

  • Atlas

Qihoo 360开发维护的一个基于MySQL协议的数据中间层项目。它实现了MySQL的客户端与服务端协议,作为服务端与应用程序通信,同时作为客户端与MySQL通信

实现读写分离、单库分表

缺点:不支持分库分表

  • MTDDL

美团点评分布式数据访问层中间件

实现动态数据源、读写分离、分库分表,与tddl类似

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/920102.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

lvs实现DR模型搭建

一,实现DR模型搭建 1, 负载调度器配置 1.1调整ARP参数 vim /etc/sysctl.conf net.ipv4.conf.all.send_redirects 0 net.ipv4.conf.default.send_redirects0 net.ipv4.conf.ens33.send_redirects 0 sysctl -p 1.2 配置虚拟IP地…

Android Jetpack Compose中使用字段验证的方法

Android Jetpack Compose中使用字段验证的方法 数据验证是创建健壮且用户友好的Android应用程序的关键部分。随着现代UI工具包Jetpack Compose的引入,处理字段验证变得更加高效和直观。在这篇文章中,我们将探讨如何在Android应用中使用Jetpack Compose进…

AI开源大模型的特点和优势

目前有许多开源的大型AI模型,这些模型在自然语言处理、图像识别、语音处理等领域取得了显著的成果。以下是一些常见的开源大模型及其特点,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1…

matlab使用教程(22)—非线性优化函数的设置

1.设置优化选项 可以使用由 optimset 函数创建的 options 结构体来指定优化参数。然后,可以将 options 作为输入传递给优化函数,例如,通过使用以下语法调用 fminbnd x fminbnd(fun,x1,x2,options) 或使用以下语法调用 fminsearch x f…

使用antd mobile的PickerView二次封装成业务所需选择器

这里写目录标题 前言组件选择器视图选择器组件使用示例 注意事项扩展 前言 基于 Vant的checkbox配合popup和input定制选择器 实现一个React的版本 组件库:antd mobile 适用:移动端 UI如下: 功能点: 选择器在弹出层内&#xff0…

四、pikachu之文件包含

文章目录 1、文件包含漏洞概述1.1 文件包含漏洞1.2 相关函数1.3 文件包含漏洞分类 2、File Inclusion(local)3、File Inclusion(remote) 1、文件包含漏洞概述 1.1 文件包含漏洞 文件包含漏洞:在web后台开发中,程序员往往为了提高效率以及让代码看起来更…

AutoSAR 简介

文章目录 什么是 AutoSAR分类AutoSAR 的作用AutoSAR 架构术语介绍工具链介绍参考 随着汽车行业的发展和对汽车电子软件需求的增加,AutoSAR 将会变得越来越重要,但 AutoSAR 入门门槛高、工具链价格昂贵,动辄几百上千万的软件使用授权费对 OEM、…

三种主要的云交付服务和安全模型

对于许多企业来说,当今的数字化转型之旅包括一个关键决策:采用符合其需求的云交付服务。 云计算已成为现代 IT 基础设施的主要组成部分,具有从可扩展性到成本效率等诸多优势。然而,与所有技术一样,云也有其自身的网络…

Linux 定时任务 crontab 用法学习整理

一、linux版本 lsb_release -a 二、crontab 用法学习 2.1,crontab 简介 linux中crontab命令用于设置周期性被执行的指令,该命令从标准输入设备读取指令,并将其存放于“crontab”文件中,以供之后读取和执行。cron 系统调度进程。…

Nets3e v1.1.4(攻击者在受害者主机上偷拍并弹出受害者个人照片)

Github>https://github.com/MartinxMax/Nets3e/tree/Nets3e_V1.1.4 首页 历史更新: Nets3e v1.1.4 新增echo参数,-g -echo,生成payload后,受害者泄露的个人照片将会在受害者的主机上弹出展示 Nets3e v1.1.3 修复受害者无法获取公网IP,新增钉钉实时监控推送 Nets3e v1.1…

73 # 发布自己的 http-server 到 npm

1、添加 .npmignore 文件,忽略不需要的文件 public2、去官网https://www.npmjs.com/检查自己的包名是否被占用 3、切换到官方源,然后检查确认 nrm use npm nrm ls4、登录 npm 账号 npm login5、发布 npm publish6、查看发布情况,发布成功…

虚拟机中Ubuntu 16.04 设置网络

1、打开虚拟机的“编辑”选项,选择“虚拟网络编辑器”,修改网络配置 2、同时打开 Windows下面的命令行,输入ipconfig,看到虚拟网络适配器的地址 1-虚拟机-设置-网络适配器 2-编辑-虚拟网络编辑器-VMnet0 3-编辑-虚拟网络编辑…

Web安全测试(二):HTTP状态码、响应和url详解

一、前言 结合内部资料,与安全渗透部门同事合力整理的安全测试相关资料教程,全方位涵盖电商、支付、金融、网络、数据库等领域的安全测试,覆盖Web、APP、中间件、内外网、Linux、Windows多个平台。学完后一定能成为安全大佬! 全部…

重新认识Android中的线程

线程的几种创建方式 new Thread:可复写Thread#run方法。也可以传递Runnable对象,更加灵活。缺点:缺乏统一管理,可能无限制新建线程,相互之间竞争,及可能占用过多系统的资源导致死机或oom。 new Thread(new…

【网络安全知识】Windows系统安全加固安全加固分析、概念及账户管理和认证权限

Windows系统安全加固分析 最小化方式安装 为了提高系统的安全性,采用最小化方式安装是最可靠的,只安装网络 服务所必需的组件。如果以后有新的服务需求,再安装相应的服务组件 ,并及时进行安全设置。 系统加固工作 对Windows系统安…

GCC编译器优化等级的选择

GCC编译器通常提供多个优化级别供选择,每个级别对代码进行不同程度的优化。以下是GCC编译器常见的优化级别: 无优化(-O0):这是默认的优化级别,编译器不执行任何优化。适用于调试目的或要求最小编译时间的情…

windows系统下安装Nodejs并安装vue-cli

windows下安装nodejs 下载安装淘宝镜像加速器(cnpm)安装vue-cli初始化一个vue-cli程序 下载 Node.js下载地址 根据自己的电脑选择下载 下载完成后点击下载好的文件 一路next 安装地址可以根据自己的喜好修改 按住win r 输入cmd,按回车,打开命令窗口…

有关Arm CE支持的sha1 sha224 sha256 sha384 sha512指令

快速链接: . 👉👉👉 个人博客笔记导读目录(全部) 👈👈👈 付费专栏-付费课程 【购买须知】:【精选】ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈再某一款SOC(cortex-A53)上进行数字摘要计算的时候, 发现sha1 sha224 sha256的性能很高,sha384 sha512的性能…

win10如何配置jdk环境变量

1.首先要打开系统环境变量配置的页面。具体操作是:打开开始菜单,找到“此电脑”,然后右键“更多”→“属性”。 2.在弹出的页面,选择“高级系统设置” 3.在弹出的页面,选择“环境变量(N)…”。 …

【C++练习】普通方法+利用this 设置一个矩形类(Rectangle), 包含私有成员长(length)、 宽(width), 定义一下成员函数

题目 设置一个矩形类(Rectangle), 包含私有成员长(length)、 宽(width), 定义成员函数: void set_ len(int l); //设置长度 设置宽度void set_ wid(int w); 获取长度: int get len(); 获取宽度: int get _wid); 显示周长和面积: v…