MySQL篇(一):慢查询定位及索引、B树相关知识详解

news2025/4/3 4:19:40

MySQL篇(一):慢查询定位及索引、B树相关知识详解

  • MySQL篇(一):慢查询定位及索引、B树相关知识详解
    • 一、MySQL中慢查询的定位
      • (一)慢查询日志的开启
      • (二)慢查询日志内容分析
      • (三)慢查询分析工具
      • (四)慢查询的常见原因
    • 二、索引
      • (一)索引的定义
      • (二)索引的作用
      • (三)索引的创建方式
      • (四)索引的类型
      • (五)索引的底层数据结构
    • 三、B树和B+树的区别
      • (一)节点数据存储
      • (二)查询过程
      • (三)范围查询支持
      • (四)插入和删除操作
      • (五)应用场景

MySQL篇(一):慢查询定位及索引、B树相关知识详解

一、MySQL中慢查询的定位

(一)慢查询日志的开启

在MySQL中,慢查询日志是定位慢查询的重要工具。

  1. 通过配置文件开启
    • 编辑MySQL的配置文件(通常是my.cnfmy.ini)。找到或添加以下配置:
    [mysqld]
    slow_query_log = 1
    slow_query_log_file = /var/lib/mysql/your_mysql_server_name-slow.log
    long_query_time = 2
    
    • 这里slow_query_log = 1表示开启慢查询日志;slow_query_log_file指定慢查询日志文件的路径和名称;long_query_time = 2表示查询执行时间超过2秒的语句会被记录到慢查询日志中。修改配置文件后,需要重启MySQL服务使配置生效。
  2. 动态开启(无需重启服务)
    • 可以通过SQL语句动态开启慢查询日志:
    SET GLOBAL slow_query_log = 'ON';
    SET GLOBAL long_query_time = 2;
    
    • 这种方式设置的参数,在MySQL服务重启后会失效。如果需要永久生效,还是建议修改配置文件。

(二)慢查询日志内容分析

慢查询日志记录了慢查询的详细信息,包括查询执行时间、查询语句、使用的数据库等。例如,慢查询日志中的一条记录可能如下:

# Time: 230915 15:30:45
# User@Host: root[root] @ localhost []
# Thread_id: 10  Schema: test  QC_hit: No
# Query_time: 3.500000  Lock_time: 0.000000  Rows_sent: 10  Rows_examined: 1000
SET timestamp=1694700645;
SELECT * FROM user WHERE age > 30;
  • Time:记录查询发生的时间。
  • User@Host:执行查询的用户和主机信息。
  • Query_time:查询执行的时间,单位是秒。
  • Rows_examined:查询过程中扫描的行数,这个值越大,通常说明查询效率越低。
  • 查询语句:具体的SQL查询语句。

(三)慢查询分析工具

  1. mysqldumpslow工具
    • mysqldumpslow是MySQL自带的慢查询分析工具。例如,要查看慢查询日志中执行时间最长的10条查询:
    mysqldumpslow -s t -t 10 /var/lib/mysql/your_mysql_server_name-slow.log
    
    • -s t表示按照查询时间排序,-t 10表示只显示前10条记录。
    • 还可以通过其他参数进行更复杂的分析,比如按照扫描行数排序:
    mysqldumpslow -s r -t 10 /var/lib/mysql/your_mysql_server_name-slow.log
    
    • -s r表示按照扫描行数排序。
  2. pt-query-digest工具(Percona Toolkit的一部分)
    • pt-query-digest功能更强大,它可以对慢查询日志进行更深入的分析,生成详细的报告。首先需要安装Percona Toolkit:
    • 在Ubuntu系统上:
    sudo apt-get install percona-toolkit
    
    • 使用pt-query-digest分析慢查询日志:
    pt-query-digest /var/lib/mysql/your_mysql_server_name-slow.log
    
    • 它会输出查询的摘要信息,包括查询执行时间分布、查询模式、最耗时的查询等。例如,会显示类似以下的内容:
    # Profile
    # Rank Query ID Response time Calls Rows Rows examine
    # ==== ================== ============== ====== ====== ===========
    # 1 0x1234567890abcdef 10.000000 1 10 1000
    SELECT * FROM user WHERE age > 30;
    

(四)慢查询的常见原因

  1. 缺少索引
    • 如果查询语句没有使用合适的索引,MySQL可能需要全表扫描。例如:
    SELECT * FROM order WHERE customer_name = 'John';
    
    • 如果customer_name字段没有索引,当order表数据量很大时,查询会非常慢。此时可以为customer_name字段创建索引:
    CREATE INDEX idx_customer_name ON order (customer_name);
    
  2. 复杂的查询逻辑
    • 包含大量的JOIN、子查询、聚合函数等复杂逻辑的查询可能会很慢。例如:
    SELECT u.name, SUM(o.amount)
    FROM user u
    JOIN order o ON u.id = o.user_id
    GROUP BY u.name;
    
    • 如果user表和order表数据量都很大,且没有合适的索引,这个查询可能会很慢。可以优化JOIN条件,为关联字段创建索引,如为user.idorder.user_id创建索引。
  3. 锁等待
    • 在事务环境下,长时间的锁等待也会导致查询变慢。例如,一个事务对某条记录加锁后,另一个查询需要等待锁释放。可以通过查看MySQL的锁状态相关视图(如INFORMATION_SCHEMA.INNODB_LOCKS)来分析锁等待问题。

二、索引

(一)索引的定义

索引是一种数据结构,用于快速查找数据库表中的记录。它就像一本书的目录,通过索引可以快速定位到需要的数据,而不需要遍历整个表。在MySQL中,索引存储在磁盘上(InnoDB引擎也会将常用索引加载到内存中),不同的存储引擎支持的索引类型有所不同。

(二)索引的作用

  1. 提高查询效率
    • 最主要的作用是加快查询速度。例如,在有索引的情况下,查询语句SELECT * FROM product WHERE price > 100;可以通过索引快速定位到价格大于100的产品记录,而不是全表扫描。
  2. 保证数据的唯一性
    • 唯一索引可以确保表中某一列或几列的组合值是唯一的。例如,为user表的email字段创建唯一索引:
    CREATE UNIQUE INDEX idx_email ON user (email);
    
    • 这样就可以保证email字段的值在表中是唯一的,避免重复数据。
  3. 支持JOIN操作
    • 在JOIN操作中,索引可以加快表与表之间的关联速度。当两个表通过关联字段进行JOIN时,如果关联字段有索引,MySQL可以更高效地匹配记录。

(三)索引的创建方式

  1. 创建表时创建索引
    • 在创建表的SQL语句中直接定义索引。例如:
    CREATE TABLE student (
        id INT PRIMARY KEY,
        name VARCHAR(50),
        age INT,
        INDEX idx_age (age)
    );
    
    • 这里PRIMARY KEY创建了主键索引,同时INDEX idx_age (age)创建了一个普通的age字段索引。
  2. 使用CREATE INDEX语句创建索引
    • 对于已经存在的表,可以使用CREATE INDEX语句创建索引。例如:
    CREATE INDEX idx_name ON student (name);
    
    • 这会为student表的name字段创建一个索引。
  3. 使用ALTER TABLE语句创建索引
    • 也可以通过ALTER TABLE语句为表添加索引。例如:
    ALTER TABLE student ADD INDEX idx_age_name (age, name);
    
    • 这创建了一个组合索引,包含agename两个字段。

(四)索引的类型

  1. 普通索引(INDEX)
    • 最基本的索引类型,没有任何限制。可以加速查询,但是不保证数据的唯一性。例如:
    CREATE INDEX idx_city ON address (city);
    
  2. 唯一索引(UNIQUE INDEX)
    • 保证索引列的值是唯一的。如前面提到的为email字段创建唯一索引。
    CREATE UNIQUE INDEX idx_unique_email ON user (email);
    
  3. 主键索引(PRIMARY KEY)
    • 是一种特殊的唯一索引,用于标识表中的唯一记录。每个表只能有一个主键索引。在创建表时定义主键:
    CREATE TABLE product (
        id INT PRIMARY KEY,
        product_name VARCHAR(100)
    );
    
  4. 组合索引(复合索引)
    • 由多个字段组成的索引。例如,为order表的order_datecustomer_id创建组合索引:
    CREATE INDEX idx_order_date_customer_id ON order (order_date, customer_id);
    
    • 使用组合索引时,需要注意索引的顺序。查询条件中使用索引字段的顺序要与创建索引时的顺序一致(遵循最左匹配原则),才能有效使用索引。
  5. 全文索引(FULLTEXT INDEX)
    • 主要用于全文搜索,在MySQL中,InnoDB和MyISAM存储引擎都支持全文索引。例如,为article表的content字段创建全文索引:
    CREATE FULLTEXT INDEX idx_content ON article (content);
    
    • 然后可以使用MATCH AGAINST语句进行全文搜索:
    SELECT * FROM article WHERE MATCH(content) AGAINST('keyword' IN NATURAL LANGUAGE MODE);
    

(五)索引的底层数据结构

  1. 哈希表(Hash)
    • 哈希索引通过哈希函数将索引值映射到哈希表中。它的优点是查询效率高,等值查询速度快。但是,哈希索引不支持范围查询,并且在数据量较大时可能会出现哈希冲突。MySQL中Memory存储引擎支持哈希索引。例如:
    • 创建Memory表并使用哈希索引:
    CREATE TABLE test_hash (
        id INT,
        value VARCHAR(50),
        INDEX USING HASH (id)
    ) ENGINE = MEMORY;
    
  2. B树和B+树
    • B树
      • B树是一种自平衡的树结构,它的每个节点可以包含多个键值对和子节点。B树的特点是能够在相对较少的磁盘I/O操作下完成查询。在B树中,每个节点中的键值是有序排列的,并且子节点的键值范围也与父节点的键值相关。例如,在一个存储整数的B树中,父节点的某个键值会作为左右子节点键值范围的分界点。
      • 当进行查询时,从根节点开始,根据键值与节点中键值的比较,决定进入哪个子节点,直到找到目标键值或确定目标键值不存在。
    • B+树
      • B+树是B树的一种变形。与B树相比,B+树有以下特点:
        • 节点数据:B+树的非叶子节点只存储键值,不存储数据记录,数据记录都存储在叶子节点中。而B树的非叶子节点既存储键值,也可能存储数据记录。
        • 查询方式:B+树的查询必须到叶子节点才能找到数据记录,而B树在非叶子节点找到键值时就可能找到数据记录。
        • 范围查询:B+树的叶子节点之间通过指针连接,形成一个有序的链表,这使得范围查询非常高效。例如,查询WHERE age BETWEEN 20 AND 30,在B+树上可以通过叶子节点的链表快速遍历范围内的记录。而B树在进行范围查询时相对复杂。
      • 在MySQL的InnoDB存储引擎中,索引主要使用B+树结构。例如,聚簇索引(通常是主键索引)的叶子节点存储了完整的数据记录,而辅助索引(普通索引、唯一索引等)的叶子节点存储的是主键值,通过主键值再去聚簇索引中查找完整的数据记录。

三、B树和B+树的区别

(一)节点数据存储

  1. B树
    • B树的非叶子节点既存储键值,也可能存储数据记录。这意味着在B树中,找到某个键值时,可能在非叶子节点就已经找到对应的数据记录,不需要一直遍历到叶子节点。例如,在一个小型的B树中,根节点可能包含多个键值和少量的数据记录,当查询的键值正好在根节点时,就可以直接获取数据。
  2. B+树
    • B+树的非叶子节点只存储键值,不存储数据记录。数据记录全部存储在叶子节点中。这样做的好处是,非叶子节点可以存储更多的键值,从而减少树的高度,降低磁盘I/O操作次数。例如,在一个大型的B+树中,非叶子节点专注于存储键值,形成更高效的索引结构,而叶子节点存储数据记录,并且通过指针连接,方便范围查询。

(二)查询过程

  1. B树
    • 进行查询时,从根节点开始,比较键值与节点中的键值,决定进入哪个子节点。如果在非叶子节点找到目标键值,就可以直接获取数据记录,不需要继续遍历到叶子节点。这种查询方式在某些情况下可能会更快地获取数据,但也可能因为非叶子节点存储数据记录而导致节点空间利用不够高效。
  2. B+树
    • 查询必须从根节点开始,一直遍历到叶子节点才能找到数据记录。虽然看起来查询路径可能更长,但由于B+树的非叶子节点存储更多键值,树的高度相对较低,整体的磁盘I/O次数可能更少。而且,B+树的叶子节点形成有序链表,对于范围查询和排序操作非常有利。

(三)范围查询支持

  1. B树
    • B树对范围查询的支持相对较弱。因为B树的非叶子节点可能存储数据记录,且叶子节点之间没有直接的指针连接,在进行范围查询时,需要不断地回溯和遍历不同的子树,操作比较复杂,效率较低。
  2. B+树
    • B+树的叶子节点通过指针连接成一个有序的链表,这使得范围查询非常高效。例如,查询WHERE salary BETWEEN 5000 AND 10000,在B+树上,只需要找到第一个满足条件的叶子节点,然后沿着链表依次遍历,就可以获取所有满足条件的记录,大大提高了范围查询的效率。

(四)插入和删除操作

  1. B树
    • B树在插入和删除操作时,需要维护树的平衡,操作相对复杂。当插入或删除一个键值时,可能会导致节点的分裂或合并,需要调整多个节点的键值和子节点关系。
  2. B+树
    • B+树的插入和删除操作也需要维护树的平衡,但由于其结构特点,相对B树来说,操作可能更规则一些。例如,在插入操作中,B+树主要在叶子节点进行插入,非叶子节点的调整相对有规律;在删除操作中,也可以通过叶子节点的链表关系和非叶子节点的键值调整,更有效地维护树的平衡。

(五)应用场景

  1. B树
    • 由于B树在某些特定场景下,非叶子节点存储数据记录可能会有一定优势,例如在一些小型数据库系统或对数据存储密度有特殊要求的场景中可能会使用B树。但总体来说,B树在数据库索引中的应用不如B+树广泛。
  2. B+树
    • B+树非常适合用于数据库索引,尤其是在像MySQL的InnoDB存储引擎中。它的结构特点使得查询效率高,特别是对于范围查询和排序操作,能够很好地满足数据库的各种查询需求。无论是普通的单表查询,还是多表JOIN操作,B+树索引都能发挥重要作用。

通过以上对MySQL慢查询定位、索引以及B树和B+树区别的详细介绍,希望能帮助读者深入理解相关知识,在实际的数据库开发和优化中更好地应用这些内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2326951.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【清华大学】DeepSeek政务应用场景与解决方案

目录 一、政务数字化转型三阶段演进二、人工智能政务应用场景四大方向 三、技术方案核心技术 四、解决方案案例1. 公文写作2. 合同协议智能审查3. 行政执法4. 就业指导 五、风险及对策六、落地大四步法七、未来发展展望AI职业替代逻辑空间智能与具身智能人机共生 一、政务数字化…

4.2 单相机引导机器人放料-仅考虑角度变化

【案例说明】 本案例产品在托盘中,角度变化不大(<15度);抓取没有问题,只是放的穴位只能容许3度的角度偏差,因此需要测量产品的角度。 思路是:机器人抓料后、去固定拍照位拍照(找到与标准照片的角度偏差),机器人在放料的位置上多旋转这个角度偏差,把产品放进去。 …

论文阅读笔记:Denoising Diffusion Implicit Models (3)

0、快速访问 论文阅读笔记&#xff1a;Denoising Diffusion Implicit Models &#xff08;1&#xff09; 论文阅读笔记&#xff1a;Denoising Diffusion Implicit Models &#xff08;2&#xff09; 论文阅读笔记&#xff1a;Denoising Diffusion Implicit Models &#xff08…

Git(八)如何在同一台电脑登录两个Git

目录 一、理解 SSH 密钥机制二、具体实现步骤1.删除GIT全局配置2.生成多个 SSH 密钥3.添加公钥到 Git 账户4.配置 SSH config 文件5.测试SSH key是否生效6.下载代码 三、Git仓库级别配置四、HTTPS方式的多账号管理 引言&#xff1a; 在日常开发中&#xff0c;我们经常会遇到需要…

如何改电脑网络ip地址:一步步指导

有时我们需要更改电脑的网络IP地址以满足特定的网络需求。本文将为您提供一份详细的步骤指南&#xff0c;帮助您轻松完成电脑网络IP地址的更改。以下是更改计算机IP地址的分步指南&#xff0c;适用于常见的操作系统&#xff1a; 一、更换内网ip Windows 系统&#xff08;Win10…

PyTorch 分布式训练(Distributed Data Parallel, DDP)简介

PyTorch 分布式训练&#xff08;Distributed Data Parallel, DDP&#xff09; 一、DDP 核心概念 torch.nn.parallel.DistributedDataParallel 1. DDP 是什么&#xff1f; Distributed Data Parallel (DDP) 是 PyTorch 提供的分布式训练接口&#xff0c;DistributedDataPara…

【Unity】记录TMPro使用过程踩的一些坑

1、打包到webgl无法输入中文&#xff0c;编辑器模式可以&#xff0c;但是webgl不行&#xff0c;试过网上的脚本&#xff0c;还是不行 解决方法&#xff1a;暂时没找到 2、针对字体asset是中文时&#xff0c;overflow的效果模式处理奇怪&#xff0c;它会出现除了overflow模式以…

计算机视觉初步(环境搭建)

1.anaconda 建议安装在D盘&#xff0c;官网正常安装即可&#xff0c;一般可以安装windows版本 安装成功后&#xff0c;可以在电脑应用里找到&#xff1a; 2.创建虚拟环境 打开anaconda prompt&#xff0c; 可以用conda env list 查看现有的环境&#xff0c;一般打开默认bas…

基于聚类与引力斥力优化的选址算法

在众多实际场景中&#xff0c;诸如消防设施选址、基站布局规划以及充电桩站点部署等&#xff0c;都面临着如何利用最少的资源&#xff0c;实现对所有目标对象全面覆盖的难题。为有效解决这类问题&#xff0c;本文提出一种全新的组合算法模型 —— 基于聚类与引力斥力优化的选址…

Mac 电脑移动硬盘无法识别的解决方法

在使用 Mac 电脑的过程中&#xff0c;不少用户都遇到过移动硬盘没有正常推出&#xff0c;导致无法识别的问题。这不仅影响了数据的传输&#xff0c;还可能让人担心硬盘内数据的安全。今天&#xff0c;我们就来详细探讨一下针对这一问题的解决方法。 当发现移动硬盘无法识别时&…

LeetCode Hot100 刷题笔记(4)—— 二叉树、图论

目录 一、二叉树 1. 二叉树的深度遍历&#xff08;DFS&#xff1a;前序、中序、后序遍历&#xff09; 2. 二叉树的最大深度 3. 翻转二叉树 4. 对称二叉树 5. 二叉树的直径 6. 二叉树的层序遍历 7. 将有序数组转换为二叉搜索树 8. 验证二叉搜索树 9. 二叉搜索树中第 K 小的元素 …

【计算机视觉】YOLO语义分割

一、语义分割简介 1. 定义 语义分割&#xff08;Semantic Segmentation&#xff09;是计算机视觉中的一项任务&#xff0c;其目标是对图像中的每一个像素赋予一个类别标签。与目标检测只给出目标的边界框不同&#xff0c;语义分割能够在像素级别上区分不同类别&#xff0c;从…

【SpringBoot + MyBatis + MySQL + Thymeleaf 的使用】

目录&#xff1a; 一&#xff1a;创建项目二&#xff1a;修改目录三&#xff1a;添加配置四&#xff1a;创建数据表五&#xff1a;创建实体类六&#xff1a;创建数据接口七&#xff1a;编写xml文件八&#xff1a;单元测试九&#xff1a;编写服务层十&#xff1a;编写控制层十一…

在ensp进行OSPF+RIP+静态网络架构配置

一、实验目的 1.Ospf与RIP的双向引入路由消息 2.Ospf引入静态路由信息 二、实验要求 需求&#xff1a; 路由器可以互相ping通 实验设备&#xff1a; 路由器router7台 使用ensp搭建实验坏境&#xff0c;结构如图所示 三、实验内容 1.配置R1、R2、R3路由器使用Ospf动态路由…

Redis安全与配置问题——AOF文件损坏问题及解决方案

Java 中的 Redis AOF 文件损坏问题全面解析 一、AOF 文件损坏的本质与危害 1.1 AOF 持久化原理 Redis 的 AOF&#xff08;Append-Only File&#xff09; 通过记录所有写操作命令实现持久化。文件格式如下&#xff1a; *2\r\n$6\r\nSELECT\r\n$1\r\n0\r\n *3\r\n$3\r\nSET\r\…

3.第二阶段x64游戏实战-分析人物移动实现人物加速

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 本次游戏没法给 内容参考于&#xff1a;微尘网络安全 上一个内容&#xff1a;2.第二阶段x64游戏实战-x64dbg的使用 想找人物的速度&#xff0c;就需要使用Ch…

Scala(三)

本节课学习了函数式编程&#xff0c;了解到它与Java、C函数式编程的区别&#xff1b;学习了函数的基础&#xff0c;了解到它的基本语法、函数和方法的定义、函数高级。。。学习到函数至简原则&#xff0c;高阶函数&#xff0c;匿名函数等。 函数的定义 函数基本语法 例子&…

什么是 Java 泛型

一、什么是 Java 泛型&#xff1f; 泛型&#xff08;Generics&#xff09; 是 Java 中一种强大的编程机制&#xff0c;允许在定义类、接口和方法时使用类型参数。通过泛型&#xff0c;可以将数据类型作为参数传递&#xff0c;从而实现代码的通用性和类型安全。 简单来说&…

Unity中根据文字数量自适应长宽的对话气泡框UI 会自动换行

使用Ugui制作一个可以根据文本数量自动调整宽度,并可以自动换行的文字UI 或者不要独立的Bg,那么一定要把bg的img设置成切片

【小也的Java之旅系列】02 分布式集群详解

文章目录 前言为什么叫小也 本系列适合什么样的人阅读正文单体优点缺点 CAP为什么CAP不可能全部满足&#xff1f;CAP 三选二 分布式事务分布式方案——SeataXA模式&#xff08;强一致&#xff09;AT模式&#xff08;自动补偿&#xff0c;默认模式&#xff09;TCC模式&#xff0…