【8.索引篇】

【8.索引篇】

news2026/2/11 14:22:47

索引分类

索引和数据就是位于存储引擎中：

按「数据结构」分类：B+tree索引、Hash索引、Full-text索引。
按「物理存储」分类：聚簇索引（主键索引）、二级索引（辅助索引）。
按「字段特性」分类：主键索引、唯一索引、普通索引、前缀索引。
按「字段个数」分类：单列索引、联合索引。

为什么 MySQL InnoDB 选择 B+tree 作为索引的数据结构？

1、B+Tree vs B Tree

B+Tree 只在叶子节点存储数据，而 B 树的非叶子节点也要存储数据，所以 B+Tree 的单个节点的数据量更小，在相同的磁盘 I/O 次数下，就能查询更多的节点。
另外，B+Tree 叶子节点采用的是双链表连接，适合 MySQL 中常见的基于范围的顺序查找，而 B 树无法做到这一点。

2、B+Tree vs 二叉树

对于有 N 个叶子节点的 B+Tree，其搜索复杂度为O(logdN)，其中 d 表示节点允许的最大子节点个数为 d 个。
在实际的应用当中， d 值是大于100的，这样就保证了，即使数据达到千万级别时，B+Tree 的高度依然维持在 3~4 层左右，也就是说一次数据查询操作只需要做 3~4 次的磁盘 I/O 操作就能查询到目标数据。
而二叉树的每个父节点的儿子节点个数只能是 2 个，意味着其搜索复杂度为 O(logN)，这已经比 B+Tree 高出不少，因此二叉树检索到目标数据所经历的磁盘 I/O 次数要更多。

3、B+Tree vs Hash

Hash 在做等值查询的时候效率贼快，搜索复杂度为 O(1)。
Hash需要一次性将数据加载到内存中，如果数据比较大，则加载时间长，而B+tree是分节点加载数据
但是 Hash 表不适合做范围查询，它更适合做等值的查询，这也是 B+Tree 索引要比 Hash 表索引有着更广泛的适用场景的原因。

聚簇索引（主键索引）、二级索引（辅助索引）

主键索引的 B+Tree 的叶子节点存放的是实际数据，所有完整的用户记录都存放在主键索引的 B+Tree 的叶子节点里；
二级索引的 B+Tree 的叶子节点存放的是主键值，而不是实际数据。
覆盖索引
- 在查询时使用了二级索引，如果查询的数据能在二级索引里查询的到(也就是查询的数据是主键值)，不需要读取索引中的数据，只需要查一个 B+ 树就能找到数据，那么就不需要回表，这个过程就是覆盖索引。
回表
- 如果某个查询语句使用了二级索引，但是查询的数据不是主键值，这时找到对应的叶子节点，获取到主键值后，需要去聚簇索引中获得数据行，就能查询到数据了，这个过程就是回表。

InnoDB 在创建聚簇索引时，会根据不同的场景选择不同的列作为索引：

如果有主键，默认会使用主键作为聚簇索引的索引键；
如果没有主键，就选择第一个不包含 NULL 值的唯一列作为聚簇索引的索引键；
在上面两个都没有的情况下，InnoDB 将自动生成一个隐式自增 id 列作为聚簇索引的索引键；

一张表只能有一个聚簇索引，那为了实现非主键字段的快速搜索，就引出了二级索引

字段特性

主键索引：

建立在主键字段上的索引，通常在创建表的时候一起创建，一张表最多只有一个主键索引，索引列的值不允许有空值。

唯一索引：

建立在 UNIQUE 字段上的索引，一张表可以有多个唯一索引，索引列的值必须唯一，但是允许有空值。

普通索引：

就是建立在普通字段上的索引，既不要求字段为主键，也不要求字段为 UNIQUE。

前缀索引

是指对字符类型字段的前几个字符建立的索引，而不是在整个字段上建立的索引，前缀索引可以建立在字段类型为 char、 varchar、binary、varbinary 的列上。使用前缀索引的目的是为了减少索引占用的存储空间，提升查询效率。

单列索引和联合索引

建立在单列上的索引称为单列索引，比如主键索引；
建立在多列上的索引称为联合索引；

联合索引范围

联合索引查询，不代表联合索引中的所有字段都用到了联合索引进行索引查询，可能存在部分字段用到联合索引的 B+Tree，部分字段没有用到联合索引的 B+Tree 的情况。
联合索引的最左匹配原则会一直向右匹配直到遇到「范围查询」就会停止匹配。也就是范围查询的字段可以用到联合索引，但是在范围查询字段的后面的字段无法用到联合索引。
注意，对于 >=、<=、BETWEEN、like 前缀匹配的范围查询，并不会停止匹配

select * from t_table where a > 1 and b = 2

单列索引与联合索引区别

组成方式：单列索引只包含一列，而联合索引则由多列组成。
使用范围：单列索引适用于单列查询，联合索引适用于多列查询
索引大小：联合索引的大小通常比单列索引大
更新操作：联合索引，如果更新操作涉及到了索引的任何一列，都会导致索引重建，单列索引，只有更新涉及到了该列才会导致索引重建
单列索引适用于单列查询，适用于频繁更新的情况；而联合索引适用于多列查询，适用于读操作多、写操作少的情况

联合索引相比单列索引有什么优点

联合索引在进行查询过程中，可能索引列就是我们要查询的数据，使用覆盖索引，避免了回表操作，减少IO次数，提高查询性能

最左匹配原则

在使用多列索引时，如果查询中包含索引的第一个列，则可以利用该索引进行搜索；如果查询中不包含索引的第一个列，则无法使用该索引。

索引下推原理

一般在联合索引来优化查询，但是，在某些情况下，联合索引并不完全适用于所有的查询条件，于是从 MySQL 5.6 之后使用索引下推
可以在联合索引遍历过程中，对联合索引中包含的字段先做判断，直接过滤掉不满足条件的记录，减少回表次数。（在引擎层判断数据是否合法，如果合法直接返回，如果不合法继续判断，减少回表操作）

索引下推原理

截断的字段不会在 Server 层进行条件判断，而是会被下推到「存储引擎层」进行条件判断（因为 c 字段的值是在 (a, b, c) 联合索引里的），然后过滤出符合条件的数据后再返回给 Server 层。由于在引擎层就过滤掉大量的数据，无需再回表读取数据来进行判断，减少回表次数，从而提升了性能。

Innodb的B+Tree、BTree、二级索引、MyISAM的B+Tree

Innodb的B+Tree：非叶子节点存放索引值，叶子结点存放数值(索引即文件)
BTree：非叶子结点与叶子结点都存放数据
二级索引：非叶子结点存放索引值，叶子结点存放的是主键值
MyISAM的B+Tree：非叶子结点存放索引值，叶子结点存放指向数据的指针。（索引与文件分开）

索引失效

当我们使用左或者左右模糊匹配的时候，也就是 like %xx 或者 like %xx%这两种方式都会造成索引失效；
当我们在查询条件中对索引列使用函数，就会导致索引失效。
当我们在查询条件中对索引列进行表达式计算，也是无法走索引的。
MySQL 在遇到字符串和数字比较的时候，会自动把字符串转为数字，然后再进行比较。如果字符串是索引列，而条件语句中的输入参数是数字的话，那么索引列会发生隐式类型转换，由于隐式类型转换是通过 CAST 函数实现的，等同于对索引列使用了函数，所以就会导致索引失效。
联合索引要能正确使用需要遵循最左匹配原则，也就是按照最左优先的方式进行索引的匹配，否则就会导致索引失效。
在 WHERE 子句中，如果在 OR 前的条件列是索引列，而在 OR 后的条件列不是索引列，那么索引会失效。

MySQL 使用 like “%x“，索引不一定会失效

当表中的字段全部都使用到了索引，例如表中只有id和name俩列，id为主键索引，name为二级索引
这张表的字段没有「非索引」字段，所以select *相当于 select id,name，然后这个查询的数据都在二级索引的 B+ 树，因为二级索引的 B+ 树的叶子节点包含「索引值+主键值」，所以查二级索引的 B+ 树就能查到全部结果了，这个就是覆盖索引。
但是执行计划里的 type 是 index，这代表着是通过全扫描二级索引的 B+ 树的方式查询到数据的，也就是遍历了整颗索引树。

文章总结https://www.xiaolincoding.com/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/404416.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

linux字符设备和块设备的区别以及网络设备

linux字符设备和块设备的区别以及网络设备

一、字符设备 1、字符设备以字节为单位。大多数设备是字符设备，因为他们不需要缓冲而且不以固定块大小进行操作。 2、字符设备无需缓冲直接读写。 3、字符设备只能被顺序读写。二、块设备 1、块设备只能以块为单位接受输入和输出。 2、块设备对I/0请求有对应的缓冲…

阅读更多...

建立自己的博客

建立自己的博客

环境安装： w10系统安装第一步：安装git Git 官网: https://git-scm.com/ 第二步：安装Node.js Node.js官网：https://nodejs.org/zh-cn/ 使用cmd检测： node -v 第三步：安装Hexo Hexo官网：htt…

阅读更多...

PyInstaller 将DLL文件打包进exe

PyInstaller 将DLL文件打包进exe

PyInstaller 将DLL文件打包进exe方法1：通过--add-data命令方法2：通过修改 .spec扩展：博主热门文章推荐：方法1：通过–add-data命令注意：这里 dll末尾添加的.为当前目录，则该dll要放到main.py同一…

阅读更多...

【零基础入门学习Python---Python的五大数据类型之字符串类型】

【零基础入门学习Python---Python的五大数据类型之字符串类型】

一.Python的五大数据类型之字符串类型在Python中，变量用于存储数据。变量名可以是任何字母、数字和下划线的组合。Python支持多种数据类型，包括数字、字符串、列表、元组和字典。这篇文章我们就来学习一下五大数据类型中的字符串类型。 1.1 什么是字符串？字符串是Pyth…

阅读更多...

[acwing周赛复盘] 第 94 场周赛20230311

[acwing周赛复盘] 第 94 场周赛20230311

[acwing周赛复盘] 第 94 场周赛20230311 一、本周周赛总结二、 4870. 装物品1. 题目描述2. 思路分析3. 代码实现三、4871. 最早时刻1. 题目描述2. 思路分析3. 代码实现四、4872. 最短路之和1. 题目描述2. 思路分析3. 代码实现六、参考链接一、本周周赛总结又是笨比的一周&…

阅读更多...

保姆级图文教程 - VirtualBox安装配置Kali Linux

保姆级图文教程 - VirtualBox安装配置Kali Linux

文章目录下载Kali Linux虚拟机包安装Kali用户配置网络配置静态ipDHCP分配IP换deb源下载Kali Linux虚拟机包官网地址：https://www.kali.org/get-kali/#kali-virtual-machines 我们选择virtualbox版的，就是最中间的那个。安装Kali 将压缩包解压&…

阅读更多...

计算机网络：传输层概述

计算机网络：传输层概述

传输层只有主机才有的层次传输层的功能： 1.传输层提供进程与进程之间的逻辑通信。 2.复用：应用层的所有进程可以都使用一同传输层协议。 3.分用：传输层从网络层收到数据后，交付给指明的应用进程。 4.传输层对收到的报文进行差错…

阅读更多...

二十一、Django-restframework之序列化器补充

二十一、Django-restframework之序列化器补充

一、常用序列化器字段序列化器字段处理基元值和内部数据类型之间的转换。它们还处理输入值的验证，以及从它们的父对象检索和设置值。 （1）核心参数每个序列化器字段类构造函数至少接受这些参数。一些字段类还接受额外的，字段特…

阅读更多...

STM8S系列基于IAR标准外设printf输出demo

STM8S系列基于IAR标准外设printf输出demo

STM8S系列基于IAR标准外设printf输出demo📌STM8S/A标准外设库（库版本V2.3.1）📍官网标准外设库：https://www.st.com/zh/embedded-software/stsw-stm8069.html ⛳注意事项 🚩在内存空间比较有限的情况下&am…

阅读更多...

.vue 组件打包成 .js

.vue 组件打包成 .js

.vue 组件打包成 .js *** 所有的内容 cli 官网都有 *** *** https://cli.vuejs.org/zh/guide/build-targets.html *** 所有的内容 cli 官网都有： https://cli.vuejs.org/zh/guide/build-targets.html 准备几个 .vue 组件文件 import Main from ./components/Ma…

阅读更多...

MySQL InnoDB存储引擎锁与事务实现原理解析（未完成）

MySQL InnoDB存储引擎锁与事务实现原理解析（未完成）

InnoDB MySQL存储引擎是基于表的，也就是说每张表可以选择不同的存储引擎。 InnoDB存储引擎的表是索引组织的，也就是数据即索引。存储引擎文件 InnoDB引擎会包含RedoLog重做日志文件和TableSpace表空间文件。表空间文件默认表空间文件&#xff08…

阅读更多...

Win32 ListBox控件

Win32 ListBox控件

Win32 ListBox控件创建ListBox控件创建窗口函数 HWND CrateWindowEx(DWORD dwExStyle , // 窗口的扩展风格,基本没用LPCTSTR lpClassName, // 已经注册的窗口类名称LPCTSTR lpWindowName, // 窗口标题栏的名字DWORD dwStyle, // 窗口的基本风格int x, // 左上角水平坐标int …

阅读更多...

HashMap ConcurrentHashMap介绍

HashMap ConcurrentHashMap介绍

目录 HashMap 数据结构重要成员变量 Jdk7-扩容死锁分析单线程扩容多线程扩容 Jdk8-扩容 ConcurrentHashMap 数据结构并发安全控制源码原理分析重要成员变量协助扩容helpTransfer 扩容transfer 总结 CopyOnWrite机制源码原理 HashMap 数据结构数组…

阅读更多...

【题解】百度2020校招Web前端工程师笔试卷（第一批）：单选题、多选题

【题解】百度2020校招Web前端工程师笔试卷（第一批）：单选题、多选题

题目来源若有错误请指正！ 单选 1 分页存储管理将进程的逻辑地址空间分成若干个页，并为各页加以编号，从0开始，若某一计算机主存按字节编址，逻辑地址和物理地址都是32位，页表项大小为4字节，若…

阅读更多...

01.Java的安装

01.Java的安装

1.JDK&JREJDK : Java SE Development Kit--Java开发工具JRE : Java Runtime Environment--Java运行环境Java编程，需要安装JDK;如果仅仅是运行一款Java程序则只需要运行JREJava的安装包分为两类：一类是JRE--是一个独立的Java运行环境； 一类…

阅读更多...

卷积神经网络中的padding理解

卷积神经网络中的padding理解

前言在进行卷积神经网络中，经常用到padding，padding在卷积神经网络中起到什么样的作用呢，又是如何发挥作用的呢？本文就此谈下自己看法。代码中的显示 model.add(Conv2D(filters 32,kernel_size [3,3],strides [1,1],padd…

阅读更多...

基于SpringCloud的微服务架构学习笔记（2）注册中心Eureka和负载均衡Ribbon

基于SpringCloud的微服务架构学习笔记（2）注册中心Eureka和负载均衡Ribbon

1. 7 Eureka注册中心 1.7.1 远程调用的问题地址信息获取：服务消费者如何获取服务提供者的地址信息（不能每次都写死）： URL：http://localhost:8081/user/"order.getUserId()多选一：如果有多个服务提供…

阅读更多...

HBase存储结构、基本架构和shell操作

HBase存储结构、基本架构和shell操作

文章目录一、HBase简介1.1、HBase定义1.2、HBase的存储结构1.3、HBase基本架构二、HBase Shell操作2.1、基本操作2.2、namespace2.3、DDL2.4、DML一、HBase简介 1.1、HBase定义 HBase是一个开源的分布式NoSQL数据库，它是Apache Hadoop项目的一部分，使用…

阅读更多...

代码随想录算法训练营 day56 | 动态规划 647. 回文子串 516.最长回文子序列

代码随想录算法训练营 day56 | 动态规划 647. 回文子串 516.最长回文子序列

day56647 回文子串1.确定dp数组（dp table）以及下标的含义2.确定递推公式3，dp数组如何初始化4.确定遍历顺序5.举例推导dp数组516 最长回文子序列1.确定dp数组（dp table）以及下标的含义2.确定递推公式3.dp数组如何初始化…

阅读更多...

【H2实践】之 SpringBoot 整合

【H2实践】之 SpringBoot 整合

目标本文紧接上篇【H2实践】之认识 H2，上篇简单介绍了 H2 及其使用，本文继上篇，探索 H2 与 SpringBoot 的整合。主要实现目标： 1、SpringBoot 连接 H2 内存数据库，并对数据库进行管理。 2、访问 H2 Console 客户端…

阅读更多...

推荐文章

最新文章