MySQL 索引(上)

news2024/9/28 13:19:40

   

 🎉欢迎您来到我的MySQL基础复习专栏

☆* o(≧▽≦)o *☆哈喽~我是小小恶斯法克🍹
✨博客主页:小小恶斯法克的博客
🎈该系列文章专栏:重拾MySQL-进阶篇
🍹文章作者技术和水平很有限,如果文中出现错误,希望大家能指正🙏
📜 感谢大家的关注! ❤️

目录

 🚀索引概述

 🚀索引的特点 

🚀索引结构

🚀二叉树

🚀红黑树

 🚀B树:为磁盘而生

🚀B树的构建  (这里引用的是一个博主的构建过程,我觉得还不错http://t.csdnimg.cn/3VtX2)

 🚀B+Tree  (以下这里引用了黑马部分)

 🚀Hash

🚀为什么InnoDB存储引擎选择使用B+tree索引结构? 


🚀索引概述

索引(index)是帮助MySQL高效获取数据的数据结构(有序)。数据库系统还维护着满足 特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构  上实现高级查找算法,这种数据结构就是索引。

 索引说明:

假设我们要执行的SQL语句是:select * from emp where age =  43 ;

✨无索引

在无索引情况下,就需要从第一行开始扫描,一直扫描到最后一行,我们称之为全表扫描,性能很低。

✨有索引

如果我们针对于这张表建立了索引,假设索引结构就是二叉树,那么也就意味着,会对age这个字段建立一个二叉树的索引结构。

此时我们在进行查询时,只需要扫描三次就可以找到数据了,极大的提高的查询的效率。

注意:这里我们只是假设索引的结构是二叉树,介绍一下索引的大概原理,只是一个示意图,并不是索引的真实结构,索引的真实结构通常是基于B树或者B+树

 🚀索引的特点 

特点优点缺点
提高检索速度加快数据的检索速度,特别是对大表进行检索时增加了写操作的时间,因为每次插入、更新和删除都需要维护索引
唯一约束可以确保列或列组合的唯一性唯一索引会增加写操作的开销
加速排序在使用ORDER BY子句进行排序时可以加快查询速度占用额外的磁盘空间
加速分组和联接对于GROUP BY和JOIN操作,索引可以提高查询性能不恰当的索引可能导致查询性能下降
全文搜索允许对文本字段进行高效的全文搜索需要额外的存储空间,并且不支持所有的数据类型
减少IO成本可以减少磁盘IO的次数,提高查询效率创建和维护索引需要额外的计算资源

🚀索引结构

MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的索引结构,主要包含以下几种:

索引结构

描述

B+Tree索引

最常见的索引类型大部分引擎都支持  B+ 树索引

一种自平衡的多路搜索树,所有关键字都存储在叶子节点上,并且叶子节点之间通过指针连接形成有序链表。非叶子节点只包含键值信息,不包含实际数据。适用于范围查找,对于数据库系统来说更加适用。

Hash索引

底层数据结构是用哈希表实现 , 只有精确匹配索引列的查询才有效 , 适用于等值查找,支持范围查询

R-tree(空间索引)

空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据 型,通常使用较少

Full-text(索引 )

是一种通过建立倒排索引 ,快速匹配文档的方式类似于

Lucene,Solr,ES

用于全文搜索的索引结构,支持对文本字段进行高效的全文搜索,适用于大段文本的搜索。

上述是MySQL中所支持的所有的索引结构接下来我们再来看看不同的存储引擎对于索引结构的支持情况。

InnoDB

MyISAM

Memory

B+tree索引

Hash 索引

不支

不支

R-tree 索引

不支

不支

Full-text

5.6版本之后支持

不支

 注意:我们平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引。

🚀二叉树

二叉树具有以下性质:左子树的键值小于根的键值,右子树的键值大于根的键值。 
如下图所示就是一棵二叉查找树, 

假如说MySQL的索引结构采用二叉树的数据结构,理想状态下结构是:

如果主键是顺序插入的,则会形成一个单向链表:

所以,如果选择二叉树作为索引结构会存在以下缺点

✨顺序插入时,会形成一个链表,查询性能大大降低。

✨大数据量情况下,层级较深,检索速度慢。

🚀红黑树

此时大家可能会想到我们可以选择红黑树红黑树是一颗自平衡二叉树那这样即使是顺序插入数 据,最终形成的数据结构也是一颗平衡的二叉树 ,结构如下 : 

✨对于数据在内存中的情况(如上述的TreeMap和HashMap),红黑树的表现是非常优异的。但是对于数据在磁盘等辅助存储设备中的情况(如MySQL等数据库),红黑树并不擅长,因为红黑树长得还是太高了。当数据在磁盘中时,磁盘IO会成为最大的性能瓶颈,设计的目标应该是尽量减少IO次数;而树的高度越高,增删改查所需要的IO次数也越多,会严重影响性能。

✨所以,在MySQL的索引结构中,并没有选择二叉树或者红黑树,而选择的是B+Tree,那么什么是 B+Tree呢?在详解B+Tree之前,先来介绍一个B-Tree。

 🚀B树:为磁盘而生

B-Tree  B树是一种多叉路衡查找树,相对于二叉树,  B树每个节点可以有多个分支,即多叉。

以一颗最大度数(max-degree5(5)b-tree为例那这个B树每个节点最多存储4key,5

个指针:

✨B树,也是自平衡的排序查找树,但是不要求子节点数目必须小于2。

✨每个节点可以有最多M个子节点,M>=2,M即为B树的阶数

✨每个节点中可以存储最多M个、最少M/2向上取整个key,一般为2-3个。

✨所有叶子节点均在同一层

树的度数指的是一个节点的子节点个数。

在这里插入图片描述

还有一个更详细的图:

 

🚀B树的构建  (这里引用的是一个博主的构建过程,我觉得还不错http://t.csdnimg.cn/3VtX2)

B树的构建过程中每个节点中的关键字的个数都在动态改变。

因为其构建过程是:先对节点先扩充,当节点中关键字数量扩充到等于M时,再对其进行拆分,并将中间数升到父节点中去。

例如:定义一个5阶树(平衡5路查找树;),现在我们要把3、8、31、11、23、29、50、28 这些数字构建出一个5阶树出来;

遵循规则:

(1)节点拆分规则:当前是要组成一个5路查找树,那么此时m=5,关键字数必须<=5-1(这里关键字数>4就要进行节点拆分);当节点中关键字数大于4时,就将中间的关键字升为父节点的关键字(如果没有父节点,则创建一个父节点),然后创建此父节点的两个子节点,将中间关键字两边的关键字分别存储到这两个子节点中。

(2)排序规则:满足节点本身比左边节点大,比右边节点小的排序规则;

先插入 3、8、31、11
在这里插入图片描述
再插入23、29
在这里插入图片描述再插入50、28
在这里插入图片描述

特点:

✨5阶的B树,每一个节点最多存储4个key,对应5个指针。

✨一旦节点存储的key数量到达5,就会裂变,中间元素向上分裂。

✨在B树中,非叶子节点和叶子节点都会存放数据。

 🚀B+Tree  (以下这里引用了黑马部分)

B+TreeB-Tree的变种,我们以一颗最大度数(max-degree4 4b+tree为例来看一 下其结构示意图:

我们可以看到,两部分:

✨绿色框框起来的部分,是索引部分,仅仅起到索引数据的作用,不存储数据。

✨红色框框起来的部分,是数据存储部分,在其叶子节点中要存储具体的数据。

插入一组数据100 65 169 368 900 556 780 35 215 1200 234 888 158 90 1000 88 120 268 250 然后观察一些数据插入过程中节点的变化情况

 最终我们看到,B+Tree 与  B-Tree相比,主要有以下三点区别:

所有的数据都会出现在叶子节点。

叶子节点形成一个单向链表。

非叶子节点仅仅起到索引数据作用,具体的数据都是在叶子节点存放的 

上述我们所看到的结构是标准的B+Tree的数据结构接下来我们再来看看MySQL中优化之后的 B+Tree

✨MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点 的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能,利于排序。

 🚀Hash

✨MySQL中除了支持B+Tree索引,还支持一种索引类型---Hash索引。

✨哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。

 如果两个(或多个)键值,映射到一个相同的槽位上,他们就产生了hash冲突(也称为hash碰撞),可 以通过链表来解决。

✨Hash索引只能用于对等比较 (=,  in),不支持范围查询(between,  >,  < ,   ...)

✨无法利用索引完成排序操作

✨查询效率高,通常(不存在hash冲突的情况)只需要一次检索就可以了,效率通常要高于B+tree索引 

存储引擎支持

在MySQL中,支持hash索引的是Memory存储引擎。    而InnoDB中具有自适应hash功能,  hash索引是 InnoDB存储引擎根据B+Tree索引在指定条件下自动构建的。

🚀为什么InnoDB存储引擎选择使用B+tree索引结构? 

✨平衡的高效查找: B+树具有平衡性,使得在大数据量情况下,查询操作的时间复杂度保持在较低水平(通常为O(log n))。

✨多路搜索: B+树的多路搜索特性使得每一步操作都能跳过大量的数据,从而提高了查询效率。

✨对于B-tree,无论是叶子节点还是非叶子节点,都会保存数据,这样导致一页中存储 的键值减少,指针跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低;

✨相对Hash索引,  B+tree支持范围匹配及排序操作

(范围查询: B+树索引结构天生适合范围查询,因为其内部有序排列的特性可以快速定位到范围的起始点,并且进行连续的遍历。

顺序访问: B+树的叶子节点形成有序链表,这使得对整个表进行顺序扫描时非常高效。)


希望对你有帮助!  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1396493.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

openlayers [九] 地图覆盖物overlay三种常用用法 popup弹窗,marker标注,text文本

文章目录 简介overlay 实现popup弹窗overlay 实现label 标注信息overlay实现 text 文本信息完整代码 简介 常见的地图覆盖物为这三种类型&#xff0c;如&#xff1a;popup弹窗、label标注信息、text文本信息等。 overlay 实现popup弹窗 方法详解 实例一个 new Overlay()&…

链动2+1模式:月流水6000万是怎么做到的?

一个好的企业往往只需要最简单的营销方式。当我们面对当今的商业市场&#xff0c;琳琅满目的商业模式&#xff0c;应接不暇的营销方案&#xff0c;我们一定会举足无措的不知道怎么选择。因为一个好的公司或企业&#xff0c;一定要有一个十分经得起推敲的模式来面对消费者。 那么…

对m3u8视频进行批量采集

一、相关网页&#xff08;网页链接&#xff1a;https://www.acfun.cn/v/ac36564705&#xff09; 二、多视频采集网页&#xff08;找出每个视频ID&#xff09; 三、相关代码&#xff08;代码含有注释&#xff09; # Time: 2024/1/18 22:57 # Author: 马龙强 # File: 对m3u8视频…

有效防范网络风险的关键措施

在数字化时代&#xff0c;企业面临着日益复杂和频繁的网络风险。提高员工的网络安全意识是防范网络威胁的关键一步。本文将探讨企业在提升网络安全意识方面可以采取的措施&#xff0c;以有效预防潜在的网络风险。 1. 开展网络安全培训&#xff1a;企业应定期组织网络安全培训&…

Android Studio读写低频RFID T5557卡源码

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?id675212889085&spma1z10.5-c.w4002-21818769070.13.21166f89nKgnJ7 <?xml version"1.0" encoding"utf-8"?> <androidx.constraintlayout.widget.ConstraintLayout xml…

【AI绘画+本地部署】基于krita的AI绘画(含windows一键整合包)

comfyuikrita所有相关资源整合包(无需下载后面链接)百度网盘&#xff1a;https://pan.baidu.com/s/1iwNRpdTaD26YbzSDm6WLDA?pwdbur8 –来自百度网盘超级会员V4的分享 krita绘画软件官网地址 https://krita.org/en/download/krita-desktop/ krita-ai-diffusion 插件&#xff…

对java的interface的理解

一个例子来让我们理解更加深刻 这是我们的整体文件布局 ①A是接口 ②B和C是用来实现接口的类 ③show是我们的运行函数&#xff0c;用来展示 A接口 接口中定义的方法可以不用去实现,用其他类去实现(必须实现) 关键字:interface public interface A { // public static …

Redis分布式锁存在的问题及解决方案(值得珍藏)

Redis分布式锁存在的问题 在购票软件的情境中&#xff0c;当仅剩一张或几张票时&#xff0c;众多用户同时尝试购买。在不考虑任何外部干扰的情况下&#xff0c;逻辑上&#xff0c;系统应首先检查是否还有余票。如果仍有余票&#xff0c;用户可以顺利购买并导致库存相应减少&am…

鸿蒙next开发-OpenHarmony的NDK开发

Native API&#xff08;NDK&#xff09;入门 Native API是OpenHarmony SDK上提供的一组native开发接口与工具集合&#xff08;也称为NDK&#xff09;&#xff0c;方便开发者使用C或者C语言实现应用的关键功能。Native API只覆盖了OHOS基础的一些底层能力&#xff0c;如libc&am…

史上最全EasyExcel

一、EasyExcel介绍 1、数据导入&#xff1a;减轻录入工作量 2、数据导出&#xff1a;统计信息归档 3、数据传输&#xff1a;异构系统之间数据传输 二、EasyExcel特点 Java领域解析、生成Excel比较有名的框架有Apache poi、jxl等。但他们都存在一个严重的问题就是非常的耗内…

制作一个Python聊天机器人

我们学习一下如何使用 ChatterBot 库在 Python 中创建聊天机器人&#xff0c;该库实现了各种机器学习算法来生成响应对话&#xff0c;还是挺不错的 什么是聊天机器人 聊天机器人也称为聊天机器人、机器人、人工代理等&#xff0c;基本上是由人工智能驱动的软件程序&#xff0…

代码随想录训练营第三十天|332.重新安排行程51. N皇后37. 解数独

332.重新安排行程 采用哈希表方式进行储存出发点和到达点&#xff0c;终止条件是result中的机场数量为机票1&#xff1b; 重点在于哈希表的运用和遍历方法 51. N皇后 wtf? 回溯算法非常形象的N叉树解法&#xff1a; 输入n&#xff0c;row col,chessboard 终止条件&#x…

2024年pmp的考试时间是什么时候?

2024最新考试时间已经出来了&#xff1a;分别是 3月、6月、8月、11月&#xff0c;四次&#xff0c;具体考试日期还需要关注官网的进一步通知。 一、PMP报考条件 年龄满足 22 周岁有官方授权的培训机构给的 35个PDU&#xff08;学时&#xff09; 就能报名。 是不是相当于没有…

[Python] 如何通过ctypes库来调用C++ 动态库 DLL?

ctypes库介绍 ctypes是Python的一个外部库,它提供了一种灵活的方式来调用C语言的动态链接库(DLL)或共享库(SO)。通过ctypes,我们可以在Python中直接调用C语言编写的函数和变量,从而实现跨语言的互操作。 ctypes 它提供了与 C 兼容的数据类型,并允许调用 DLL 或共享库中的…

本地MinIO存储服务通过Java程序结合Cpolar内网穿透进行远程连接

文章目录 前言1. 创建Buckets和Access Keys2. Linux 安装Cpolar3. 创建连接MinIO服务公网地址4. 远程调用MinIO服务小结5. 固定连接TCP公网地址6. 固定地址连接测试 前言 MinIO是一款高性能、分布式的对象存储系统&#xff0c;它可以100%的运行在标准硬件上&#xff0c;即X86等…

【Linux系列】在Pop!OS的启动器中添加自定义程序图标

文章目录 前言一、创建快捷方式二、快捷方式参数三、添加右键菜单和注册MIME 前言 无论是在Windows上&#xff0c;还是Linux&#xff0c;或者安卓这些我们常用的操作系统上&#xff0c;一些应用程序的快捷方式放在桌面或者启动器&#xff0c;只需要简单的点击就可以启动&#…

【算法】串联所有单词的子串【滑动窗口】

题目 给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同。s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。例如&#xff0c;如果 words ["ab","cd","ef"]&#xff0c; 那么 "abcd…

Unity 编辑器篇|(十一)Gizmos (全面总结 | 建议收藏)

目录 1. 前言2 参数总览3 Gizmos绘制3.1 立方体&#xff1a;DrawCube3.2 视锥&#xff1a;DrawFrustum3.3 贴图&#xff1a;DrawGUITexture3.4 图标&#xff1a;DrawIcon3.5 线段&#xff1a;DrawLine3.6 网格&#xff1a;DrawMesh3.7 射线&#xff1a;DrawRay3.8 球体&#xf…

PBR材质背光面太暗优化

图形学中漫反射光照遵循兰伯特光照模型&#xff0c;它的公式如下 其中&#xff1a; &#xff1a;漫反射光颜色 &#xff1a;入射光颜色 &#xff1a;材质的漫反射系数 &#xff1a;法线方向 &#xff1a;光源方向 由于背光面的法线方向和光源方向的点积为负数&#xff0c;因此…

为什么 Golang Fasthttp 选择使用 slice 而非 map 存储请求数据

文章目录 Slice vs Map&#xff1a;基本概念内存分配和性能Fasthttp 中的 SliceMap性能优化的深层原因HTTP Headers 的特性CPU 预加载特性 结论 Fasthttp 是一个高性能的 Golang HTTP 框架&#xff0c;它在设计上做了许多优化以提高性能。其中一个显著的设计选择是使用 slice 而…