[MySQL索引]2.索引的底层原理(一)

news2024/11/17 17:32:32

索引的底层原理(一)

    • B-树索引
    • B+树索引

tips:

​ 通过使用malloc/new来申请4字节的内存,但是操作系统不是说每一次用户申请4字节内存,我就只分配4字节,这样申请次数多了就要涉及频繁的用户态和内核态的切换,开销比较大,所以我们调用malloc/new向系统申请内存时,系统的内存管理是以页为单位的(一个页面的大小为4k),系统分配2*4k大小的内存空间,其中4字节是我们所需要的,而剩下的空间由libc.so或者libc++.so库中的malloc实现ptmalloc或者tcmalloc来管理了,这样当后面我们继续申请内存时,就不用进行用户和内核态的切换,直接用户态下就能获得内存空间。

​ 数据和索引都是存储在磁盘中的,所以MySQL Server执行查询的时候,需要花费磁盘I/O来把索引和数据读取到内存中,读取的单位是,一般是16K,也是内存页面的整数倍

B-树索引

m阶平衡树,m一般取300~500

m取多少合适?最好的情况就是一次磁盘I/O读取的磁盘块的内容,刚好存储在B-树的一个节点中
在这里插入图片描述

对于2000W规模的数据,取m为500,那么B-树只要三层(log2000W)<以m为底> ,花费的磁盘I/O不超过三次

当我们执行"select * from student where uid=5"这样的SQL语句时,uid是主键(InnoDB存储引擎自动为其添加索引),因为过滤条件中uid字段有索引,存储引擎就会向系统内核(kernel)请求进行磁盘I/O以读取索引文件的内容到内存中,然后在内存中用索引的数据构建B树来加快搜索

我们再来看上面的B-树,其中键值(key)指的就是数据库表中创建了索引的字段的值,然后data里面存储的是数据本身还是数据在磁盘上的地址呢?这就和数据库表使用的存储引擎有关,我们知道MyISAM存储引擎是将数据以及索引分开进行存储的(.MYD,.MYI)所以此时data里面存储的就是数据在磁盘上的地址,而InnoDB是将数据和索引都存储在一个文件中(.ibd),所以data里面存储的就是数据本身

对于一个500阶平衡树,一个节点就有500个指针域指向孩子节点,我们可以看到每个节点中的数据(key)都是有序存储的,并且左孩子的值<父亲节点<右孩子,所以我们在一个节点中进行数据的搜索是按照二分搜索的方式进行的,就比如我们要搜索28,那我们在B-树中进行搜索的时间复杂度为O(logn)<以2为底>,虽然在二叉平衡树AVL中进行搜索所花费的时间复杂度也为O(logn)<以2为底>,虽然在内存中搜索的时间是一样的但是最关键的地方在于使用B-树,一次磁盘I/O读取的磁盘块的内容,刚好存储能存储在B-树的一个节点中,这就意味着更少的磁盘I/O。


B+树索引

问题:为什么MySQL(MyISAM和InnoDB)索引底层选择B+树而不是B树呢?

  • 索引+数据内容分散在不同的节点中,离根节点近,搜索就快;离根节点远,搜索就慢,这导致花费的磁盘I/O不平均,每一行搜索数据花费的时间也不平均

  • B-树中每一个节点不仅要存储key值还要存储key所对应的data,这样一个节点所能存放的key值得个数相比于只存放key值要少得多,key值的命中率也就会比较低

  • B-树不方便做范围搜索(比如where id<20这样的过滤条件,每一次都要搜索B-树),整表遍历也不方便

在这里插入图片描述

针对上面的问题,B+树都做了优化:

  • B+树每一个非叶子节点只存放key,不存储data,这样的好处就是一个节点存放的key值更多,B+树在理论上来说,层数会更低一些,搜索的效率会更好一些。

  • 叶子节点上存储了所有的索引值,这就意味着每一个索引所对应的值data,都需要跑到叶子节点上,这样每一行记录搜索的时间是非常平均的!

  • B+树的叶子节点被串在一个链表中,形成了一个有序的链表,如果要进行索引树的搜索&整表搜索,直接遍历叶子节点的有序链表即可!或者做范围查询的时候,直接遍历叶子节点的有序链表即可!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/398620.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AM5728(AM5708)开发实战之安装Debian 10桌面操作系统

一 环境搭建 准备一个SD卡启动卡&#xff0c;能够正常引导板卡启动&#xff0c;后续会把Debian 10镜像安装到SD卡ext4分区 准备两个U盘&#xff0c;一个格式化成fat32文件系统&#xff0c;另一个格式化成ext4文件系统 下载Debian 10镜像&#xff0c;镜像名字为debian-10.4.0-a…

【前端】一个更底层库React,附教程

Reat是什么&#xff1f;React在UI里最火的也是最好的库&#xff0c;React是一个做UI的库&#xff0c;具体来说是做UI组件的库&#xff0c;专注于做mvc中的v&#xff0c;它是一个更底层的工具库。为你应用的每一个状态设计简洁的视图&#xff0c;当数据变动时 React 能高效更新并…

Linux发行版本与发行版的简单的介绍

Linux linux下有很多发行的版本&#xff0c;或者称之为魔改版本。以下介绍一些常见的版本&#xff0c;以避免名词的混淆。 linux是提供了一个内核&#xff0c;就像是谷歌的内核一样&#xff0c;QQ浏览器就是使用的谷歌的内核&#xff0c;也算是一个发行版本。 Ubuntu&#x…

课程项目简介

一、深度学习模型入门 1&#xff0c;什么是机器学习&#xff1f; Study of algorithms that improve their performance P at some task T with experience E. 研究在某个任务T上用经验E提高其性能P的算法。 well-defined learning task:<P,T,E> 明确的学习任务&#…

手把手开发一门程序语言JimLang (2)

根据爱因斯坦的相对论&#xff0c;物体的质量越大&#xff0c;时间过得越快&#xff0c;所以托更对于我的煎熬&#xff0c;远远比你们想象的还要痛苦…今天给大家来盘硬菜&#xff0c;也是前些时日预告过的JimLang的开发过程… Let’s go !!! 语法及解析 JimLang.g4 这里我们…

轮毂要怎么选?选大还是选小?

随着改装车的越来越火爆&#xff0c;汽车轮毂可选择的款式也越来越多&#xff0c;90%的人换轮毂&#xff0c;首先选的就是外观。大轮毂的款式多&#xff0c;外形大气好看&#xff0c;运动感十足&#xff0c; 那是不是选大轮毂就可以呢&#xff1f;不是的&#xff0c;汽车轮毂要…

全面吃透Java Stream流操作,让代码更加的优雅

文章目录1 认识Stream流1.1 什么是流1.2 流与集合1.2.1 流只能遍历一次1.2.2 外部迭代和内部迭代1.3 流操作1.3.1 中间操作1.3.2 终端操作1.3.3 使用流2 学会使用Stream流2.1 筛选和切片2.1.1 用谓词筛选2.1.2 筛选各异的元素2.1.3 截短流2.1.4 跳过元素2.2 映射2.2.1 map方法2…

Java经典面试题——对比 Vector、ArrayList、LinkedList 有何区别?

典型回答 这三者都是实现集合框架中的 List &#xff0c;也就是所谓的有序集合&#xff0c;因此具体功能也比较近似&#xff0c;比如都提供按照位置进行定位、添加或者删除的操作&#xff0c;都提供迭代器以遍历其内容等。但因为具体的设计区别&#xff0c;在行为、性能、线程…

详解CRC原理以及C语言实现

CRC检验原理 CRC&#xff08;Cyclic Redundancy Check&#xff09;校验是一种常用的数据校验方法&#xff0c;它通过计算数据的校验码来检测数据在传输过程中是否出现了错误。 CRC校验的基本原理是将数据按照一定的规则进行计算&#xff0c;得到一个固定长度的校验码&#xf…

JavaScript内改变this指向

之前我们说的都是代码内 this 的默认指向 今天我们要来说一下如何能改变 this 指向 也就是说, 你指向哪我不管, 我让你指向哪, 你就得指向哪 开局 在函数的原型( Function.prototype ) 上有三个方法 call apply bind 既然是在函数的原型上, 那么只要是函数就可以调用这三个方…

React(七):Router基本使用、嵌套路由、编程式导航、路由传参、懒加载

React&#xff08;七&#xff09;一、React-Router的基本使用1.安装和介绍2.路由的配置和跳转3.Navigate的使用4.如果找不到对应的路由路径&#xff1f;二、嵌套路由的用法三、编程式路由导航1.类组件中使用useNavigate2.函数式组件中使用useNavigate四、路由跳转传参1.设置好路…

小白学Pytorch 系列--Torch API(1)

小白学Pytorch 系列–Torch API Torch version 1.13 Tensors TORCH.IS_TENSOR 如果obj是PyTorch张量&#xff0c;则返回True。 注意&#xff0c;这个函数只是简单地执行isinstance(obj, Tensor)。使用isinstance 更适合用mypy进行类型检查&#xff0c;而且更显式-所以建议使…

【计组】主存储器有关知识梳理

一、主存储器 主存储器可以直接和CPU进行通信&#xff0c;但是只能保存临时数据&#xff0c;在断电后数据就消失。还有一个特点是&#xff0c;主存储器的容量小&#xff0c;速度快&#xff0c;造价高。 1.构成 2.主存中存储体的构造 最小的存储单位是存储元&#xff0c;存储元…

近亿美元:人工心脏龙头永仁心医疗完成超大额A轮融资

近日&#xff0c;永仁心医疗器械有限公司&#xff08;以下简称“永仁心医疗”&#xff09;完成近一亿美元A轮融资&#xff0c;由北京科兴中维生物技术有限公司&#xff08;SINOVAC科兴&#xff09;领投&#xff0c;太平&#xff08;深圳&#xff09;医疗健康产业私募股权投资基…

腾讯IM h5版本,在安卓原生和IOS原生支持情况的调查以及踩坑、解决办法

介绍 公司准备基于腾讯IM进行开发即时通讯功能&#xff0c;想用H5来开发&#xff0c;这样方便以后移植&#xff0c;在原生app里直接加载&#xff0c;通过三天时间的调查&#xff0c;以及与腾讯客服&#xff0c;技术来回沟通&#xff0c;已经有一定的成果&#xff0c;现将调查成…

【Redis】Redis持久化(一)

目录 1.Redis持久化 1.1.RDB持久化 1.1.1.执行时机 1.1.2.RDB原理 1.1.3.小结 1.2.AOF持久化 1.2.1.AOF原理 1.2.2.AOF配置 1.2.3.AOF文件重写 1.3.RDB与AOF对比 1.Redis持久化 Redis有两种持久化方案&#xff1a; RDB持久化 AOF持久化 1.1.RDB持久化 RDB全称Red…

SpringBoot - 什么是跨域?如何解决跨域?

什么是跨域&#xff1f; 在浏览器上当前访问的网站&#xff0c;向另一个网站发送请求&#xff0c;用于获取数据的过程就是跨域请求。 跨域&#xff0c;是浏览器的同源策略决定的&#xff0c;是一个重要的浏览器安全策略&#xff0c;用于限制一个 origin 的文档或者它加载的脚本…

Doris集成其他系统——ODBC外部表

Doris集成其他系统——ODBC外部表 文章目录Doris集成其他系统——ODBC外部表0. 写在前面1. 正文1.1 ODBC外部表介绍1.2 使用方式2. 使用 ODBC 的 MySQL 外表2.1 前置芝士2.2 安装 unixODBC2.3 安装MySQL 对应版本的 ODBC2.3.1 安装方式2.3.2 检查安装结果2.3.3 其他节点的安装及…

prometheus 配置服务器监控、服务监控、容器中服务监控与告警

最近公司有几个服务遇到了瓶颈&#xff0c;也就是数据量增加了&#xff0c;没有人发现&#xff0c;这不是缺少一个监控服务和告警的系统吗&#xff1f; 主要需求是监控每个服务&#xff0c;顺带监控一下服务器和一些中间件&#xff0c;这里采集的2种&#xff0c;zabbix和prom…

Kafka 消费者组

Kafka 消费者组Consumer数位移重平衡消费者组 (Consumer Group) : 可扩展且容错性的消费者机制 一个组内可能有多个消费者 (Consumer Instance) : 共享一个公共 ID (Group ID)组内的所有消费者协调消费订阅主题 (Subscribed Topics) 的所有分区 (Partition)每个分区只能由同个…