MySQL为什么选择B+树创建索引

news2024/9/23 15:27:54

不同方式查找数据

  • 1. 全表遍历
  • 2. 哈希结构
    • 2.1 使用哈希结构创建索引的缺点
    • 2.2 哈希索引的适用性
  • 3. 二叉搜索树
  • 4. AVL树
  • 5. B树
  • 6. B+树
    • 6.1 B+ 树和 B 树的差异
    • 6.2 采用B+树创建索引的优势
    • 6.3 一些需要注意的问题

1. 全表遍历

  • 将磁盘中存储的所有数据记录依次加载,与给定条件对比,直到找到目标记录;
  • 类比数组结构的线性查找,效率较低;

2. 哈希结构

  • 结合数组和链表结构(或者树结构)存储数据;
  • 通过哈希函数(散列函数)计算哈希地址,相同输入在固定函数下输出保持不变;
  • 哈希结构会发生哈希冲突,使用哈希桶或者红黑树可缓解哈希冲突;
  • 哈希结构查找效率较高,为O(1);
  • InnoDB和MyISAM存储引擎均不支持哈希索引,而Memory存储引擎支持哈希索引;

2.1 使用哈希结构创建索引的缺点

  • 哈希索引可满足等值查询(==、!=、IN),对于范围查询,效率较低;
  • 哈希索引下数据存储无序,对于排序查询效率较低;
  • 对于联合索引,哈希索引将多个列结合进行哈希计算,因此对于单独的列无法进行查询;
  • 哈希索引容易发生哈希冲突,此时查找效率降低;

2.2 哈希索引的适用性

  • InnoDB存储引擎不支持哈希索引,但提供了自适应哈希索引(Adaptive Hash Index)提高数据检索效率;
  • 可通过show variables like '%adaptive_hash_index';查看MySQL是否开启了自适应哈希索引;
  • 自适应哈希索引(Adaptive Hash Index):如果某个数据页被频繁访问,则当满足一定条件时将该数据页对应地址存储在哈希表中,如此下次访问该数据页时可直接由哈希表中的地址获取,而不用在B+树中检索;
    在这里插入图片描述

3. 二叉搜索树

  • 本质是二叉树;
  • 限制条件:左<根<右,即任意一颗子树,其根节点的值大于左子树所有节点的值,同时小于右子树所有节点的值;
  • 二叉搜索树一般查找效率较高,时间复杂度为O(log2n);

在这里插入图片描述

  • 缺点:极端情况下会退化为单链表,查找效率降低;
    在这里插入图片描述

4. AVL树

  • AVL树即平衡二叉搜索树;
  • 限制条件:二叉搜索树的任意子树的左右子树高度差绝对值不能超过1;
  • 优点:解决了二叉搜索树退化为单链表的问题;
  • 缺点:虽然二叉树实现简单,但如果数据量巨大,会导致二叉树高度过大,查找效率降低;
    在这里插入图片描述

5. B树

  • 本质是多叉平衡搜索树,可解决AVL树高度过高的问题,提高查找效率;
    在这里插入图片描述

6. B+树

  • 本质是多叉平衡搜索树,基于B树做了一定改进,更适合于文件索引系统;
  • B+树非叶节点中不存储真实数据,只存储索引;
    在这里插入图片描述

6.1 B+ 树和 B 树的差异

  • 有 k 个孩子的节点就有 k 个关键字。也就是孩子数量 = 关键字数,而 B 树中,孩子数量 = 关键字数
    +1;
  • 非叶子节点的关键字也会同时存在在子节点中,并且是在子节点中所有关键字的最大(或最小);
  • 非叶子节点仅用于索引,不保存数据记录,跟记录有关的信息都放在叶子节点中。而 B 树中, 非
    叶子节点既保存索引,也保存数据记录;
  • 所有关键字都在叶子节点出现,叶子节点构成一个有序链表,而且叶子节点本身按照关键字的大小从小到大顺序链接;

6.2 采用B+树创建索引的优势

  • B+树的内节点不存储真实数据记录,而B树内节点会存储部分真实数据;
  • B+树查询效率更加稳定;
  • B+树高度更低,查询效率更高;
  • 对于范围查询,B+树只有叶子结点存储有序的真实数据,因此查询效率更高;

6.3 一些需要注意的问题

1)为了减少IO,索引树会一次性加载吗?

  • 如果数据表存储的数据量非常大,则对应的索引文件可能也会很大,如果一次性加载到内存,对于内存要求较高;
  • 实际情况下,对于索引文件的加载是逐一进行的;

2)B+树的存储能力如何?为何说一般查找行记录,最多只需1~3次磁盘IO?

  • B+树为多叉平衡搜索树,每个节点对应一个真实数据页,每个数据页默认大小为16KB;
  • 主键类型一般采用INT(4B)或BIGINT(8B),指针类型一般也占据4B或8B ,最大情况下一个数据页可以存储16KB/(8B+8B)≈1000条记录;
  • 对于目录项记录页,每个数据页假设可存储1000条记录,则当B+树高度为3时,可存储约109条记录,数据量非常庞大;
  • 实际情况中,B+树上面三层可能不会完全填充,因此实际B+树一般设计为2~4层,也就是磁盘I/O次数为2~4次。但InnoDB存储引擎设计时将根节点常驻在内存,所以实际磁盘I/O次数为1~3次;

3)为什么说B+树比B-树更适合实际应用中操作系统的文件索引和数据库索引?

B+树只有叶子结点存储真实数据,查询效率更高更稳定,磁盘占用更少;

4)Hash 索引与 B+ 树索引的区别?

  • InnoDB存储引擎不支持Hash索引;
  • Hash索引数据存储无序,不支持ORDER BY排序,也不支持模糊查询;
  • Hash索引数据存储无序,不能进行范围查询;
  • Hash索引不支持联合索引的最左侧原则,即联合索引的部分索引无法使用;

5)Hash 索引与 B+ 树索引是在建索引的时候手动指定的吗?

  • InnoDB、MyISAM存储引擎不支持Hash索引,对于InnoDB提供的自适应哈希索引默认开启,不需要手动指定;
  • Memory存储引擎默认采用Hash索引;

参考《尚硅谷》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/732453.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux下的mosquitto服务安装及使用(避坑指南)

Mosquitto是一个开源的MQTT消息代理服务器。MQTT是一个轻量级的、基于发布/订阅模式的消息传输协议。 mosquitto的安装使用比较简单&#xff0c;可以方便的来进行一些测试。 mosquitto介绍 Mosquitto的特点&#xff1a; 1. 轻量级&#xff1a;Mosquitto是一个轻量级的MQTT代理…

Git学习(mac)

Git基础 1.安装与配置 下载与安装&#xff1a;git官网 使用入口&#xff1a; win&#xff1a;右键菜单 git bash Mac: 终端 查看git版本&#xff1a; git --version使用Git工作之前&#xff0c;我们需要做个一次性的配置。方便后续Git能跟踪到谁做了修改&#xff0c;我们需…

第四章——复合类型

数组 数组&#xff08;array&#xff09;是一种数据格式&#xff0c;能够存储多个同类型的值。例如30个int类型的值&#xff0c;12个float类型的值。每个值都存储在一个独立的数组元素中&#xff0c;计算机在内存中依次存储数组的各个元素。 创建数组时应指出以下三点&#x…

10.1UEC++/UObject

1. 1.new出的对象&#xff0c;不用自己管理内存释放&#xff1b; 2.比如两个类对象指针a,b同时指向一个苹果&#xff0c;若苹果消亡&#xff0c;会将a,b同时指向空。 3.保存时&#xff0c;将工程中的actor&#xff0c;属性等能够保存在本地就是uob在发挥作用。 4.不管在ue&…

自然语言处理实战项目12-基于注意力机制的CNN-BiGRU模型的情感分析任务的实践

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下自然语言处理实战项目12-基于注意力机制的CNN-BiGRU模型的情感分析任务的实践&#xff0c;本文将介绍一种基于注意力机制的CNN-BiGRU模型&#xff0c;并将其应用于实际项目中。我们将使用多条CSV数据样例&#xff0…

虚拟机ubuntu系统IP地址变成127.0.0.1了

使用sudo dhclient -v指令动态获取IP地址 注意要把电脑网线拔掉&#xff0c;如果WIFI和有线同时连着设备就会出现如下情况 拔掉网线后正常

网络应用基础交换机(NETBASE第五课)

网络应用基础交换机&#xff08;NETBASE第五课&#xff09; 交换机的定义 交换是按照通信两端传输信息的需要&#xff0c;用人工或设备自动完成的方法&#xff0c;把要传输的信息送到符合要求的相应路由上的技术的统称。交换机根据工作位置的不同&#xff0c;可以分为广域网交…

Tubi 时间序列 KPI 的异常值检测

欢迎来到 Tubi—— 在这里&#xff0c;广告型视频点播永不停歇&#xff01; 作为全球最大的流媒体服务之一&#xff0c;Tubi 保持稳定增长&#xff0c;并始终关注对业务发展至关重要的前沿趋势。基于此&#xff0c;Tubi 数据科学团队创建了一套全新警报系统&#xff0c;对 Key…

【Kubernetes运维篇】RBAC认证授权详解(一)

文章目录 一、RBAC授权认证理论知识1、什么是RBAC授权&#xff1f;2、认证基本流程3、K8S客户端访问apiserver的认证几方式1、第一种&#xff1a;客户端认证2、第二种&#xff1a;Bearertoken方式3、第三种&#xff1a;Serviceaccount方式 4、RBAC授权常见角色绑定方式1、第一种…

安装OSAR_Co_X

在找开源的QSAR平台 在WOS里用“open source”、“QSAR”、“platform”为关键字找到一个描述QSAR-Co-X的文献&#xff0c;这是一个基于python开发的QSAR平台&#xff08;额&#xff0c;&#xff0c;&#xff0c;目前还不是很清楚&#xff09;。 根据链接找到Github里代码的所…

讲故事vs讲知识,区别太大

讲故事vs讲知识&#xff0c;区别很大 以故事化的方式讲知识&#xff0c;一般受众爱听 讲故事&#xff0c;通常受众爱听 趣讲大白话&#xff1a;但不是所有的故事都爱听 【趣讲信息科技219期】 #非著名IT人安志强的趣味笔记# **************************** 有一小部分故事&#…

CTFshow-pwn入门-栈溢出pwn49(静态链接pwn-mprotect函数的应用)

pwn49 首先我们先将pwn文件下载下来&#xff0c;然后赋上可执行权限&#xff0c;再来查看pwn文件的保护信息。 chomd x pwn checksec pwn file pwn我们可以看到这是一个32位的pwn文件&#xff0c;并且保护信息开启了NX和canary&#xff0c;也就是堆栈不可执行且有canary。最最…

算数运算符

运算符介绍&#xff1a;运算符是一种特殊的符号&#xff0c;用以表示数据的运算、赋值和比较等。 算术运算符赋值运算符关系运算符逻辑运算符位运算符三元运算符 算术运算符 算术运算符是对数值类型的变量进行运算的。 % 取模&#xff0c;取余 在 % 的本质&#xff0c;a % b…

UE5.1.1 C++从0开始(17.GAS游戏能力系统)

教程的链接&#xff1a;https://www.bilibili.com/video/BV1nU4y1X7iQ 教程内的老师没用GAS的插件&#xff0c;而是自己写了一个。这一篇文章只是开头&#xff0c;还有很多的内容没有往里面写。 新增了一个object类&#xff0c;新增了一个使用这个类的组件。然后把这个组件用…

text-to-3d方面的论文列表分享

以下给出几篇我个人觉得比较有价值的text-to-3d的论文列表&#xff0c;论文的超链接会连接到arxiv上。 DreamfusionFantasia3DTangoLatent-NeRFMagic-3dClip-ForgeClip-MeshDreamfieldAvatarCLIPPoint-EShape-EText2Mesh

P3804 【模板】后缀自动机(SAM)

题目描述 给定一个只包含小写字母的字符串 S。 请你求出 S 的所有出现次数不为 11 的子串的出现次数乘上该子串长度的最大值。 输入格式 一行一个仅包含小写字母的字符串 S。 输出格式 一个整数&#xff0c;为所求答案。 题解&#xff1a;这里就不讲后缀自动机的模板相关…

zigbee学习之DHT11温湿度传感器+zigbee无线通信

开发环境&#xff1a;IAR烧录器串口调试助手CC2530DHT11 两个模块&#xff1a;一个作为协调器&#xff0c;负责接收数据&#xff0c;一个作为终端&#xff0c;负责发送数据 步骤&#xff1a; 1、SampleApp.c里配引脚P0_6(查看硬件上的标识) 2、DTH11.c里配引脚 3、修改PANID和信…

超纯水抛光混床树脂的选择及工艺流程

一、什么是超纯水&#xff1f; 既将水中的导电介质几乎完全去除&#xff0c;又将水中不离解的胶体物质、气体及有机物均去除至很低程度的水。电阻率大于18MΩ*cm&#xff0c;或接近18.3MΩ*cm极限值。 超纯水是科技界为了研制超纯材料&#xff08;半导体原件材料、纳米精细陶…

服务器搭建oracle,并远程连接教程

下载两个压缩包&#xff0c;然后上传到服务器&#xff0c; 软件安装09&#xff1a;CentOS安装Oracle - 虚拟机 - 5997CK - 欢迎您! (hezhilin.online) 这里有全部步骤&#xff0c;反正过了几天我也会忘记&#xff0c;不赘述了。 直接上拆的坑&#xff1a; 开启服务器端口后…

借书问题-2022年全国青少年信息素养大赛Python国赛第3题

[导读]&#xff1a;超平老师计划推出《全国青少年信息素养大赛Python编程真题解析》50讲&#xff0c;这是超平老师解读Python编程挑战赛真题系列的第5讲。 全国青少年信息素养大赛&#xff08;原全国青少年电子信息智能创新大赛&#xff09;是“世界机器人大会青少年机器人设计…