mysql的B+树索引结构介绍

news2024/9/21 22:55:51

一、B+树

  特性:

  • 所有的叶子结点中包含了全部关键字的信息,非叶子节点只存储键值信息,及指向含有这些关键字记录的指针,且叶子结点本身依关键字的大小自小而大的顺序链接,所有的非终端结点可以看成是索引部分,结点中仅含有其子树根结点中最大(或最小)关键字。 
  • 所有叶子节点之间都有一个链指针。
  • 数据记录都存放在叶子节点中。
  • 树的高度相对较低,IO次数相对较少。

树高度的影响:

  1. 树的深度与I/O次数的关系: 在B+树中,每次从根节点到叶子节点的查找都需要进行一次I/O操作。如果树的高度增加,意味着需要进行更多的I/O操作才能访问到数据。因此,树的高度越低,访问数据所需的I/O次数越少。

  2. 节点存储容量: B+树的节点可以存储更多的键值,这意味着每个节点可以包含更多的数据,从而减少了树的深度。例如,如果一个节点可以存储1000个键值,而B树的节点只能存储100个键值,那么B+树的高度将是B树的十分之一左右。

        由于B+Tree的非叶子节点只存储键值信息,假设每个磁盘块能存储3个键值及指针信息,则变成B+Tree后其结构如下图所示:

可能上面例子中只有22条数据记录,看不出B+Tree的优点,下面做一个推算:

I        InnoDB存储引擎中页的大小为16KB,一般表的主键类型为INT(占用4个字节)或BIGINT(占用8个字节),指针类型也一般为4或8个字节,也就是说一个页(B+Tree中的一个节点)中大概存储16KB/(8B+8B)=1K个键值(因为是估值,为方便计算,这里的K取值为1000。也就是说一个深度为3的B+Tree索引可以维护1000 * 1000 * 50(最后一层每个磁盘块存多少数据节点,假设是50个) = 5千万条记录。深度一般是三到四层。

        实际情况中每个节点可能不能填充满,因此在数据库中,B+Tree的高度一般都在2-4层。mysql的InnoDB存储引擎在设计时是将根节点常驻内存的,也就是说查找某一键值的行记录时最多只需要1~3次磁盘I/O操作。

二、B树

        

        B-树允许每个内部节点有多个子节点,这通常被称为树的“度”或“阶”。这意味着B-树的每个节点可以有多条路径到达子节点。

        B-树和B+树都是自平衡的多路搜索树,它们在很多方面有相似之处,但也有一些关键的结构差异。以下是B-树和B+树的主要结构对比:

  1. 数据存储位置

    • B-树:数据记录既可以存储在内部节点,也可以存储在叶子节点。
    • B+树:数据记录仅存储在叶子节点,内部节点仅存储键值和子节点的引用。
  2. 节点键值数量

    • B-树:每个节点的键值数量可以是其子节点数减一或加一。
    • B+树:每个内部节点的键值数量是其子节点数减一,而叶子节点的键值数量是其子节点数。
  3. 叶子节点的连接方式

    • B-树:叶子节点之间没有直接的链接。
    • B+树:所有叶子节点通过指针相互连接,形成一个有序的链表,便于顺序访问和范围查询。
  4. 树的高度

    • 由于B+树的内部节点可以存储更多的键值,B+树通常比相同条件下的B-树具有更少的高度,这意味着在B+树中进行查找、插入和删除操作可能需要更少的I/O次数。
  5. 范围查询效率

    • B-树:虽然可以执行范围查询,但效率不如B+树,因为B-树的叶子节点之间没有直接的链接。
    • B+树:由于叶子节点形成了有序链表,执行范围查询和顺序访问非常高效。
  6. 插入和删除操作

    • B-树:在插入和删除操作中,B-树可能需要在内部节点和叶子节点之间移动数据。
    • B+树:在B+树中,插入和删除操作通常只影响叶子节点,内部节点的键值仅用于导航。
  7. 分裂和合并操作

    • B-树:当节点满时,分裂操作可能涉及到将键值提升到父节点,并可能需要调整多个节点。
    • B+树:分裂操作通常只影响当前节点和其兄弟节点以及它们的父节点,因为B+树的内部节点不存储数据记录。
  8. 存储密度

    • B-树:由于内部节点也存储数据记录,B-树的存储密度可能不如B+树。
    • B+树:B+树的内部节点只存储键值和子节点的引用,因此具有更高的存储密度。
  9. 应用场景

    • B-树:适用于需要在内部节点和叶子节点都存储数据的场景。
    • B+树:由于其高效的范围查询性能和顺序访问性能,B+树通常用于数据库索引和文件系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1936694.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

达梦数据库 MPP集群搭建(带主备)

MPP集群搭建(带主备) 1.背景2.操作内容和要求3. 具体步骤3.1 搭建过程3.1.1 集群搭建3.1.2 准备工作3.1.2.1 初始化3.1.2.2 备份数据库 3.1.3 配置主库EP013.1.3.1 配置dm.ini3.1.3.2 配置dmmal.ini3.1.3.3 配置dmarch.ini3.1.3.4 配置dmmpp.ctl3.1.3.5 …

Linux NFS服务搭建及使用

一、NFS 服务器介绍 nfs ( Network File System )即网络文件系统,其基于 UDP/IP使用 nfs 能够在不同计算机之间通过网络进行文件共享,能使使用者访问网络上其它计算机中的文件就像在访问自己的计算机一样。 二、NFS 服务器的特点 …

【Java】用队列实现栈 力扣

文章目录 题目链接题目描述思路代码 题目链接 225.用队列实现栈 题目描述 思路 一个队列在模拟栈弹出元素的时候只要将队列头部的元素(除了最后一个元素外) 重新添加到队列尾部,此时再去弹出元素就是栈的顺序了。 代码 class MyStack {Q…

C++那些事之依赖注入

C那些事之依赖注入 最近星球里面有个小伙伴让更新一下依赖注入,于是写出了这篇文章,来从实际的例子讲解,本文会讲解一些原理与实现,完整的实现代码懒人版放在星球中,我们开始正文。 大纲: 直接依赖接口依赖…

什么是长效住宅IP?

长效住宅IP的定义 长效住宅IP,简而言之,是指长期稳定、非动态更换的住宅网络IP地址。这类IP地址通常由互联网服务提供商(ISP)分配给居民家庭用户,用于上网、网络通信等日常网络活动。与传统的动态IP相比,长…

​前端Vue组件技术实践:打造自定义精美悬浮菜单按钮组件

随着前端技术的迅猛发展,复杂的应用场景和不断迭代的产品需求使得开发的复杂度日益提升。传统的整体式开发方式已经难以满足现代前端应用的灵活性和可维护性需求。在这样的背景下,组件化开发逐渐崭露头角,成为解决复杂前端应用问题的有效手段…

算法第十一天:leetcode707.设计链表

一、设计链表的题目描述与链接 707.设计链表的链接如下表所示,您可直接复制下面网址进入力扣学习,在观看下面的内容之前一定要先做一遍哦,这样才能印象深刻! https://leetcode.cn/problems/design-linked-list/https://leetcode.…

Java_Docker

镜像和容器: 镜像仓库: 存储和管理镜像的平台,镜像仓库中有非常多常用软件的镜像,Docker官方维护了一个公共仓库​​​​​​:​Docker Hub 部署MySQL: docker run -d \--name mysql \-p 3306:3306 \-e TZAsia/Shang…

C/C++的堆栈内存分配详解

在C/C编程中,内存管理是至关重要的一个方面。理解内存的分配方式有助于编写高效、可靠的程序,C/C主要使用两种内存分配方式:堆(heap)和栈(stack)。这两者在管理方式、性能和使用场景上都有显著区…

RDMA软件架构

RDMA 的软件架构按层次可分成两部分,即 rdma-core 和内核 RDMA 子系统,分别运行在 Linux 系统中的用户态和内核态。整个软件架构适用于所有类型的 RDMA 网卡,不管网卡执行了哪种 RDMA 协议(InfiniBand/RoCE/ iWARP)。 …

[SUCTF 2019]EasySQL1

这是一个简单的SQL注入题,但是因为我的SQL基础约等于0,所以做起来很难。 首先试试引号是否被过滤 可以看到单引号、双引号都被过滤了,试试其他的盲注都不行,基本上可以确定不能用这种方法。 在测试的过程中发现,输入…

Python实现招聘数据采集 ,并做可视化分析

转眼秋招快到了, 今天来学习一下如何用Python采集全网招聘数据,并进行可视化分析,为就业准备~ 话不多说开始造 源码和详细的视频讲解我都打包好了,文末名片自取 准备工作 首先你需要准备这些 环境 Python 3.10 Pycharm 模块…

[解决方法]git上传的项目markdown文件的图片无法显示

应该有不少初学者会遇到这种情况 以下是本人摸索出的解决方法 我使用的是typora,首先设置typora的图片设置 文件>偏好设置>图像 如下: 选择这个就会在此文件的同级目录下创建一个assets文件夹来存放此markdown文件的所有图片 然后勾选优先使用相…

开机自启动设置

该方法优点是最简单且bug最少: 按键盘上的:CtrlR 打开"运行”,输入“shell:startup"并打开;下次重启即可自动启动软件了

CSRF防御及模拟CSRF攻击

CSRF(Cross-Site Request Forgery,跨站请求伪造)是一种攻击方式,攻击者可以诱使用户在已登录的应用中执行非本意的操作。为了防御这种攻击,许多Web应用会使用CSRF Token来验证请求的合法性。 0.csrf 攻击原理 2. 后端服…

2024 HNCTF PWN(hide_flag Rand_file_dockerfile Appetizers TTOCrv_)

文章目录 参考hide_flag思路exp Rand_file_dockerfile libc 2.31思路exp Appetizers glibc 2.35绕过关闭标准输出实例客户端 关闭标准输出服务端结果exp TTOCrv_🎲 glibc 2.35逆向DT_DEBUG获得各个库地址随机数思路exp 参考 https://docs.qq.com/doc/p/641e8742c39…

HTTPS 的加密过程 详解

HTTP 由于是明文传输,所以安全上存在以下三个风险: 窃听风险,比如通信链路上可以获取通信内容。篡改风险,比如通信内容被篡改。冒充风险,比如冒充网站。 HTTPS 在 HTTP 与 TCP 层之间加入了 SSL/TLS 协议&#xff0c…

LVS+Nginx高可用集群---搭建高可用集群负载均衡

1.LVS简介 Lvs(Linux Virtual Server):使用集群,对于整个用户来说是透明,用户访问的时候是单个高性能的整体。道理与nginx类似 LVS网络拓扑图:是基于四层。 用户通过浏览器发送请求,然后到达LVS.Lvs根据相应算法将…

使用NIFI连接瀚高数据库_并从RestFul的HTTP接口中获取数据局_同步到瀚高数据库中---大数据之Nifi工作笔记0067

首先来看一下如何,使用NIFI 去连接瀚高数据库. 其实,只要配置好了链接的,连接字符串,和驱动,任何支持JDBC的数据库都可以连接的. 首先我们用一个ListDatabaseTables处理器,来连接瀚高DB 主要是看这里,连接地址,以及驱动,还有驱动的位置 这个是数据连接的配置 jdbc:highgo://…

FinClip 率先入驻 AWS Marketplace,加速全球市场布局

近日,凡泰极客旗下的小程序数字管理平台 FinClip 已成功上线亚马逊云科技(AWS)Marketplace。未来,FinClip 将主要服务于海外市场的开放银行、超级钱包、财富管理、社交电商、智慧城市解决方案等领域。 在全球市场的多样性需求推动…