《B-树》

news2024/9/23 1:20:04

tips:B-树读成b树,并不是b减树

【一】基本搜索结构

种类数据格式时间复杂度
顺序查找无要求O(N)
二分查找有序O(log2N)
二叉搜索树无要求O(N)
二叉平衡树(AVL和红黑树)无要求,最后随机O(log2N)
哈希无要求O(1)
位图无要求O(1)
布隆过滤器无要求O(k)(k为哈希函数个数,一般比较小)

以上结构适合于数据量不是很大的情况下,如果数据量是非常大的,一次无法加载到内存中,使用上述结构就不是很方便,需要多次IO。

【二】使用平衡树搜索一个大文件

上述方式只是在内存中保存了每一项数据信息中需要查找的字段在磁盘中的位置,整体的数据实际上在磁盘中:

缺陷:

1.树的高度比较高,查找时最差的情况下要比较树的高度次

2.数据量如果特别大时,树中的节点可能无法一次性加载到内存中,需要多次IO

如何加速对数据的访问呢?

1.提高IO的速度

2.降低树的高度---平衡多茶树

 【三】B-树概念

一颗M(M>2)的B树,是一颗平衡的M路平衡搜索树,可以是空树或者满足以下性质:

1.根节点至少有两个孩子

2.每个根节点至少有m/2-1个关键字,至多有m-1个关键字,并且以升序排列

3.每个非根节点至少有m/2个孩子,至多有m个孩子

4.key[i]和key[i+1]之间的孩子节点的值介于key[i],key[i+1]之间

5.所有的叶子节点都在同一层

【四】B-树的结构分析

为了简单起见,假设M=3,即是三叉树,每个节点之中存储两个数据,两个数据可以区分成三个部分,因此节点应该有三个孩子,为了后续实现简单期间,节点的结构如下:

 注意:孩子永远比数据多一个

【五】插入过程分析      

1.如果树为空,直接插入新节点中,该节点为树的根节点

2.树非空,找待插入元素在树中的插入位置(注意:找到的插入节点位置一定在叶子节点中)

3.检测是否找到插入位置(假设树种key的位置唯一,也就是这个元素存在的适合不插入)

4.按照插入排序的思想将该元素插入到找到的节点中

5.检测该节点是否满足B-树的性质:即该节点中的元素个数是否等于M,如果小于则满足

6.如果插入后节点不满足B-树的性质,则需要对该节点进行分裂

a.申请新节点

b.找到该节点的中间位置

c.将该节点中间位置右侧元素及其孩子节点搬运到新节点中

d.将中间位置以及新节点往该节点的双亲节点中插入,也就是继续4的操作

7如果向上分裂到根节点的位置,插入结束

【六】B-树的性能分析

对于一颗节点为N度为M的B-树,查找和插入需要logM-1N次进行比较,这个还是比较好证明:对于度为M的B-树,每一个节点的个数为M/2~(M-1)之间,因此树的高度应该要在logM-1和logM/2N之间,在定位到该节点之后,使用二分查找就可以定位到元素,知道为什么在这里能进行二分查找吗?因为我们插入的时候,是按照大小进行插入,分裂的时候也是按照大小进行分裂的。所以存入的一定是有序的数据,所以可以使用二分查找。

B-树的效率是很高的,对于N = 62*1000000000个节点,如果度M为1024,则 <= 4,即在620亿个元素 中,如果这棵树的度为1024,则需要小于4次即可定位到该节点,然后利用二分查找可以快速定位到该元素,大大 减少了读取磁盘的次数。

以上就是这期B-树的全部内容了,有问题的地方还请打架位于评论区进行斧正,如果觉得还行,还请一件三连,毕竟码字不易。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/133523.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux系统中SPI驱动框架的基本原理与实现

大家好&#xff0c;今天主要和大家聊一聊&#xff0c;如何使用linux系统中SPI驱动ICM-20608六轴传感器的操作。 目录 第一&#xff1a;linux系统下SPI驱动框架简介 第二&#xff1a;SPI设备驱动编写 第三&#xff1a;SPI设备和驱动匹配过程 第一&#xff1a;linux系统下SPI驱…

MySQL数据库高级面试题(1)

✅作者简介&#xff1a;热爱国学的Java后端开发者&#xff0c;修心和技术同步精进。 &#x1f34e;个人主页&#xff1a;Java Fans的博客 &#x1f34a;个人信条&#xff1a;不迁怒&#xff0c;不贰过。小知识&#xff0c;大智慧。 &#x1f49e;当前专栏&#xff1a;Java面试题…

CSDN年度征文 | 你好,2023

祝大家新年快乐~&#x1f9e7;&#x1f9e7;&#x1f9e7;⭐过去的2022⭐2022已成过去&#xff0c;2023慢步向我们走来。回首2022&#xff0c;这一年不是平凡的一年。这一年&#xff0c;有苦也有乐。冬奥会的成功举办、香港回归25周年、二十大胜利召开、航天任务圆满成功等等都…

设计 | 分享5个好用的PPT模板网站

第一PPT 这个老牌的模板网站了&#xff0c;全站都是免费下载&#xff0c;还是不错的 但是素材质量嘛&#xff0c;免费所以不太高。 第一PPT下载https://www.1ppt.com/ 模板狗 这个是最近发现的一个网站&#xff0c;其中内容比较精美。 而且不用开会员也能单独购买&#x…

【Android】APT

引言&#xff1a; 安卓中APT又叫Annotation Processing Tool&#xff0c;即注解处理器。Java中注解分为编译时注解和运行时注解&#xff0c;编译时注解无法通过反射的方式进行获取和处理&#xff0c;所以我们可以利用APT处理编译时注解。比如常见的三方库ButterKnife、ARouter…

mysql删除重复记录并且只保留一条

准备的测试表结构及数据 插入的数据中A,B,E存在重复数据,C没有重复记录 CREATE TABLE tab ( id int(11) NOT NULL AUTO_INCREMENT, name varchar(20) DEFAULT NULL, PRIMARY KEY (id) ) ENGINEInnoDB AUTO_INCREMENT13 DEFAULT CHARSETutf8; -- --------------------…

使用root用户和普通用户完成分配任务案例 ansible(1)

目录 案例一&#xff1a; 控制主机和受控主机通过root用户通过免密验证方式远程控制受控主机实施对应任务。 案例二&#xff1a; 控制主机连接受控主机通过普通用户以免密验证远程控制受控主机实施特权指定操作。 案例一&#xff1a; 控制主机和受控主机通过root用户通过免…

<网络概述>——《计算机网络》

目录 1.网络基础 1.1 计算机网络背景 1.2 网络发展 1.3 软件分层 1.4 网络和操作系统的关系 1.5 局域网通信的原理 2. 网络协议 2.1 网络协议初识 2.1.1 协议分层 2.2 OSI七层模型 2.3 TCP/IP五层(或四层)模型 3. 网络传输基本流程 3.1 网络传输流程图 3.2 数据包…

密码技术扫盲,Part 3:认证

个人博客 密码技术扫盲&#xff0c;Part 1&#xff1a;对称加密密码技术扫盲&#xff0c;Part 2&#xff1a;非对称加密&#x1f3af; 密码技术扫盲&#xff0c;Part 3&#xff1a;认证 除了加密&#xff0c;还有一类用法是对信息的认证&#xff0c;主要包括 4 个技术 单向散…

PostgreSQL JIT 实现query性能加速的一些补充

文章目录背景Executor 本身做的一些优化LLVM JIT 的优化本地以及全局优化执行 query 时的优化JIT调度优化 过程背景 之前介绍过一次 PostgreSQL JIT with LLVM 实现&#xff0c;因为有一些细节没有介绍得很清楚&#xff0c;需要额外做一些补充。 关于LLVM 的IR 以及 如何 用LL…

11.HTML颜色、HTML脚本、字符实体、URL

1.HTML颜色 1&#xff09;HTML 颜色由红色、绿色、蓝色混合而成。 2&#xff09;HTML 颜色由一个十六进制符号来定义&#xff0c;这个符号由红色、绿色和蓝色的值组成&#xff08;RGB&#xff09;。 3&#xff09;每种颜色的最小值是0&#xff08;十六进制&#xff1a;#00&…

性能优化系列之怎么让图片加载得更快?

文章の目录一、压缩png1、优势2、说明文档3、安装4、使用4.1、环境4.2、示例4.3、API4.4、还有一个第三库是对当前库的封装&#xff0c;叫jdf-png-native【版本1.1.0&#xff0c;环境同node-pngquant-native】&#xff0c;使用方法和node-pngquant-native差不多二、压缩jpg1、优…

分享68个PHP源码,总有一款适合您

链接&#xff1a;https://pan.baidu.com/s/1QB61EsIl70vXx1yrJkiesA?pwdbup1 提取码&#xff1a;bup1 PHP源码 分享68个PHP源码&#xff0c;总有一款适合您 下面是文件的名字&#xff0c;我放了一些图片&#xff0c;文章里不是所有的图主要是放不下...&#xff0c;大家下载…

【树莓派不吃灰】IO篇① GPIO 开发环境

目录1. 前言1.1 4B GPIO引脚排列2. Python GPIO安装3. 基于C语言的wiringPi安装❤️ 博客主页 单片机菜鸟哥&#xff0c;一个野生非专业硬件IOT爱好者 ❤️❤️ 本篇创建记录 2023-01-01 ❤️❤️ 本篇更新记录 2023-01-01 ❤️&#x1f389; 欢迎关注 &#x1f50e;点赞 &…

vivo 服务端监控体系建设实践

作者&#xff1a;vivo 互联网服务器团队- Chen Ningning 本文根据“2022 vivo开发者大会"现场演讲内容整理而成。 经过几年的平台建设&#xff0c;vivo监控平台产品矩阵日趋完善&#xff0c;在vivo终端庞大的用户群体下&#xff0c;承载业务运行的服务数量众多&#xff0c…

Modbus-RTU通讯协议中CRC校验

MODBUS协议中的CRC校验_RobotWoods的博客-CSDN博客_modbus crc 以下面这段收发数据为例&#xff1a; 发送的数据是工控机发送给plc的&#xff0c;他们的通信是modbus通信&#xff0c;前面的01。。。。。0f是实际使用的数据&#xff0c;具体意义可以查&#xff0c;后面的4位数87…

对模板类型推演的一个小Bug

在写vector的代码时遇到了这样一个错误 以下是代码书写内容以及我的测试代码 测试代码的目的就是想测试一下我写的vector构造方法 vector(size_t n, const T& val T())&#xff1b; 可是却发生了上述的报错 vector(size_t n, const T& val T()){// 法一&#xff1a…

【云原生】springcloud13——Config分布式配置中心

前 言 &#x1f349; 作者简介&#xff1a;半旧518&#xff0c;长跑型选手&#xff0c;立志坚持写10年博客&#xff0c;专注于java后端 ☕专栏简介&#xff1a;深入、全面、系统的介绍springcloud与springcloud Alibaba微服务常用技术栈 &#x1f330; 文章简介&#xff1a;本文…

JUC并发编程学习笔记(三)集合线程安全及多线程锁

4 集合的线程安全 4.1 集合操作 Demo 创建集合使用string的泛型 for (int i 0; i <30; i) {new Thread(()->{//向集合添加内容list.add(UUID.randomUUID().toString().substring(0,8));//从集合获取内容System.out.println(list);},String.valueOf(i)).start(); }查看…

Odoo 16 企业版手册 - 库存管理之产品变体与属性

产品变体和属性 向客户提供多种产品变体是提高销售的有效策略。Odoo允许您在库存模块中配置产品的不同变体&#xff0c;就像我们在销售和购买模块中所做的那样。首先&#xff0c;确保从库存模块的「设置」菜单中激活「变体」功能&#xff0c;如下所示。 「产品变体」选项可以从…