数据结构(四) B树/跳表

news2025/1/22 5:43:39

目录

1. LRU

2. B树

3. 跳表


1. LRU:

1.1 概念:

        最近最少使用算法, 就是cache缓存的算法. 因为cache(位于内存和cpu之间的存储设备)是一种容量有限的缓存, 有新的数据进入就需要将原本的数据进行排出.

 1.2 LRU cache实现:

#include <iostream>
#include <list>
#include <unordered_map>

using namespace std;

class LRUCache
{
public:
    LRUCache(int capacity)
    {
        _capacity = capacity;
    }

    //获取数据.
    int get(int key)
    {
        //找到数据key的值.
        auto hashit = _hashmap.find(key);
        if(hashit != _hashmap.end())
        {
            //找到对应关键词
            auto listit = hashit->second;
            pair<int, int> kv = *listit;

            //删除原来对应关键词数据;
            _list.erase(listit);
            //现在头插关键词数据.
            _list.push_front(kv);
            //然后改变一下hashmap的key的值..
            _hashmap[key] = _list.begin();
            return kv.second;
        }
        else
        {
            return -1;
        }
    }

    //插入新的数据.key,value类型的.
    void put(int key, int value)
    {
        auto hashit = _hashmap.find(key);
        if(hashit == _hashmap.end())
        {
            //找不到对应的数据;
            if(_list.size() >= _capacity)
            {
                //大于容量.
                _hashmap.erase(_list.back().first);
                //删除最后一个数据.(这个数据很久没访问过的);
                _list.pop_back();
            }

            _list.push_front(make_pair(key, value));
            _hashmap[key] = _list.begin();
        }
        else
        {
            auto listit = hashit->second;
            pair<int, int> kv = *listit;
            kv.second = value;

            _list.erase(listit);
            _list.push_front(kv);
            _hashmap[key] = _list.begin();
        }
    }

private:
    //链表保存各个cache里的数据.
    list<pair<int, int>> _list;
    size_t _capacity;
    //使用下标和cache数据指针进行映射.
    unordered_map<int, list<pair<int, int>>::iterator> _hashmap;
};

2. B树:

2.1 常见的搜索结构:

        顺序查找O(N), 二分查找O(logN), 二叉搜索树O(N), 二叉平衡树O(logN), 哈希O(1);

这些查找算法只能在数据量比较少, 以及内存可以一次进行寻找的, 如果数据量很大, 那么数据一次无法放到内存只能在磁盘中. 那么内存和磁盘进行交互的话时间就比较慢.

 2.2 B树的概念:

        一种平衡多叉树, 可以进行外查找的. 一棵M阶多叉树, 是一个平衡M路的平衡多叉树.满足性质:

(1) 根结点至少有两个孩子;

(2) 每个分支结点都包含k-1个关键字和k个孩子. 其中k的取值在[m/2, m]之间.

(3) 每个叶子结点都包含k-1个关键词; k的取值[m/2, m];

(4) 叶子结点都在一层, (5) 每个结点从小到大排序.

2.3 B树的插入分析:

        下面拿三叉树来举例,  M = 3, 那么每个结点可以最多存储2个数据(k范围[1, 3), k-1个关键词; 孩子的话永远比数据多一个, 就是3个孩子.

插入数据74, 49, 139, 145, 36, 53的过程. 如果结点满就需要分裂.

 2.4  B树的实现:

(1) 结构:

        采用一个关键词数组以及存放关键词的孩子结点, 还有一个保存关键词的父亲结点.

//类型为k, 数量为M.
//M层数.
template<class K, size_t M>
struct BTreeNode
{
    //创建关键词数组; 以及相对应的孩子结点.
    K _keys[M];
    //孩子结点的指针.
    BTreeNode<K, M>* _subs[M+1];
    BTreeNode<K, M>* _parent;
    //记录存储关键字数.
    size_t _n;

    BTreeNode()
    {
        for(size_t i = 0; i < M; i++)
        {
            _keys[i] = K();
            _subs[i] = nullptr;
        }
        
        _subs[M] = nullptr;
        _parent = nullptr;
        _n = 0;
    }
};

template<class K, size_t M>
class BTree
{
    typedef BTreeNode<K, M> Node;

private:
    Node* _root = nullptr;
};
(2) 查找:  

      

//查找数据:
    pair<Node*, int> Find(const K& key)
    {
        Node* parent = nullptr;
        Node* cur = _root;
        
        //遍历B树结点.
        while(cur)
        {
            size_t i = 0;
            while(i < cur->_n)
            {
                //小于关键词不存在.
                if(key < cur->_keys[i])
                {
                    break;
                }
                //大于就在右边.
                else if(key > cur->_keys[i])
                {
                    i++;
                }
                else
                {
                    //相等返回cur结点以及下标位置.
                    return make_pair(cur, i);
                }
            }
            //本关键词找不到就到另外一个关键词查看.
            parent = cur;
            cur = cur->subs[i];
        }
        //找不到就返回空.
        return make_pair(parent, -1);
    }
(3) 插入关键字:

        如果满了首先找到中间结点, 中间结点的后面结点移动新结点, 然后中间结点放到parent数组中.

//
(4) 遍历关键词:

        遍历每个结点的孩子结点, 先左子树, 再根, 后右子树即可.

    void _InOrder(Node* cur)
    {
        if(cur == nullptr)
            return;
        
        size_t i = 0;
        for(; i < cur->_n; i++)
        {
            //先遍历左子树.
            _InOrder(cur->_subs[i]);
            //打印根子树.
            cout << cur->_keys[i] << " ";
        }

        //再去遍历右子树.
        _InOrder(cur->_subs[i]);
    }
(5) B树性能分析:

        查找效率大概就是O(logM-1)O(logm/2); 查询到结点就再使用二分查找很快就可以找到. l例如620亿个数据, 树的度是1024的话, 最多需要查询4次. 这样就可以减少磁盘io次数.

2.5 B+树:

        在B树上做了些修改: (1) 分支节点的子树指针和关键字个数相同;

(2) 叶子结点增加一个连接指针将叶子结点连接在一起.

(3) 分支节点的子树指针p[i]指向关键字值大小在[k[i],k[i+1])区间之间

(4) 所有关键字及其映射数据都在叶子节点出现

所有的关键字都出现在叶子结点的链表中, 并且有序;

不可能在分支结点命中, 分支结点相当与是叶子结点的索引, 叶子结点才是真正存储数据的.

        B+树的增加只会改变原结点以及父结点, 因为将一半结点给兄弟结点, 源节点给父亲结点即可.

 2.6 B*树:

        B+树的变形, 增加非叶子结点和非根结点的链表指针.

B*树增加数据就要将看兄弟结点没满就将数据插入到兄弟结点中, 其次就是满的话将数据创建一个新的结点, 然后将1/3数据给新结点, 重新修改一下父结点的指向孩子的指针.

 2.6 总结:

(1) B树: 有序数组和平衡多叉树;

(2) B+树: 有序数组链表和平衡多叉树;

(3) B*树: 一个饱满, 均匀, 空间利用率高的B+树.

 2.7 B树的运用:

        在MySQL中使用到索引, 高效获取数据的数据结构, 索引在于表, 而不是数据库.

(1) MyISAM: (非聚簇索引)

        不支持事务, 支持全文索引, 叶子结点存放的是数据的地址. 包含主索引和辅助索引, 主索引的key不能重复, 辅助索引可以. 这种数据和索引不在一起的就是非聚簇索引.

(2) Innodb:

        支持事务, 支持B+树索引、全文索引、哈希索引。它是将数据和索引存放在一起; 数据存储的是值不是地址, 这种就是聚簇索引.

3. 跳表:

3.1 概念:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2280189.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Boot 整合 ShedLock 处理定时任务重复执行的问题

&#x1f337; 古之立大事者&#xff0c;不惟有超世之才&#xff0c;亦必有坚忍不拔之志 &#x1f390; 个人CSND主页——Micro麦可乐的博客 &#x1f425;《Docker实操教程》专栏以最新的Centos版本为基础进行Docker实操教程&#xff0c;入门到实战 &#x1f33a;《RabbitMQ》…

CSDN年度回顾:技术征途上的坚实步伐

嘿&#xff0c;时光过得可真快呀&#xff0c;就像那匹跑得飞快的白马&#xff0c;嗖的一下&#xff0c;2024 年的日历就这么悄无声息地翻到了最后一页。这会儿我回头看看在 CSDN 上度过的这一年&#xff0c;心里那叫一个感慨万千&#xff0c;满满的都是喜悦&#xff0c;就像心里…

解决 PostgreSQL 中创建 TimescaleDB 扩展的字符串错误

解决 PostgreSQL 中创建 TimescaleDB 扩展的字符串错误 在使用 PostgreSQL 数据库并尝试创建 TimescaleDB 扩展时&#xff0c;你可能会遇到一些棘手的错误。今天&#xff0c;我们就来探讨一个常见的错误信息及相应的解决方法&#xff1a; CREATE EXTENSION IF NOT EXISTS tim…

【语言处理和机器学习】概述篇(基础小白入门篇)

前言 自学笔记&#xff0c;分享给语言学/语言教育学方向的&#xff0c;但对语言数据处理感兴趣但是尚未入门&#xff0c;却需要在论文中用到的小伙伴&#xff0c;欢迎大佬们补充或绕道。ps&#xff1a;本文不涉及公式讲解&#xff08;文科生小白友好体质&#xff09;&#xff…

【ESP32】ESP32连接JY61P并通过WIFI发送给电脑

前言 手头上有个ESP32&#xff0c;发现有wifi功能&#xff0c;希望连接JY61P并通过WIFI把姿态数据发送给电脑 1.采用Arduino IDE编译器&#xff1b;需要安装ESP32的开发板管理器&#xff1b; 2.电脑接受数据是基于python的&#xff1b; 1. ESP32 连接手机WIFI #include <…

将 Docker 安装到 Windows 的 D 盘的方法

1.官网下载Docker Desktop Installer.exe&#xff0c;官网网址&#xff1a;Get Started | Docker 2.以管理员身份打开 Windows 终端 3.切换到 你Docker Desktop Installer.exe下载到的地址 4.在运行代码前&#xff0c;需要提前手动创建好D:\Program Files\Docker和D:\Program F…

DeepSeek-R1-GRPO理解

一、GRPO GRPO&#xff08;Group Relative Policy Optimization&#xff09;是一种强化学习&#xff08;Reinforcement Learning, RL&#xff09;算法&#xff0c;专门用于训练大型语言模型&#xff08;LLMs&#xff09;在复杂任务&#xff08;如数学推理、代码生成等&#xf…

Unreal Engine 5 C++ Advanced Action RPG 十章笔记

第十章 Survival Game Mode 2-Game Mode Test Map 设置游戏规则进行游戏玩法 生成敌人玩家是否死亡敌人死亡是否需要刷出更多 肯定:难度增加否定:玩家胜利 流程 新的游戏模式类游戏状态新的数据表来指定总共有多少波敌人生成逻辑UI告诉当前玩家的敌人波数 3-Survival Game M…

接口(1)

大家好&#xff0c;今天我们来看看接口的概念&#xff0c;接口跟类的使用是有一些区别的&#xff0c;接口中都是抽象方法&#xff0c;简单介绍一下后&#xff0c;我们正式来学习。 2、接口 接口就是公共的行为规范标准,大家在实现时,只要符合规范标准,就可以通用. 在java中,…

docker离线安装及部署各类中间件(x86系统架构)

前言&#xff1a;此文主要针对需要在x86内网服务器搭建系统的情况 一、docker离线安装 1、下载docker镜像 https://download.docker.com/linux/static/stable/x86_64/ 版本&#xff1a;docker-23.0.6.tgz 2、将docker-23.0.6.tgz 文件上传到服务器上面&#xff0c;这里放在…

debian中apt的配置与解析

引言 在系统使用过程中&#xff0c;我们可能会遭遇 apt update 操作出现问题&#xff0c;或者 apt upgrade 速度迟缓的情况。这往往是由于所使用软件源本身存在诸如服务器性能不佳、维护不及时等质量问题&#xff0c;同时&#xff0c;软件源服务器与我们所处地理位置的距离较远…

python创建一个httpServer网页上传文件到httpServer

一、代码 1.server.py import os from http.server import SimpleHTTPRequestHandler, HTTPServer import cgi # 自定义请求处理类 class MyRequestHandler(SimpleHTTPRequestHandler):# 处理GET请求def do_GET(self):if self.path /:# 响应200状态码self.send_response(2…

Git处理冲突详解

文章目录 Git处理冲突详解一、引言二、冲突产生的原因三、解决冲突的步骤1. 手动解决冲突1.1 查看冲突文件1.2 编辑冲突文件1.3 提交解决冲突 2. 使用合并工具解决冲突 四、使用示例五、总结 Git处理冲突详解 一、引言 在团队协作开发中&#xff0c;Git冲突是不可避免的。当多…

如何降低振荡器的相位噪音

相位噪音&#xff08;Phase Noise&#xff09;是振荡器设计中一个重要的性能指标&#xff0c;尤其在高精度和高频应用中。相位噪音不仅影响信号的质量&#xff0c;还可能对后续系统的性能造成显著影响。因此&#xff0c;如何有效降低振荡器的相位噪音成为了科研与工业界关注的热…

一文读懂 RocketMQ:从概念到架构与应用原理概述

文章目录 概述架构说明核心组件核心概念 namesvrproducer默认实现producer启动消息发送 broker-mq核心基本模型集群模型内部模型存储机制高可用 consumerpush类型push流程pull类型 概述 随着分布式技术在业内的快速应用&#xff0c;mq&#xff08;消息队列&#xff09;做为不可…

算法日记8:StarryCoding60(单调栈)

一、题目 二、解题思路&#xff1a; 题意为让我们找到每个元素的左边第一个比它小的元素&#xff0c;若不存在则输出-1 2.1法一&#xff1a;暴力&#xff08;0n2&#xff09; 首先&#xff0c;我们可以想到最朴素的算法&#xff1a;直接暴力两层for达成目标核心代码如下&…

map和set的使用(一)详解

文章目录 序列式容器和关联式容器map和set的介绍set构造和迭代器遍历和insertfinderaseswapclearcountlower_bound和upper_boundmultiset和set的对比 set的二个题目题目解析算法原理代码介绍一个找差集的算法同步算法题目解析算法原理代码 map构造遍历initiaizer_list 序列式容…

CSS布局与响应式

学习链接 Grid网格布局 前端五大主流网页布局 flex布局看这一篇就够了 grid布局看这一篇就够了 用六个案例学会响应式布局 伸缩盒响应式页面布局实战 实现响应式布局的五种方式 - csdn 如何完成响应式布局&#xff0c;有几种方法&#xff1f;看这个就够了 响应式布局总…

P6周:VGG-16算法-Pytorch实现人脸识别

&#x1f368; 本文为&#x1f517;365天深度学习训练营中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 我的环境 语言环境&#xff1a;Python 3.8.12 编译器&#xff1a;jupyter notebook 深度学习环境&#xff1a;torch 1.12.0cu113 一、前期准备 1.设置GPU im…

Git:问题解决办法 及 Tips 总结

目录 查看历史记录及比较区别查看所有提交的历史记录查看提交的详细历史记录查看提交之间的差异点击文件操作历史&#xff0c;筛选出所有改动过此文件的提交任意两个提交之间的比较&#xff08;开发及查BUG常用&#xff09; 在需要版本回滚的情况下处理方法短时间内无法彻查BUG…