《程序员面试金典(第6版)》面试题 16.25. LRU 缓存(自定义双向链表,list库函数,哈希映射)

news2024/11/27 15:40:33

题目描述

设计和构建一个“最近最少使用”缓存,该缓存会删除最近最少使用的项目。缓存应该从键映射到值(允许你插入和检索特定键对应的值),并在初始化时指定最大容量。当缓存被填满时,它应该删除最近最少使用的项目。
题目传送门:面试题 16.25. LRU 缓存

  • 它应该支持以下操作: 获取数据 get 和 写入数据 put 。

  • 获取数据 get(key) - 如果密钥 (key) 存在于缓存中,则获取密钥的值(总是正数),否则返回 -1。

  • 写入数据 put(key, value) - 如果密钥不存在,则写入其数据值。当缓存容量达到上限时,它应该在写入新数据之前删除最近最少使用的数据值,从而为新的数据值留出空间。

示例:

LRUCache cache = new LRUCache( 2 /* 缓存容量 */ );

cache.put(1, 1);
cache.put(2, 2);
cache.get(1);       // 返回  1
cache.put(3, 3);    // 该操作会使得密钥 2 作废
cache.get(2);       // 返回 -1 (未找到)
cache.put(4, 4);    // 该操作会使得密钥 1 作废
cache.get(1);       // 返回 -1 (未找到)
cache.get(3);       // 返回  3
cache.get(4);       // 返回  4

解题思路与代码

  • 这道题我觉得还是有点迷惑性的,假如说不了解什么是LRU缓存,可能会被“删除最近最少使用”这句话给蒙蔽了双眼,而给出了错误的答案。

  • 你可能以为,我需要删除的是访问次数相同的,最近的那个内存,其实不是的。

  • LRU的原理是,如果数据最近被访问过,那么将来被访问的几率也更高。因此,我们在缓存满的时候,会淘汰最长时间未被访问的数据。

  • 所以说,做这道题的时候,被误导了一下有点难受的。不过知道了原理,其实这道题也没有那么的困难。这道题的核心是删除最长时间未被访问过的内存,也就是说,想办法解决了这个问题,这道题也就迎刃而解了。

  • 我们可以考虑用双向链表 + unordered_map 去解决这个问题,我们每次添加元素,都从头开始添加。内存满了,删除元素都从队列尾部删除,是不是完美的符合了删除最长时间不访问这个元素的需求。

  • 最后,我们访问一个链表内的元素,我们就把这个元素,先从链表中删除,把它从新添加到链表头部,是不是也完美符合题意?

  • 那unordered_map的作用是什么呢?它的作用就是让你快速知道你的这查找的这个元素是否在链表内,它的查找复杂度是O(1)的。

  • 而双向链表的添加和删除节点的操作本身的时间复杂度也是O(1)的。所以用这两种数据结构,可以完美的去均摊这个时间复杂度。

那又因为面试官考你这道题,肯定是想要考你自定义双向链表的,而不是想看你用库函数。所以我们要自己掌握,如何创建并使用一个自定义的双向链表。

其次,这就意味着库函数的双向链表不重要了吗?恰恰相反,它也十分重要,真正的工作中,肯定也是不可能让你自己创建链表的。所以,矛盾又不矛盾。

那接下来,就看我给大家展现这两种解法的代码都是如何写的吧~

方案一:自定义双向链表 + unordered_map

  • 在这道题当中,我们需要实现两个函数,get 和 put
  • get函数就是查找缓存中对应key的value。put函数就是把元素放到容器内,如果容器满了,就挑一个删除了,再添加。
  • 根据题意,当容器满了时,我们要删除的元素是,最长时间未被使用的元素,这里我们使用的容器是双向链表,我们每次都从链表的头部开始添加元素,如果容器满了,需要删除的元素就一定是容器尾部的元素。
  • 再者,我们如果查询了这个元素,而这个元素又在容器内的话,我们就要把它重新移动到头部,那如何移动呢?自然是删除后再添加啦,从当前位置删除,从链表头部添加。
  • 这个自定义双向链表,我设置两个哨兵节点,分别是headtail,这会使等会的链表操作变得非常的简单。具体的双向链表的其他实现,就请大家来看看代码啦~

具体的代码如下:

class LRUCache {
public:
    struct Node{
        int key;
        int val;
        Node * prev;
        Node * next;
        Node(int k, int v) : key(k), val(v), prev(nullptr), next(nullptr){};
    };
    LRUCache(int capacity) : cap(capacity), size(0), head(new Node(-1,-1)), tail(new Node(-1,-1)) {
        head->next = tail;
        tail->prev = head;
    }
    int get(int key) {
        if(map.find(key) == map.end()) return -1;
        moveNode(map[key]);
        return map[key]->val;
    }
    
    void put(int key, int value) {
        if(map.find(key) != map.end()){
            map[key]->val = value;
            moveNode(map[key]);
        }else{
            if(size == cap){
                map.erase(tail->prev->key);
                removeFromList(tail->prev);
                --size;
            }
            Node * node = new Node(key,value);
            addToHead(node);
            map[key] = node;
            ++size;
        }
    }
private:
    int cap;
    int size;
    Node * head;
    Node * tail;
    unordered_map<int,Node*> map;

    void addToHead(Node * node){
        node->next = head->next;
        node->prev = head;
        head->next->prev = node;
        head->next = node;
    }

    void removeFromList(Node * node){
        node->next->prev = node->prev;
        node->prev->next = node->next;
    }

    void moveNode(Node * node){
        removeFromList(node);
        addToHead(node);
    }
};

在这里插入图片描述

复杂度分析:

这个 LRU 缓存的实现,无论是 get 还是 put 操作,都可以在常数时间内完成,因此时间复杂度是 O(1)。

  • 这是因为,我们通过哈希表实现了对任意键值的快速查询,查询的时间复杂度是 O(1)。

    • 对于哈希表中存储的每个键值对,我们都有一个对应的链表节点。当需要将某个键值对提到最近使用的位置时,我们可以直接通过哈希表找到对应的链表节点,然后在 O(1) 时间内将其移动到链表的头部。同样,当缓存容量已满,需要淘汰最久未使用的键值对时,我们也可以在 O(1) 时间内从链表尾部删除一个节点。
  • 对于空间复杂度,因为哈希表和链表都存储了整个数据,所以空间复杂度是 O(capacity),其中 capacity 是缓存的最大容量。

方案二:使用list + unordered_map

  • 这种做法,最大的好处就是带你重新复习了一遍list容器中,各种函数的操作。如果你对list函数的操作不太熟悉的话,你可以看下我写的这篇文章:全面理解:C++中list(双向链表)容器的基础概念与函数解析

其他没什么了,代码的逻辑和上一种一模一样。

具体的代码如下:

class LRUCache {
public:
    LRUCache(int capacity) : cap(capacity) {}
    int get(int key) {
        if(map.find(key) == map.end()) return -1;
        cache.splice(cache.begin(),cache,map[key]);
        return map[key]->second;
    }
    void put(int key, int value) {
        if(map.find(key) != map.end()){
            cache.splice(cache.begin(),cache,map[key]);
            map[key]->second = value;
        }else{
            if(cache.size() == cap){
                map.erase(cache.back().first);
                cache.pop_back(); 
            }
            cache.push_front({key,value});
            map[key] = cache.begin();
        }
    }
private:
    int cap;
    list<pair<int,int>> cache;
    unordered_map<int,list<pair<int,int>>::iterator> map;
};

/**
 * Your LRUCache object will be instantiated and called as such:
 * LRUCache* obj = new LRUCache(capacity);
 * int param_1 = obj->get(key);
 * obj->put(key,value);
 */

复杂度分析:

时间复杂度:

  • get 方法:O(1)。unordered_map 用哈希实现,所以查找的平均时间复杂度是O(1),list::splice方法的时间复杂度也是O(1)。
  • put 方法:O(1)。unordered_map的插入和删除操作的平均时间复杂度都是O(1),list::push_front和list::pop_back也都是O(1)。

空间复杂度:

  • O(capacity)。list和unordered_map都存储了缓存中的所有元素,所以空间复杂度与缓存的容量成正比。

这就是为什么我们使用 list 和 unordered_map 结构来实现 LRU 缓存的原因,它们可以确保所有操作都在常数时间复杂度内完成,而且空间复杂度与缓存的容量成正比。

总结

这道题主要是为了测试你对LRU(Least Recently Used)缓存淘汰策略的理解和实现能力,同时也在考察你的数据结构设计能力。

  • LRU缓存淘汰策略在实际中广泛应用,例如在数据库缓存、浏览器缓存等场景中,都会有其身影。其核心思想是“如果一个数据在最近一段时间没有被访问到,那么在将来它被访问的可能性也很小”。因此,这种算法可以用于预测哪些数据应该被替换出去,从而使缓存的命中率最大。

  • 实现这个策略需要用到的数据结构包括哈希表(HashMap)和双向链表(Doubly LinkedList)。其中,哈希表提供了快速查找,而双向链表则可以用来调整数据的优先级。

通过这道题,你可以锻炼并展示出你对以上各种技术和数据结构的掌握程度。同时,这也是一种非常实用的技能,可以直接应用于你未来的项目和工作中。

最后的最后,如果你觉得我的这篇文章写的不错的话,请给我一个赞与收藏,关注我,我会继续给大家带来更多更优质的干货内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/590776.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

消息队列内容

问题有哪些&#xff1f; &#xff08;1&#xff09;消息队列为什么会出现&#xff1f; &#xff08;2&#xff09;消息队列能用来干什么&#xff1f; &#xff08;3&#xff09;使用消息队列存在的问题&#xff1f; &#xff08;4&#xff09;如何解决重复消费的问题&#…

PyCharm安装使用教程

简介 PyCharm是一种PythonIDE&#xff08;Integrated Development Environment&#xff0c;集成开发环境&#xff09;&#xff0c;带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具&#xff0c;比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单…

docker-安装redis集群

目录 1.服务器列表 2.安装docker 3.docker内网IP地址配置 4.docker安装redis集群 1.选择合适数据位置 2.循环生成redis配置目录 3.打开宿主机防火墙端口 4.循环生成redis容器 5.创建集群命令 6.命令行集群验证 1.服务器列表 服务器列表 nameip远程端口用户名/密码cen…

One2Multi Graph Autoencoder for Multi-view Graph Clustering

One2Multi Graph Autoencoder for Multi-view Graph Clustering | Proceedings of The Web Conference 2020 (acm.org) 目录 Abstract 1 Introduction 2 Model 2.1 Overview 2.2 One2Multi Graph Convolutional Autoencoder Informative graph convolutional encoder M…

Eclipse教程 Ⅸ

今天继续来学习Eclipse 快速修复、Eclipse 浏览菜单、Eclipse 查找以及Eclipse 悬浮提示的内容&#xff01;老规矩&#xff0c;废话不多说&#xff0c;开始吧。 Eclipse 快速修复 使用快速修复 在 Eclipse 编辑器中当你输入字母时&#xff0c;编辑器会对你输入的内容进行错误…

PostgreSQL FDW

一、FDW简单理解 FDW (foreign-data wrapper&#xff0c;外部数据包装器)&#xff0c;PostgreSQL FDW 是一种外部访问接口&#xff0c;它可以被用来访问存储在外部的数据&#xff0c;这些数据可以是外部的pg数据库&#xff0c;也可以oracle、mysql等数据库&#xff0c;甚至可以…

大气气溶胶期末复习笔记

大气气溶胶期末复习笔记 大气气溶胶 广义&#xff1a;指悬浮在大气中的各种固态和液态微粒与大气构成的混合体系 狭义&#xff1a;指大气中悬浮的各种固态粒子&#xff0c;简称气溶胶粒子 来源 直接注入 通过地表直接注入大气固体&#xff0c;液体物质的破碎过程中产生&…

筛质数—(埃氏筛欧拉筛)

埃氏筛&欧拉筛 埃氏筛欧拉筛 例题&#xff1a;AcWing 868. 筛质数 对欧拉筛的理解不是很深刻&#xff0c;写下自己的理解&#xff0c;加深一下理解&#xff0c;也方便后期忘记后再学习 埃氏筛 埃氏筛的主要思想是让质数x去筛掉x的所有合数&#xff0c;这个比较容易理解。…

机器学习知识经验分享之五:R语言安装

python语言用于深度学习较为广泛&#xff0c;R语言用于机器学习领域中的数据预测和数据处理算法较多&#xff0c;后续将更多分享机器学习数据预测相关知识的分享&#xff0c;有需要的朋友可持续关注&#xff0c;有疑问可以关注后私信留言。 目录 一、R语言介绍 二、R语言安装…

装饰器模式:实现类功能的动态扩展

一&#xff0c;简介 装饰器模式&#xff08;Decorator Pattern&#xff09;是一种结构型设计模式&#xff0c;它允许在不修改原有类结构的情况下&#xff0c;给一个对象动态添加额外的职责。通常情况下&#xff0c;扩展一个类的功能我们首先会想到用继承方式来实现&#xff0c…

7步搞懂手写数字识别Mnist

大家好啊&#xff0c;我是董董灿。 图像识别有很多入门项目&#xff0c;其中Mnist 手写数字识别绝对是最受欢迎的。 该项目以数据集小、神经网络简单、任务简单为优势&#xff0c;并且集合了CNN网络中该有的东西&#xff0c;可谓麻雀虽小&#xff0c;五脏俱全。 非常适合新手…

Fourier分析入门——第12章——Fourier变换的性质

目录 第12章 Fourier变换的性质 12.1 引言 12.2 Fourier变换性质的相关定理 12.2.1 线性定理(Linearity) 12.2.2 伸缩性定理(Scaling) 12.2.3 时间/空间平移定理(Shift) 12.2.4 频移定理 12.2.5 调制定理(Modulation) 12.2.6 微分定理(Differentiation) 12.2.7 积分定…

冒泡排序详解(Bubble Sort)

本文已收录于专栏 《算法合集》 目录 一、简单释义1、算法概念2、算法目的3、算法思想4、算法性质 二、核心思想构建排序 三、图形展示宏观展示微观展示 四、算法实现实现思路代码实现客户端调用构造堆的方法元素交换的方法元素比较的方法 运行结果 五、算法描述1、问题描述2、…

数据库管理-第七十八期 记第一次数据库吐槽大会(20230530)

数据库管理 2023-05-30 第七十八期 记第一次数据库吐槽大会1 主席2 三六九等3 数据库吐槽大会总结 第七十八期 记第一次数据库吐槽大会 昨天晚上终于还是把Exadata X9M-2和之前用于展示RAC搭建及升级的那套库做好了ADG&#xff0c;这部分操作在整理后会在下个月发出来。因为之…

Python列表类型的使用

文章目录 Python中的列表类型一、列表的常用操作二、列表的增删改查三、列表常用的函数 Python中的列表类型 将各个元素用方括号&#xff08;[]&#xff09;括起来&#xff0c;用逗号&#xff08;,&#xff09;分隔开&#xff0c;这种形式的数据类型就是列表。各个元素的数据类…

HNU-电子测试平台与工具2-串口实验5次

计算机串口使用与测量 【实验属于电子测试平台与工具】 湖南大学信息科学与工程学院 计科 210X wolf (学号 202108010XXX) 0.环境搭建 在实验开始之前,安装好Ubuntu 20.04操作系统。(这个没有难度) 但要提醒的是,这个ubuntu是xubuntu,而且虚拟硬盘只有10GB的大小…

智警杯1.4---excel可视化

视频要点&#xff1a; 首先就是有数据透视表 点击数据透视表&#xff0c;分析&#xff0c;字段项目&#xff0c; 切片器筛选 切片器&#xff08;我希望用什么对数据进行一个筛选&#xff09; 跟下拉列表有点像&#xff0c;只不过切片器仅仅之对于数据透视表 依旧需要用su…

HBase集群搭建

hbase 1.解压HBase安装包 先 下载HBase压缩包&#xff0c;并解压安装文件&#xff0c;示例代码如下&#xff1a; tar -zxvf hbase-2.0.1-bin.tar.gz2. 修改配置文件 编辑 conf目录下的 hbase-env.sh文件&#xff0c;示例代码如下&#xff1a; cd conf vi hbase-env.sh添加…

压缩感知入门③基于ADMM的全变分正则化的压缩感知重构算法

压缩感知系列博客&#xff1a;压缩感知入门①从零开始压缩感知压缩感知入门②信号的稀疏表示和约束等距性压缩感知入门③基于ADMM的全变分正则化的压缩感知重构算法 文章目录 1. Problem2. 仿真结果3. MATLAB算法4. 源码地址参考文献 1. Problem 信号压缩是是目前信息处理领域非…

Frame Pacing

Frame Pacing是每个游戏都要遇到的问题&#xff0c;这里面有很多细节值得探讨。 为什么需要做Frame Pacing&#xff1f; 从我们的游戏线程渲染一帧到最终屏幕上绘制出一帧不是一个概念&#xff0c;这种间会经历CPU&#xff0c;GPU&#xff0c;屏幕合成器等多个角色的协同工作&a…