【计组 | Cache原理】讲透Cache的所有概念与题型方法

news2024/12/23 5:19:51

Cache

写在前面:高速缓存Cache一直408中的重点以及绝对的难点,前几天我在复习计组第三章的知识,Cache这一节把我困住了,我发现很多概念我都不记得了,一些综合性强的计算题根本无从下手,我深知Cache对于每个408的初学者来说,都是痛点、难点所在,因此花了一晚上狠狠学习Cache总结做了这个Cache“大观”,尝试用最精简且具有逻辑性的方式,只讲重难点和考点,给大家讲透Cache(我发现市面上很多课程讲解的都是比较零散且不好消化的,没有抓住主要矛盾),用最短的时间达到做出考研408题目的要求。

为什么要使用Cache?

为了引出Cache这个高速缓存的妙用,我们先来认识一个概念—时间局部性

所谓的时间局部性就是同一条指令在短时间内多次运行,比如循环结构,那么我们在循环体内重复更新的变量就是具有时间局部性的,而学过操作系统我们就知道程序是放在内存里运行的,由于时间局部性,程序运行时频繁访问的数据就集中在主存中的某几块区域内,于是我们只要把这几块区域的指令、数据全都复制到CPU的Cache里,这样CPU就可以先去Cache里看看有没有数据如果有直接取出,如果没有再取访存,提高了取数据的效率。由于命中率很高,平均访问是接近于Cache的访问时间的!!(小考点)

那么主存究竟是将数据复制到Cache内的呢?我们继续来看!

关于Cache的所有概念(重点)⭐

我们现在需要把主存中的部分高频访问内容复制到Cache中,最简单的思路就是把主存和Cache都划分出一个个的相同大小的区域,然后就可以直接把数据复制过去了对吧。实际上计算机也是这么做的。

  1. **“块”**的概念:我刚刚说的大小相同的区域,在主存中叫作主存块,在Cache中叫作Cache块或Cache行(注意这两是一个东西,题目中给出块或者行都是OK的)。主存块的大小就等于Cache块的大小!!这是第一点需要我们铭记于心的,原理我刚刚已经说过了,就是方便交换数据。

  2. Cache的数据结构模型(重点看,有个记忆能画出来是最好的)

    在这里插入图片描述

    从王道教材书这张图,我们可以看到Cache主要分为了tag标记位和存储数据两部分,数据部分是以“块”为单位与内存交换数据的,如果不够清晰,我们来看小林coding给出这张结构图:

    在这里插入图片描述

    我们可以清楚地看到每一个Cache行都分为了tag位和数据块,对应的主存也要划分成一个个一样大小的数据块,那么主存是怎么进行划分操作的呢?我们需要引出一个概念“主存地址”。

  3. 主存地址:将主存划分为多个主存块后,我们就需要一些数据位来标识块号,因此主存地址可以划分为两部分:高位地址(标识块号)+低位地址(块内地址)。请一定要记住这个划分它是我们后面做题的逻辑基点,同样的Cache以同样的划分方式:高位地址(标识块号)+低位地址(块内地址)

  4. 有效位:Cache中除了拥有上述的主要部分tag+数据块,还有一些特别的东西,我们先从有效位开始介绍。

    1. 工作原理:有效位用来标记对应的 Cache行中的数据是否是有效的,如果有效位是 0,无论Cache 中是否有数据,CPU 都会直接访问内存,重新加载数据。
    2. 作用:有了这个有效位,我们想要淘汰一个主存块数据就很容易了,只需要把有效位置0,装入一个新的主存块的时候,再把有效位置为1即可。
  5. CPU访问过程:我一开始的时候就说了,如果Cache中已经有了数据,我们就不要去访存了,但是如果在Cache中没有找到数据,我们就要去内存中读取并把数据块复制到Cache块中,这个过程也就是Cache的缺失处理。重点来了,到底是谁去完成这些判断、替换数据块工作的呢?为了保证速度当然只能由硬件来实现了,因此Cache对于程序员来说是透明的,所有过程都由硬件自动实现。硬件自动实现,硬件自动实现!!!重要的事情说三遍。

Cache和主存的映射方式(超级重点⭐⭐)

这一块请跟着我一起理解并记忆!!考察计算题!

我们一直再说交换数据,那么我们怎么把主存的数据块通过地址映射的方式,复制到Cache行中呢?先来了解一下三种映射方式:

1)三种映射方式

  1. 直接映射:每个主存块映射到Cache的特定行中,CPU访问某个特定行即可
  2. 全相联映射:主存块可以映射到Cache的任意行中,需要把Cache所有行都扫一遍
  3. 组相联映射:把Cache分成多个组,每个组又有多个行,主存块可以放到特定组的任意行中,访问的时候只需要看看那特定组的所有行

2)直接映射的理解

  1. 我们先来看这张图:

    在这里插入图片描述

  2. 我们需要把主存块映射到特定的Cache行中,因此就需要一个转化的方式,我们把它提炼成一个公式:

    cache 行号 = 主存块号 % Cache行数

    我们来解释一下:假设我们一个主存块的大小为4B,给出一个主存地址x(还记得主存地址是什么吗,上面已经讲过高位标识块号低位为快内地址),我们就可以通过x/4去找到我们的主存块号(假设是从0标号的),我们也可以通过转成二进制然后通过右移操作(比如/4就是右移两位)来得到块号,再用块号去%Cache行数(同样的模运算也可以用二进制取后n位得到,等会会演示)。

    Cache行数如果题目中没有给出,就是用Cache的总容量去 / cache块的大小(和主存块是一样大的)来得到。

    好好理解一下这个公式,后面我会用综合性很强的计算题带着大家来做练习加深理解。

  3. 主存地址划分:

    三部分组成:标记Tag+Cache行号(也有叫索引的)+块内地址(也有叫块内偏移的)

    其中主存块号就是去除块内地址的部分,即标记+Cache行号。我们刚刚一直没有介绍tag位是用来干嘛的,只是引出了这个概念,实际上它是作为主存块和Cache块是否匹配的验证信息,如上图用一个比较器进行匹配的操作,同时还要去看有效位是否为1,不过这一块内容不是考察的重点,我们就算不太能理解也没有关系,能把各部分的位数计算出来就行了。

  4. 内存映射表:很多教材上都不讲这一点,所以对同学们造成了概念上的迷惑,到底什么是地址映射表?一句话,地址映射表就是Cache中除了装数据部分的大小,要用标记位+特殊位得到,等会看一道题。

3)全相联和组相联

理解了上面的直接映射后,这两种就好理解多了。

  1. 全相联映射:给每一个行都设置一个比较器 ,根据tag字段按内容访问Cache中的主存块,对于硬件开销比较大,但是能解决直接映射的冲突问题。

    在这里插入图片描述

    我们需要记住的是主存地址结构:标记+块内地址 (最简单的一种,只有两部分)

  2. 组相联映射:组间采用直接映射,组内采用全相联映射。

    在这里插入图片描述

    1. Cache行数 = 组数 * 路数(每一组的大小是相等的,路数是指每一组有多少个Cache行,题目一般给出的也是k路组相联的信息,不要搞混了)
    2. 地址结构:标记+组号+块内
    3. 组号的计算方法和直接映射中Cache行号的计算思想是一样的,先求出主存块号,再对组数取模,后面直接来看例题就更清晰了。
    4. 当路数为1时,就变成一块一组,也就退化成直接映射方式,当路数为Cache行数时,所有块都变成了一组,也就变成了全相联映射。

以上内容,请好好理解吃透,特别是对于主存地址的三种划分映射结构,Cache的模型与概念,及计算公式,下面我们进入好题精析部分。

好题赏析

题目

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

讲解笔记

在这里插入图片描述
在这里插入图片描述
讲解视频跳转:30min带你狠狠拿捏Cache所有知识与题型方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2093205.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1分钟把高质量AI知识库站点嵌入小程序

许多企业都有把 AI 知识库装进小程序、网站、企业微信、钉钉等的需求,让用户能够在小程序上访问到高品质的内容。奈何有太多限制,往往会遇到IP地址不被信任或技术对接接口配置等困难。HelpLook能帮你节省这些繁琐的程序,0代码快速将AI知识库站…

工程师们都爱看的Docker容器技术,一看就会!保姆级教程(上)

文章目录 Docker简介Docker在企业中的应用场景Docker与虚拟化的对比Docker的优势 部署Docker部署DockerDocker的基本操作Docker镜像管理容器的常用操作 Docker镜像构建Docker镜像结构镜像运行的基本原理镜像获得方式镜像构建Docker镜像构建企业实例 镜像优化方案镜像优化策略镜…

一款免费强大的快速启动工具,快速打开程序,软件,网站,工具等

Lucy是一款由个人开发者针对个人需求开发的快速启动工具,其最大的特点在于简洁和快速。它允许用户通过简单的拖拽操作将文件、文件夹、网址等添加到启动列表中,实现快速访问常用程序和文件的目的。Lucy不依赖于网络连接,避免了隐私泄露的风险…

Xcode插件开发

Xcode插件开发 文章目录 Xcode插件开发一、插件开发流程创建插件Extension文件介绍文件说明 二、插件使用安装说明 一、插件开发流程 创建插件的过程并不复杂,只是官方教程,过于简单,所以这里补充下创建细节 创建插件 环境:Xco…

公安智慧大楼信息化整体建设设计方案

1. 项目背景与需求分析 《公安智慧大楼信息化整体建设设计方案》针对一个用地面积和建筑面积均具规模的建设项目,提出了信息化建设的全方位设计方案,以满足现代公安业务的需求。 2. 信息化设计理念 方案强调了信息化设计的顶层设计方法论,…

【Qt】窗口概述

Qt 窗口概述 Qt窗口是由QMianWindow类来实现的。 QMainWindow 是⼀个为⽤⼾提供主窗⼝程序的类,继承⾃ QWidget 类,并且提供了⼀个预定义的布局。QMainWindow 包含 ⼀个菜单栏(menu bar)、多个⼯具栏(tool bars)、多个浮动窗⼝&a…

基于Swagger自动生成离线API文档(Word、Markdown文档)

在做项目时通常需要给客户提供离线Word的API文档归档,不要跟客户说有Swagger在线API文档,客户不会用也不会去看。只要你有Swagger,TableGo就能自动生成一份漂亮的Word离线API文档给客户,大大提高了写文档的效率,客户看…

【0-1背包】3180. 执行操作可获得的最大总奖励 I

给你一个整数数组 rewardValues,长度为 n,代表奖励的值。 最初,你的总奖励 x 为 0,所有下标都是 未标记 的。你可以执行以下操作 任意次 : 从区间 [0, n - 1] 中选择一个 未标记 的下标 i。 如果 rewardValues[i] 大…

openwrt结合智能家居(相关搜索:路由器)

🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…

如何在华为平板上开发一个web网页

首先进入华为应用市场下载Qpython 下载完成后打开,在主页里面进入pip,然后下载flask 下载完成后创建一个Python文件,输入 然后运行,进入了Qpython终端后输入pyth,然后就可以开始开发web网页了。 请各位老手们多多指点

10:USB模块布局

1.先处理差分线 先开上方飞线: 发现有个晶体: ①晶体有随身电容,随身电阻 ②晶体布局思路: –电容和电阻放在ic和晶体之间 –整个晶体的部分靠近IC – 信号走向:IC—>电阻—>电容(左右两边摆)—>晶体 开右…

基于Pytorch框架的深度学习HRnet网络人像语义分割系统源码

第一步:准备数据 头发分割数据,总共有5711张图片,里面的像素值为0和1,所以看起来全部是黑的,不影响使用 第二步:搭建模型 计算机视觉领域有很多任务是位置敏感的,比如目标检测、语义分割、实例…

做影像组学+深度学习技术研究如何发表高分论文,案例解析

论文简介 标题:Longitudinal MRI-based fusion novel model predicts pathological complete response in breast cancer treated with neoadjuvant chemotherapy: a multicenter, retrospective study(纵向MRI结合新模型预测新辅助化疗乳腺癌的病理完全…

[C++进阶]map和set的相关题目

1. 下面关于map和set说法错误的是() A.map中存储的是键值对,set中只储存了key B.map和set查询的时间复杂度都是O(log_2N) C.map和set都重载了[]运算符 D.map和set底层都是使用红黑树实现的 解析: A:正确,map和set的概念…

python学习之路 - PySpark快速入门

目录 一、PySpark实战1、前言介绍2、基础准备a、pySpark库的安装b、构建pySpark执行环境入口对象c、pySpark编程模型 3、数据输入a、python数据容器转RDD对象b、读取文件内容转RDD对象 4、数据计算a、map算子b、flatMap算子c、reduceByKey算子d、综合案例e、filter算子f、disti…

数据可视化库(Matplotlib)

目录 常规绘图方法 细节设置 子图和标注 风格设置 常用图表绘制 盒图 直方图和散点图 3D图 布局设置 常规绘图方法 首先导入工具包,一般用plt来当作Matplotlib的别名: import matplotlib.pyplot as plt %matplotlib inline 指定魔法指令之后…

刚刚放出GPT-5上线时间,转身就一个限制,OpenAI你真行!

大家好,我是AI肝铁侠。 在6月23日,OpenAI 首席技术官米拉穆拉蒂 (Mira Murati) 表示,GPT-5 是 OpenAI 的下一代人工智能产品,预计将在 2025 年底或 2026 年初,实现博士级别的智能。 说实话OpenAI又把GPT5计划发布时间…

Leetcode面试经典150题-45.跳跃游戏II

解法都在代码里,不懂就留言或者私信,这个题绝对比动态规划的解法强 class Solution {/**本题我们先不用动态规划了,因为从任何一个位置都可能跳到最后一个位置,用动态规划的成本太高了本题的解题思路:看看某个步数内最…

Vue项目安装依赖(npm install)报错的解决

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

OLED模块

目录 一:OLED使用原理 硬件部分 SSD1306框图及引脚定义 选择通信接口 原理图 软件部分 4线SPI的传输时序 3线SPI的传输时序 I2C的通信时序 执行逻辑框图 二:基本命令表 滚动命令表 寻址设置命令表 硬件配置命令表 时间及驱动命令 初始化过…