计算机组成原理 — 存储器(2)

news2024/11/6 9:39:32

高速缓冲存储器

大家好呀!我是小笙,由于存储器这部分章节内容较多,我分成二部分进行总结,以下是第二部分,希望内容对你有所帮助!

概述

目的:避免CPU空等现象

原理:程序访问的局部性原理(指令和数据在主存地址分布不是随机的,而是相对的簇聚,也就是说程序大部分访问都是少数的指令和数据)

image-20230722101550637

Cache 工作原理

主存和缓存的编址

  • 主存和缓存按块存储,块的大小相同(B 就是块的大小)
  • Cache 内的块内地址不仅大小和主存一样,而且取值也是一样的
  • Cache 内的标记就是来记录主存的主存块号

image-20230722101645431

命中与未命中

缓存共有 C 块,主存共有 M 块(M >> C)

  • 命中:CPU 所要访问的数据已经从主存储器映射到了 Cache 缓存中(用标记建立起与主存的关系)
  • 未命中:CPU 所要访问的数据没有在 Cache 缓存中找到
  • 命中率 h:CPU欲访问的信息在 Cache 中的比率(与 Cache 的容量和块长有关)
  • 访问效率 e:tc / (h * tc + (1-h) * (tm + tc)) * 100% (区间:[tc / tm ,1]) (访问 Cache 的时间 tc ; 访问主存的时间 tm)

示例详解

假设 CPU 执行某段程序时,共访问 Cache 命中3000次,访问主存 20 次。已知 Cache的存取周期为50ns,主存的存取周期为200ns,求Cache-主存系统的命中率、访问效率和平均访问时间?

  • 命中率 = 命中 Cache 的次数 / 总次数 = 3000 / (3000+20)
  • 平均访问时间 = Cache的存取周期 * 命中率 + (1 - 命中率) * 主存的存取周期 = 50ns * h + (1-h) * 200ns
  • 访问效率 e = 访问 Cache 的时间 / 平均访问时间 * 100% = 50ns / 50ns * h + (1-h) * 200ns

Cache 的基本结构

Cache 的基本结构原理框图

CPU(通过地址总线)给出地址,这个地址包括**(主存)块号块内地址**。块内地址直接传给Cache,使用块号在主存Cache地址映像机构中确认是否命中。如果发生命中,得到Cache的块号;如果未命中,查看Cache中是否有空间可装入主存块。若有,访问主存装入Cache;若没有,启用Cache替换机构,根据替换算法,决定Cache中哪块可以被替换,然后访问主存替换Cache即可

它主要由Cache存储体、地址映射变换机构、Cache替换机构几大模块组成

  • Cache存储体

    Cache存储体以块为单位与主存交换信息,为加速Cache与主存之间的调动,主存大多采用多体结构,且Cache访存的优先级最高

  • 地址映射变换机构

    地址映射变换机构是将CPU送来的主存地址转换为Cache地址

  • Cache替换机构

    当Cache内容已满,无法接受来自主存块的信息时,就由Cache内的替换机构按一定的替换算法来确定应从Cache内移出哪个块返回主存,而把新的主存块调入Cache

  • Cache的读写操作

    • 读操作

      image-20240220124748964
    • 写操作

      • 写直达

        写操作数据既写入Cache 又写入主存;写操作时间就是访问主存的时间

      • 写回法

        写操作只把数据写入到 Cache 缓存而不写入主存;当 Cache 写入的数据要被替换的时候才写入主存

注意:Cache 对用户来说是透明的


Cache 的改进

Cache 的改进框图

image-20230722112226441

片内缓存:也称单一缓存,是指在CPU和主存之间只设一个缓存

  • 片内缓存与CPU之间的数据通路很短,大大提高了存取速度,外部总线又可更多地支持I/O设备与主存的信息传输,增强了系统的整体效率
  • 可是,由于片内缓存在芯片内,其容量不可能很大,这就可能致使CPU欲访问的信息不在缓存内,势必通过系统总线访问主存,访问次数多了,整机速度就会下降

片外缓存:也称二级缓存,由比主存动态RAM和ROM存取速度更快的静态RAM组成

统一缓存和分立缓存的选取主要考虑两个因素:

  • 与主存结构有关。如果计算机的主存是统一的(指令和数据存储在统一主存中),则相应的Cache采用统一缓存;如果主存采用指令、数据分开存储的方案,则相应的Cache采用分立缓存
  • 与指令执行的控制方式有关。当采用超前控制或流水线控制方式时,一般采用分立缓存(所谓超前控制,是指在当前指令执行过程尚未结束时就提前将下一条准备执行的指令取出)

Cache - 主存的地址映射

由主存地址映射到Cache地址称为地址映射。地址映射方式很多,有直接映射、全相联映射、组相联映射三种

直接映射

  • 每个缓存块 i 可以和若干个主存块对应
  • 每个主存块 j 只能和一个缓存块对应
image-20240220223000655

说明

  • 主存字块标记(区号):将主存分成 2 的 t 次方倍的 Cache 大小,也就是 t 的位数取决于 主存 / Cache 的大小

  • Cache 字块地址(块号):主存每个区都会对应字块 2 的 c 次方块数,Cache中也会有对应的块号与之一一对应,只要区号和块号都一致,就可以知道Cache中是否有该数据

    image-20230722132835714

优点:实现简单,只需利用主存地址的某些位直接判断,就可确定所需字块是否在缓存中

缺点:不够灵活,因每个内存块只能固定地对应某个缓存块,即使缓存内还空着许多位置也不能占用,使缓存的存储空间得不到充分的利用。此外,如果程序恰好要重复访问对应同一缓存位置的不同主存块,就要不停地进行替换,从而降低命中率

全相联映射

允许主存中每一字块映射到Cache中的任何一块位置上

image-20240220223725460

优点:灵活,命中率高,缩短了块冲突率。

缺点

  • 主存字块标记需要与Cache的所有标记进行同时比较,电路会非常复杂。
  • 主存字块标记从t位增加到t+c位,这就使Cache”标记“的位数增多,比较器的长度就会增长。

组相联映射

组相联映射是对直接映射和全相联映射的一种折中

i = j mod Q (某一主存块 j 按模 Q 映射到缓存的第 i 组中的任一块)

image-20240220224232200

说明:主存的字块号对应了 Cache 的组数,Cache 的组数决定可以主存相同块号同时放入 Cache 中的数量

优点

  1. 减少了冲突失效:与直接映射相比,组相联映射通过将主存块映射到一组而不是单一的缓存块,减少了因为多个频繁访问的内存块映射到同一个缓存块而产生的冲突失效(冲突失效是指不同的内存块需要映射到同一个缓存块)
  2. 简化了替换策略:由于一个组内有多个块可供选择替换,因此替换策略(如最少使用替换或随机替换)的实施比全相联映射简单,因为它只需在组内进行选择,而不是在整个缓存中进行选择
  3. 灵活性和适应性:组相联映射可以根据缓存的大小和设计,调整组的大小,从而提供更好的性能和适应性
  4. 成本适中:与全相联映射相比,组相联映射在硬件实现上的成本更低,因为它不需要在整个缓存中搜索可替换的块

缺点

  1. 硬件复杂性:尽管组相联映射的硬件复杂性低于全相联映射,但它仍然比直接映射复杂,因为它需要额外的硬件来识别和选择组内的缓存块
  2. 有限的并行度:组相联映射的并行度低于全相联映射,因为它仍然存在一定程度的冲突失效,这限制了并行访问缓存的能力

例题详集

例题 1:直接映射

假设有一个Cache,容量为16KB,块大小为4字节,使用直接映射技术。主存地址为32位。求:

  1. Cache中有多少个块?
  2. Cache的索引位数是多少?
  3. 主存中的一个特定地址0x0000A5F8会被映射到Cache的哪个块?

解答

  1. Cache的总块数 = Cache容量 / 块大小 = 16KB / 4B = 4096个块
  2. Cache的索引位数 = log2(总块数) = log2(4096) = 12位
  3. 对于直接映射,Cache的索引部分直接由主存地址的中间部分给出(忽略最低的块偏移量和最高的主存标记位)。假设Cache的起始地址为0,那么地址0x0000A5F8的索引部分是A5F8的后12位,即0xA5F8的最低12位,所以索引是0x5F8。这个索引值将指定Cache中的相应块

例题 2:组相联映射

假设有一个Cache,容量为32KB,块大小为8字节,使用2路组相联映射技术。主存地址为32位。求:

  1. Cache中有多少个块?
  2. Cache的组数是多少?
  3. 主存地址0x00012345会被映射到Cache的哪个组?

解答

  1. Cache的总块数 = Cache容量 / 块大小 = 32KB / 8B = 4096个块
  2. 由于是2路组相联映射,每个组包含2个块,所以组数 = 总块数 / 每组的块数 = 4096 / 2 = 2048组
  3. 对于组相联映射,Cache的索引位数 = log2(组数) = log2(2048) = 11位。地址0x00012345的索引部分是中间的11位,即0x12345的最低11位,所以索引是0x345。这个索引值将指定Cache中的相应组

例题 3:全相联映射

假设有一个Cache,容量为8KB,块大小为16字节,使用全相联映射技术。主存地址为32位。求:

  1. Cache中有多少个块?
  2. 主存地址0x00005678会被映射到Cache中的哪个块(假设使用最少使用替换策略)?

解答

  1. Cache的总块数 = Cache容量 / 块大小 = 8KB / 16B = 512个块
  2. 对于全相联映射,不需要索引位,因为Cache中的任何块都可以映射到任何一个地址。但是,替换策略(在这个例子中最少使用)决定了哪个块将被替换。地址0x00005678映射到Cache中的哪个块取决于当前的Cache状态和替换策略。全相联映射没有固定的映射规则,需要额外的硬件来跟踪每个块的使用情况

替换算法

先进先出(FIFO)算法

选择最早调入Cache的字块进行替换,它不需要记录各字块的使用情况

  • 优点:比较容易实现,开销小
  • 缺点:没有根据访存的局部性原理,故不能提高 Cache 的命中率

近期最少使用(LRU)算法

LRU算法比较好地利用访存局部性原理,替换出近期用得最少的字块。它需要随时记录 Cache中各字块的使用情况,以便确定哪个字块是近期最少使用的字块。

优点:它实际是一种推测的方法,比较复杂,一般采用简化的方法,只记录每个块最近一次使用的时间,LRU算法的平均命中率比FIFO的高

辅助存储器(了解)

概述

辅助存储器,也称为外部存储器或第二存储器,是计算机系统中用于长期存储大量数据和程序的设备,与主存储器(RAM)相对。辅助存储器不像主存储器那样直接由CPU访问,但其存储容量通常要大得多,而且数据在断电后仍然可以保持

image-20230722135011004

  • 记录密度:它决定了磁盘上可以存储多少数据位(磁带存储器则用位密度表示;磁盘沿半径方向单位长度的磁道数为道密度)
  • 存储容量:硬盘的存储容量主要由磁盘的数量、磁盘的尺寸以及存储密度决定
  • 平均寻址时间:包括寻道时间和等待时间。寻道时间是磁头移动到正确磁道的时间,等待时间是磁头等待所需数据旋转到磁头下方的时间
  • 数据传输速率:受限于磁盘的旋转速度和磁头的读写能力(记录密度 Db;记录介质的运动速度 V)
  • 误码率:通常与存储介质的品质、磁头的技术以及读写过程的准确性有关

磁记录原理

概述

磁记录原理是利用磁性的变化来存储和读取数据的技术。在磁记录中,信息被转换成电信号,这些电信号通过磁头产生变化的磁场,进而改变磁记录介质(如磁带或硬盘)上的磁化方向,以此来记录数据

本质就是利用磁体的南北极来对应二进制的 0 和 1

写入(记录)过程

  • 输入信息首先被转换成电信号
  • 这些电信号通过磁头线圈产生磁场
  • 当磁场强度足够大,能够克服磁介质的矫顽力时,磁介质表面会产生磁化区域
  • 磁化区域的方向(北极指向南极)代表二进制信息中的一个位(0或1)
image-20240221182502228

读取(再现)过程

  • 磁头移动到磁化区域上方,磁介质的磁化状态会影响磁头的磁场
  • 这种变化被转换成电信号,通过放大和处理,恢复成原始的输入信息
image-20240221182522647

总的来说,磁记录是一种成熟且广泛应用的存储技术,它通过改变磁性材料表面的磁化方向来存储和读取数字信息


硬磁盘存储器

概述

硬磁盘存储器是一种利用磁记录技术进行数据存储的辅助存储设备。它由一个或多个快速旋转的磁盘(盘片)组成,每个磁盘表面都涂有一层磁性材料。硬磁盘存储器通过磁头在磁盘表面读写数据,这些磁头悬浮在磁盘表面非常小的距离上,不会与磁盘表面直接接触

硬磁盘存储器的类型

  • 固定磁头和移动磁头

    image-20240221183158043
  • 可换盘和固定盘(可换盘片指盘片可以脱机保存;固定盘磁盘存储器是指磁盘不能从驱动器中取下,更换时要把整个头盘组合体一起更换)

硬磁盘储存器的结构

硬磁盘存储器由磁盘驱动器、磁盘控制器和盘片3大部分组成

image-20240221183435766
  • 磁盘驱动器:这是硬磁盘存储器的核心部件,负责控制磁头的移动以及磁盘的旋转。它通常包括磁头组件、盘片组件、电机和控制器等
  • 磁盘:磁盘是硬磁盘存储器的数据存储介质,通常由一个或多个铝或玻璃制成的盘片组成。每个盘片都涂有一层磁性材料,用于存储数据
  • 磁头:磁头是硬磁盘存储器中读取和写入数据的关键部件。它通常安装在磁头臂上,可以精确地移动到磁盘的指定位置进行读写操作
  • 硬盘控制器:硬盘控制器是硬盘存储器和计算机主板之间的接口,负责管理数据传输和磁盘操作。常见的硬盘控制器标准有IDE、SCSI、SATA等

磁盘驱动器

磁盘驱动器是主机外的一个独立装置,又称磁盘机,主要包括主轴、定位驱动及数据控制等3部分

image-20240221183604478

磁盘控制器

磁盘控制器通常制作成一块电路板,插在主机总线插槽中

作用:接收由主机发来的命令,将它转换成磁盘驱动器的控制命令,实现主机和驱动器之间的数据格式转换和数据传送,并控制驱动器的读/写

image-20240221183954078

磁盘控制器是主机与磁盘驱动器之间的接口

  • 接收主机发来的命令,转换成磁盘驱动器的控制命令
  • 实现主机和驱动器之间的数据格式转换
  • 控制磁盘驱动器读写

盘片

由硬质铝合金材料制成


软磁盘存储器

概述

软磁盘存储器与硬磁盘存储器的存储原理和记录方式是相同的,但在结构上有较大的区别

硬盘软盘
速度
磁头固定、活动(浮动)活动(接触盘片)
盘片固定盘、盘组大部分不可换可换盘片
价格
环境苛刻不苛刻

软盘片

是一种已经较为过时的存储介质,它由一个柔软的磁性圆盘封装在一个方形或圆形的保护套中。软盘片在个人电脑和计算机历史上曾广泛使用,但因其有限的存储容量和相对较慢的数据传输速度,已经被更高效的大容量存储设备所取代

软盘片的工作原理

软盘片的工作原理与硬磁盘驱动器类似,都是利用磁性材料记录数据。软盘片的数据存储在磁盘的磁性涂层上,通过改变磁性的方向来表示二进制数据(0和1)。读写数据时,软盘驱动器中的磁头会接触(或非常接近)磁盘表面的磁性涂层,进行数据的读取或写入。


光盘存储器

概述

是一种使用光学技术来读取和写入数据的存储设备。光盘存储器利用激光束在光盘表面形成的小凹槽(即“坑”)来存储信息。这些凹槽代表二进制数据,通过激光读取凹槽的反射差异来识别数据

  • 采用光存储技术 —- 利用激光写入和读出
  • 第一代光存储技术 —- 采用非磁性介质 — 不可擦写
  • 第二代光存储技术 —- 采用磁性介质 — 可擦写

光盘存储器的工作原理

  • 写入数据:在可写或可重写光盘上,激光束会加热光盘表面的特殊染料或相变材料,使其融化或改变相位,形成凹槽
  • 读取数据:读取数据时,激光束照射在光盘表面,当激光遇到凹槽时,反射率会发生变化,光传感器检测到这些变化并将其转换为电信号,进而解码为数字数据

光盘的存储原理

  • 只读型和只写一次型 — 热作用(物理或化学)
  • 可擦写光盘 — 热磁效应

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1472324.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于yolov2深度学习网络的火焰烟雾检测系统matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 MATLAB2022a 3.部分核心程序 .................................................................. load yolov2.mat% 加载…

【Docker】03 容器操作

文章目录 一、流转图二、基本操作2.1 查看本地容器进程2.2 启动容器2.2.1 交互式启动容器2.2.2 后台启动容器 2.3 进入容器2.4 停止启动重启容器2.5 退出容器2.6 删除容器2.7 提交容器(打包成镜像)2.8 拷贝文件2.8.1 拷贝容器内文件到宿主机2.8.2 拷贝宿…

机器学习理论知识学习

机器学习介绍 让机器有能力去根据数据学习 不是人类的if和else控制 机器学习分类 监督学习: 最成熟,落地案例最多。我们的视觉处理大多数都是监督学习。 小孩学习,类似监督学习,这是猫,这是狗,这是兔子 非监督学习:找到不同类型的数据,kmeans 聚类算法 帮助梳理不…

软考47-上午题-【数据库】-数据查询语言DQL2

一、聚合函数 聚合函数实现数据统计的功能,返回一个单一的值。聚合函数一般与select语句的group by子句一起使用。 示例: 二、数据分组-group by 聚合函数加上group by子句进行分组。 通常一个聚合函数的作用范围是满足where子句中指定条件的记录&…

【刷题】leetcode 1544.整理字符串

刷题 1544.整理字符串思路一(模拟栈速解版)思路二 (原地算法巧解版)思路三(C栈版) Thanks♪(・ω・)ノ谢谢阅读!!!下一篇文章见&#xff…

罗克韦尔AB的PLC实现ModbusTCP和ModbusRTU协议标签方式通讯

本文是通过IGT-DSER智能网关读写AB罗克韦尔Compact、Control系列PLC的标签数据缓存并转为Modbus从站协议,与上位机通讯的案例。 打开智能网关的参数软件(下载地址),通过功能->数据转发与平台对接,再选择数据转发与缓存’,进入以…

探索Allure Report:提升自动化测试效率的秘密武器!

一.使用 Allure2 运行方式-Python # --alluredir 参数生成测试报告。 # 在测试执行期间收集结果 pytest [测试用例/模块/包] --alluredir./result/ (—alluredir这个选项 用于指定存储测试结果的路径)# 生成在线的测试报告 allure serve ./result二.使用 Allure2 运行方式-Ja…

Elasticsearch 创建index库 timeout

问题概述 使用 python 客户端 代码进行创建,【之前成功创建,但是现在出现报错,报错代码es_connection.client.indices.create】def create_vector_index(dataset_index_name,vector_query_field,query_field):es_connection = get_collention(dataset_index_name,vector_que…

Linux调用可执行程序:system()函数和execl函数

system()函数: system()函数是一个在C/C编程语言中的库函数,用于在操作系统中执行命令。 函数声明如下: int system(const char *command);该函数接受一个指向以空字符结尾的字符串的指针作为参数,该字符串包含要执行的命令。函…

福特锐界2021plus 汽车保养手册

福特锐界2021plus汽车保养手册两页,零部件保养要求,电子版放这里方便查询:

2024.02.23作业

1. 尝试处理普通信号 #include "test.h"#define MAXSIZE 128void handler(int signo) {if (SIGINT signo){printf("用户按下了 ctrl c 键\n");} }int main(int argc, char const *argv[]) {if (signal(SIGINT, SIG_IGN) SIG_ERR){perror("signal …

【C++】---内存管理new和delete详解

一、C/C内存分布 C/C内存被分为6个区域: (1) 内核空间:存放内核代码和环境变量。 (2)栈区:向下增长(存放非静态局部变量,函数参数,返回值等等) …

帧同步原理

帧同步和状态同步区别 状态同步:发操作,收状态 帧同步:发操作,收操作 逻辑严格排序 经常会有需要排序的列表或者数组,比如攻击距离自己最近的敌人,这时候就需要将身边的敌人进行距离排序,一般…

在having、select子句中使用子查询

目录 在having子句中使用子查询 统计出部门平均工资高于公司平均工资的部门编号、平均工资、部门人数 在select子句中使用子查询 查询每个员工的编号、姓名、职位、部门名称 Oracle从入门到总裁:https://blog.csdn.net/weixin_67859959/article/details/135209645 在havin…

2024.2.26

1、实现信号灯集 sem.c #include<myhead.h>union semun {int val; /* Value for SETVAL */struct semid_ds *buf; /* Buffer for IPC_STAT, IPC_SET */unsigned short *array; /* Array for GETALL, SETALL */struct seminfo *__buf; /* Buffer …

备考2025年考研数学(一)真题练习和解析——填空题

今天距离2025年考研预计还有10个月的时间&#xff0c;看起来挺长&#xff0c;但是对于备考2025年考研的同学来说&#xff0c;必须用好每一天。为了帮助大家提升考研数学一的成绩&#xff0c;我收集整理了1987-2024年的考研数学一的真题和解析&#xff0c;并把2015-2024年十年的…

一个39岁程序员的自白,大龄程序员的出路在哪里?

一个39岁程序员的自白&#xff0c;大龄程序员的出路在哪里&#xff1f; 大龄程序员&#xff0c;最悲惨的&#xff0c;可能是但凡你发个贴&#xff0c;下面就会有类似这种人来怼你 本文来自知乎一个大龄程序员老哥&#xff08;白圣君&#xff09;的自白&#xff0c;涤生哥已经经…

现在骨传导耳机什么牌子最好?专业选购指南与避坑策略

近些年来&#xff0c;耳机行业飞速发展&#xff0c;耳机已经成为日常生活中不可或缺的伙伴&#xff0c;无论是休闲时刻还是运动健身&#xff0c;耳机都伴随着我们。然而长时间使用传统的入耳式耳机可能会导致听力受损、容易脱落和不卫生等问题。为了解决这些问题&#xff0c;满…

【GameFramework框架内置模块】3、数据表(Data Table)

推荐阅读 CSDN主页GitHub开源地址Unity3D插件分享简书地址 大家好&#xff0c;我是佛系工程师☆恬静的小魔龙☆&#xff0c;不定时更新Unity开发技巧&#xff0c;觉得有用记得一键三连哦。 一、前言 【GameFramework框架】系列教程目录&#xff1a; https://blog.csdn.net/q7…

3 easy 26. 删除有序数组中的重复项

双指针&#xff1a; //给你一个 非严格递增排列 的数组 nums &#xff0c;请你 原地 删除重复出现的元素&#xff0c;使每个元素 只出现一次 &#xff0c;返回删除后数组的新长度。元素的 相对顺序 应该保持 //一致 。然后返回 nums 中唯一元素的个数。 // // 考虑 nums 的唯…