Cache Lab:Part A【模拟出使用LRU策略的高速缓存存储器组织结构】

news2024/9/21 12:42:47

目录

任务描述

知识回顾

实验内容

测试结果


Cache Lab 对应《CS:APP》6.3节至第六章结束的内容。

任务描述

Your job for Part A is to fill in the csim.c file so that it takes the same command line arguments and produces the identical output as the reference simulator. Notice that this file is almost completely empty. You’ll need to write it from scratch.

A 部分的工作是填写 csim.c 文件,以便它采用相同的命令行参数并生成与参考模拟器相同的输出。请注意,此文件几乎完全为空。你需要从头开始编写它。

(有关参考模拟器:)

我们为您提供了引用缓存模拟器的二进制可执行文件,称为 csim-ref,用于模拟 valgrind 跟踪文件上具有任意大小和关联性的缓存的行为。在选择要逐出的缓存行时,它使用 LRU(最近最少使用的)替换策略。

知识回顾

1. 层次结构中每一层都是缓存,缓存下一层的数据块

2.块

        数据以块大小为传送单元,在相邻两层之间来回复制(不同的相邻两层间传送大小不同,远离CPU倾向于使用更大的块)

3. hit&miss&eviction

4.miss的三种类别

        cold miss(cold cache)

        冲突不命中:与严格的放置策略有关

        容量不命中:工作集比缓存大,也就是缓存太小

5.两类放置策略

        随机放置:靠近CPU的层使用该策略,完全用硬件实现

        更严格的放置策略:下一层的一些块被映射到上一层的同一个位置(类似于哈希,所以冲突miss产生了)

6. 缓存由谁来管理

        硬件

        硬件+软件

        软件

7. 高速缓存存储器

随着CPU和主存性能差距增大,设计者在二者之间加入了L1,L2,L3.本书假设只有L1.

高速缓存的结构可以用元组(S,E,B,m)来描述。

由E的不同分为3种:直接映射高速缓存、组相联高速缓存、全相联高速缓存。

8.三步:

        组选择

        行匹配/行替换

        字抽取

实验内容

注意:

1. 测试用例的地址是以16进制表示的,且是64位地址。

2. 使用getopt时,optarg这个变量不要自己定义。

3. 我用时间戳实现LRU算法,这个效率不是最优的。标准的LRU算法实现见我的这篇文章

4. L和S是不区分的,I是要被忽略的,M相当于L+S

5. 官方可以参考的资料中,尤其要细看15年的习题课PPT和该实验的write up的最后几页内容。

#include "cachelab.h"
#include <stdlib.h>
#include <stdbool.h>
#include <stdio.h>
#include <string.h>
#include <getopt.h>

struct block{
	int stamp; //LRU的时间戳
	bool valid;
	unsigned long long tag;
};

// 全局时间
int time = 0;

// 预存输出详细信息的字符串
char ** makeInfoString(void)
{
	char ** infoStr = (char **)malloc(sizeof(char *) * 3);
	infoStr[0] = "hit";
	infoStr[1] = "miss";
	infoStr[2] = "miss eviction";
	return infoStr;
}

// malloc二维数组
struct block ** createTable(int row, int col)
{
	struct block ** L = (struct block **)malloc(sizeof(struct block *) * row);
	for (int i=0; i<row; i++)
		L[i] = (struct block *)malloc(sizeof(struct block) * col);
	return L;
}

// 初始化刚刚malloc出来的二维数组
void initCache(struct block ** L, int row, int col)
{
	for (int i=0; i<row; i++)
		for (int j=0; j<col; j++)
		{
			L[i][j].valid = false;
			L[i][j].stamp = -1;
		}
	return;
}

int find(struct block ** L, unsigned long long addr, int S, int E, int B, int m, int b, int s)
{
	unsigned long long bias = addr & (B-1);
	unsigned long long index = (addr >> b) & (S - 1);
	unsigned long long tag = (addr & ~(S * B - 1)) >> (b + s);
	
	//printf("t = %llu\ts = %llu\tb = %llu\t\n",tag, index, bias);

	for (int j = 0; j < E; j++)
	{
		if (L[index][j].valid && L[index][j].tag == tag)
		{
			L[index][j].stamp = ++time;
			return 0; //hit
		}
	}
	
	for (int j = 0; j < E; j++)
	{
		if (!L[index][j].valid)
		{
			L[index][j].valid = true;
			L[index][j].stamp = ++time;
			L[index][j].tag = tag;
			return 1; //miss
		}
	}
	
	int min_time = 0;
	for (int j = 1; j < E; j++)
		if (L[index][j].stamp < L[index][min_time].stamp)
			min_time = j;

	L[index][min_time].stamp = ++time;
	L[index][min_time].tag = tag;
	return 2; //miss eviction
}

void solve(struct block **L, unsigned long long addr, char ** infoStr, 
		int * m_cnt, int * h_cnt, int * e_cnt, 
		int S, int E, int B, int m, int b, int s)
{
	int ans = find(L, addr, S, E, B, m, b, s);
	printf("%s", infoStr[ans]);
	
	if (ans == 0)
		(*h_cnt)++;
	else if (ans == 1)
		(*m_cnt)++;
	else 
	{
		(*m_cnt)++;
		(*e_cnt)++;
	}
	
}

int main(int argc, char *argv[])
{
	char ** infoStr = makeInfoString();

	int S, s, E, B, b, m = 64;
	bool verbose = false;
	char filename[100];
	
	int opt;
	// optarg不能在这里定义,否则就覆盖了getopt函数中所用的那个变量
	while ((opt = getopt(argc, argv, "vs:E:b:t:")) != -1)
	{
		switch (opt)
		{
			case 'v':
				verbose = true;
				break;
			case 's':
				s = atoi(optarg);
				S = 1 << s;
				break;
			case 'E':
				E = atoi(optarg);
				break;
			case 'b':
				b = atoi(optarg);
				B = 1 << b;
				break;
			case 't':
				strcpy(filename, optarg);
				break;
		}
	}
	printf("S = %d\ns = %d\nE = %d\nB = %d\nb = %d\nfilename = %s\n", S, s, E, B, b, filename);
	
	struct block ** L = createTable(S, B);
	initCache(L, S, B);
	
	// std IO
	FILE * fp = fopen(filename, "r");
	if (fp == NULL) exit(-1);
	
	//读一行
	char line[100];
	char op;
	unsigned long long addr;
	int size;
	
	int m_cnt = 0, h_cnt = 0, e_cnt = 0;
	
	while (fgets(line, 100, fp))
	{	
		// 忽略是I的行
		if (line[0] != ' ') continue;
		
		sscanf(line, " %c %llx,%d\n", &op, &addr, &size);
		
		line[strlen(line)-1] = '\0';
		printf("%s ", line);
		
		solve(L, addr, infoStr, &m_cnt, &h_cnt, &e_cnt, S, E, B, m, b, s);

		// 如果是M
		if (op == 'M')
		{
			printf(" hit");
			h_cnt++;
		}

		printf("\n");
	}
	printSummary(h_cnt, m_cnt, e_cnt);
	
	return 0;
}

测试结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1421848.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WAP在线封装APP工具:革新移动体验的技术

一、融合式设计&#xff1a;打破原生与网页应用的界限WAP封装App工具的最新版本已经能够实现无缝融合网页内容与原生应用功能。这些工具不仅仅是简单地将网页“包装”成APP&#xff0c;而是通过创新的融合式设计&#xff0c;让用户在使用过程中几乎感受不到两者之间的差异。例如…

Ruff应用:打破传统,IoT技术赋能工业制造数字化转型之路

近年来&#xff0c;随着物联网、大数据、云计算、5G等数字技术的快速应用&#xff0c;工业制造领域正在经历着前所未有的变革。工业4.0时代&#xff0c;各种数字技术与工业制造的结合&#xff0c;不仅提高了工业生产效率、降低运营成本&#xff0c;更是极大地推动了传统工业数字…

【深度学习每日小知识】Model Accuracy 模型准确率

Model Accuracy 模型准确率 模型准确性是衡量机器学习 (ML) 模型基于数据做出预测或决策的能力的指标。它是用于评估 ML 模型性能的常用指标&#xff0c;可用于比较不同模型的性能或评估特定模型对于给定任务的有效性。 有多种不同的方法来衡量模型的准确性&#xff0c;具体取…

Mac下手动源码编译安装Swig

使用Homebrew安装 这个方式最简单&#xff0c;但是一般都是安装的最新版&#xff1a; brew install swig如果按照特定版本&#xff0c;需要看一个当前支持的列表&#xff1a; brew search swig brew install swig3源码编译安装 swig依赖pcre库&#xff0c;需要先安装pcre …

Inventor 2024下载安装教程,免费使用,附安装包和工具,流程简单,小白也能轻松搞定

前言 Inventor是一款专业的三维可视化实体建模软件&#xff0c;Inventor.主要用于各类二维机械制图、三维制图的设计和开发等操作&#xff0c;可以广泛地应用于零件设计、钣金设计、装配设计等领域。 准备工作 1、Win7及以上系统 2、提前准备好 Inventor 2024 安装包 没有…

C# 多线程(2)——线程同步

目录 1 线程不安全2 线程同步方式2.1 简单的阻塞方法2.2 锁2.2.1 Lock使用2.2.2 互斥体Mutex2.2.3 信号量Semaphore2.2.3 轻量级信号量SemaphoreSlim2.2.4 读写锁ReaderWriterLockSlim 2.3 信号同步2.3.1 AutoResetEvent2.3.1.1 AutoResetEvent实现双向信号 2.3.2 ManualResetE…

H2数据库学习总结

H2数据库-简介 H2 是开源的轻量级Java数据库。它可以嵌入Java应用程序中或以客户端-服务器模式运行。 H2 数据库主要可以配置为作为内存数据库运行&#xff0c;这意味着数据将不会持久存储在磁盘上。 由于具有嵌入式数据库&#xff0c;因此它不用于生产开发&#xff0c;而主要…

【Java程序设计】【C00184】基于SSM的旅游网站管理系统(论文+PPT)

基于SSM的旅游网站管理系统&#xff08;论文PPT&#xff09; 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于ssm的旅游网站管理系统 本系统分为前台用户、后台管理员2个功能模块。 前台用户&#xff1a;当游客打开系统的网址后&#xff0c;首先看到的就是首…

Guava EventBus详解

概述 EventBus顾名思义&#xff0c;事件总线&#xff0c;是一个轻量级的发布-订阅模式的应用模式。相比于MQ更加简洁&#xff0c;轻量&#xff0c;它可以在一个小系统模块内部使用。 EventBus允许组件之间通过发布-订阅进行通信&#xff0c;而不需要组件之间显示的注册。它专门…

数据结构与算法教程,数据结构C语言版教程!(第六部分、数据结构树,树存储结构详解)七

第六部分、数据结构树&#xff0c;树存储结构详解 数据结构的树存储结构&#xff0c;常用于存储逻辑关系为 "一对多" 的数据。 树存储结构中&#xff0c;最常用的还是二叉树&#xff0c;本章就二叉树的存储结构、二叉树的前序、中序、后序以及层次遍历、线索二叉树、…

数据库之TiDB基础讲解

文章目录 1 TiDB1.1 引言1.2 TiDB介绍1.3 系统架构1.3.1 TIDB Server1.3.2 PD Server1.3.3 TIKV Server1.3.4 TiKV如何不丢失数据1.3.5 分布式事务支持 1.4 与MySQL的对比1.5 性能测试1.5.1 测试一1.5.2 系统测试报告 2 1 TiDB 1.1 引言 当我们使用 Mysql 数据库到达一定量级…

【python】图形化开发pyqt6基本写法模板与基础控件属性方法整理

pyqt6的简介 首先呢Python有许多可以编写图形化界面的库&#xff0c;我们通常跟着教程的话最初会接触的tkinter&#xff0c;但是学习中会发现编写的图形化跟我们平常接触的软件有很大区别&#xff08;简单来说就是丑&#xff09;。 pyqt则是第三方库&#xff0c;在Python中算…

如何快速记忆小鹤双拼键位图?

记忆方法&#xff1a;韵母表 图形 最常用字 韵母表&#xff1a;双拼的基础 图形&#xff1a;帮助新手快速联想回忆 最常用字&#xff1a;快速打字基础 一、单韵母&#xff08;紫色方块&#xff09; 一一对应如下表&#xff1a; 单韵母aoeiu、AOEIV 二、复韵母—箭矢型&am…

Netty源码三:NioEventLoop创建与run方法

1.入口 会调用到父类SingleThreadEventLoop的构造方法 2.SingleThreadEventLoop 继续调用父类SingleThreadEventExecutor的构造方法 3.SingleThreadEventExecutor 到这里完整的总结一下&#xff1a; 将线程执行器保存到每一个SingleThreadEventExcutor里面去创建了MpscQu…

Jenkins自动化打包

Jenkins自动化打包 下载安装 我们直接从官网https://www.jenkins.io/download/ 下载所需的Jenkins文件 如上图所示, 选择Windows版本,下面就是一路安装即可,需要注意的是,选择作为系统服务选项, 不要自己设置账号密码登录. Web配置 安装完根据提示在浏览器打开 http://lo…

详解SpringCloud微服务技术栈:深入ElasticSearch(1)——数据聚合

&#x1f468;‍&#x1f393;作者简介&#xff1a;一位大四、研0学生&#xff0c;正在努力准备大四暑假的实习 &#x1f30c;上期文章&#xff1a;详解SpringCloud微服务技术栈&#xff1a;ElasticSearch实战&#xff08;旅游类项目&#xff09; &#x1f4da;订阅专栏&#x…

【RT-DETR改进涨点】ResNet18、34、50、101等多个版本移植到ultralytics仓库(RT-DETR官方一比一移植)

👑欢迎大家订阅本专栏,一起学习RT-DETR👑 一、本文介绍 本文是本专栏的第一篇改进,我将RT-DETR官方版本中的ResNet18、ResNet34、ResNet50、ResNet101移植到ultralytics仓库,网上很多改进机制是将基础版本的也就是2015年发布的ResNet移植到ultralytics仓库中,但是其实…

【Emgu CV教程】6.6、图像平滑之GaussianBlur()高斯滤波

文章目录 一、介绍1.原理2.函数介绍 二、举例1.原始素材2.代码3.运行结果 一、介绍 1.原理 高斯滤波是Emgu CV里面最常用的滤波&#xff0c;因为它在平滑图像的同时&#xff0c;可以更好的保留轮廓和边缘信息。下面这段来自百度百科的介绍&#xff1a; 高斯滤波是一种线性平滑…

思腾合力深思系列「IW4230-4GR」可扩展处理器的多场景适配服务器

思腾合力深思系列IW4230-4GR&#xff0c;采用第四代Intel Xeon Eagle Stream可扩展处理器的多场景适配服务器&#xff0c;支持4张双宽GPU卡。 思腾合力深思系列IW4230-4GR GPU服务器/工作站支持双路第四代IntelXeon Eagle Stream系列可扩展处理器&#xff0c;具有高性能、高密度…

【史上最全的接口与抽象类】

Java异常处理与try-catch-finally 抽象类和接口是Java中用于实现抽象和多态的关键概念。 抽象类的定义和语法&#xff1a;接口的定义和语法&#xff1a;接口和抽象类的区别主要在以下几个方面&#xff1a; 抽象类和接口是Java中用于实现抽象和多态的关键概念。 抽象类的定义和…