MIT6.s081 2021 Lab Utilities

news2025/1/13 17:30:24

Boot xv6

按照示例切换到 util 分支后,看到目录下包含 Makefile 文件,执行 make qemu 即可。

sleep

思路

借助系统调用 sleep 实现一个命令行程序,关键是要找到封装了系统调用的 C 函数的位置,根据提示:

user/user.h for the C definition of sleep callable from a user program …

可知该函数的声明位于 user.h 头文件中,声明方式很简单:

int sleep(int);

将其“拷贝”(include)到需要编写的代码 user/sleep.c 中,调用 sleep(<睡眠时间>) 即可。

最后,按照提示,将编写的 sleep 代码添加到 Makefile 的 UPROGS 中,添加后如下所示:

UPROGS=\
    $U/_cat\
    $U/_echo\
    $U/_forktest\
    $U/_grep\
    $U/_init\
    $U/_kill\
    $U/_ln\
    $U/_ls\
    $U/_mkdir\
    $U/_rm\
    $U/_sh\
    $U/_stressfs\
    $U/_usertests\
    $U/_grind\
    $U/_wc\
    $U/_zombie\
    $U/_sleep\  # here

代码

// user/sleep.c

#include "kernel/types.h" // 注意先包含types.h
#include "user/user.h"    // 再包含user.h(user.h中存在在types.h中定义的别名)


int main(int argc, char* argv[]) {
    if (argc != 2) {
        fprintf(2, "sleep: argument count error\n");
        exit(1);
    }

    int time = atoi(argv[1]);
    sleep(time);

    exit(0);
}

pingpong

思路

本题主要是要理解管道的接口设计,以及借助该接口实现父进程与子进程之间的通信。这是 xv6 文档中对于 pipe 调用的描述:

int pipe(int p[]) // Create a pipe, put read/write file descriptors in p[0] and p[1].

pipe 创建一个管道,并分别将该管道的读、写端文件描述符置为 p[0]p[1],之后调用 fork 创建一个子进程,由于 fork 的作用是将父进程的数据直接拷贝给子进程,因此子进程同时继承了父进程的管道文件描述符,可以借助该文件描述符进行进程间通信(IPC),相当于借助一个共享文件进行通信,只不过该“文件”存储在内存的内核区域中,而不占用实际的磁盘存储空间。

利用管道解决本题的基本流程如下,首先需要创建两个管道 pa 和 pb,然后:

  1. 父进程向管道 pa 的写端写入 1 字节数据,然后关闭 pa 的写端。
  2. 子进程从管道 pa 的读端读取 1 字节数据,然后关闭 pa 的读端,打印信息,然后向管道 pb 的写端写入 1 字节数据,关闭 pb 的写端。
  3. 父进程从管道 pb 的读端读取 1 字节数据,关闭 pb 的读端,最后打印信息。

这里需要解释一下为什么需要两个管道,由于进程调度策略的影响,父进程和子进程的执行顺序并不确定。可能出现这样一种情况:在 fork 创建子进程后,父进程先被调度,将 1 字节数据写入管道,这时理想的情况是子进程被调度,然后读取父进程发送的数据,但是事实可能并不会如我们所愿,子进程可能一直得不到调度,父进程继续向下执行,从管道中读取自己刚刚发送的 1 字节的数据,这样子进程就无法收到父进程发送的数据,父子进程之间的通信也就失败了。

通过创建两个管道,并分别关闭对应的读端和写端,就能够得到两个单向数据流的管道,也就不会有上述自己写入的数据被被自己读取的情况出现。

代码

// user/pingpong.c

#include "kernel/types.h"
#include "user/user.h"


int main(int argc, char* argv[]) {
	char buf[2];

	int pa[2], pb[2];
	pipe(pa);
	pipe(pb);

	int pid = fork();
	if (pid == 0) {
		close(pa[1]);
		close(pb[0]);

		// phase_2
		read(pa[0], buf, 1);
		close(pa[0]);
		printf("%d: received ping\n", getpid());
		write(pb[1], "a", 1);
		close(pb[1]);
	}
	else if (pid > 0) {
		close(pa[0]);
		close(pb[1]);

		// phase_1
		write(pa[1], "a", 1);
		close(pa[1]);

		// phase_3
		read(pb[0], buf, 1);
		close(pb[0]);
		printf("%d: received pong\n", getpid());
	}
	else {
		fprintf(2, "pingpong: fork failed\n");
		exit(1);
	}

	exit(0);
}

primes

思路

实现一个基于管道的并发埃式筛(The sieve of Eratosthenes),关键是要理解管道的机制,以及仔细阅读题干给出的[文章](Bell Labs and CSP Threads (swtch.com)),该文章有关该埃式筛方法的介绍图片如下所示:

在这里插入图片描述

该算法的个人感觉十分精妙,以下是基本流程:

  1. 进程 0(主进程)发出一系列从 2 开始的整数序列。
  2. 进程 1 首先接收来自进程 0 发出的第一个整数 prime,prime 一定是一个质数,将其打印出来。然后继续按顺序接收来自进程 0 发出的其它整数,若接收到的某个整数能够被 prime 整除,则丢弃它(不做处理),否则将该整数发送给下一个进程。
  3. 后续进程的操作与进程 1 类似,直到没有任何整数发送给下一个进程,程序终止。

算法的思路并不复杂,主要问题在于如何使用管道实现上述流程中进程 i 与进程 i + 1 之间的通信。我这里只使用了一个 int[2] 来轮换地存放管道的文件描述符,并使用一个缓冲区来暂存每次要发送给下一个进程的数,在一个进程完成它所做的工作后,再将缓冲区中的数据批量写入管道,并创建子进程来完成接下来的工作。这里要千万注意管道完成读取或写入后及时关闭,否则可能会出现子进程读取管道时阻塞的情况。

我在写下这篇博客的过程中发现,虽然我使用的这个方法能够达到预期的效果,并成功通过测试用例,但是其实是有一定问题的:本方法的处理过程是串行的。事实上,每个进程都是在将本进程的所有工作全部完成之后,再调用 fork 来创建子进程,完成后续的工作,本质上与放在一个进程中完成所有工作并没有区别,与文章中提到的 “Concurrent” 完全相悖。理想的做法应该是创建一个 int[2] 数组来存放管道的文件描述符,并及时 fork 子进程来工作,以此来实现并发,具体的代码实现有待后续改进。

代码

// user/primes.c

#include "kernel/types.h"
#include "user/user.h"


int main(int argc, char* argv[]) {
	int p[2];
	pipe(p);

	int buf;
	int plist[35];

	for (int i = 2; i <= 35; ++i) {
		write(p[1], (char*)&i, 4);
	}
	close(p[1]);

	while (read(p[0], (char*)&buf, 4)) {
		int prime = buf;
		printf("prime %d\n", prime);

		int pcnt = 0;
		while (read(p[0], (char*)&buf, 4)) {
			if (buf % prime) {
				plist[pcnt++] = buf;
			}
		}
		close(p[0]);

		pipe(p); // rotating pipe

		for (int i = 0; i < pcnt; ++i) {
			write(p[1], (char*)(plist + i), 4);
		}
		close(p[1]);

		int pid = fork();
		if (pid == 0) {
			continue;
		}
		else if (pid > 0) {
			wait(0);
			exit(0);
		}
		else {
			fprintf(2, "primes: fork error\n");
			exit(1);
		}

	}

	exit(0);
}

find

思路

本题是这个 Lab 中我花费时间最长的,代码思路虽然不算很复杂,但是有很多的细节问题我在写的时候没有考虑到,感觉 debug 时间差不多是 coding 的几倍了。。。

题目要求实现一个简易的 find 命令,根据提示可以参考 user/ls.c 对目录的读取操作,并使用递归来实现对子目录的查找。基本思路就是打开一个指定路径的文件(目录也算是特殊的文件),并根据文件的类型做不同处理:

  1. 如果文件是常规文件,则判断改文件名是否是目标文件名(find 的第二个参数),如果是,则将其完整路径打印至标准输出。
  2. 如果文件是目录文件,则读取该目录下的所有文件名,并在该目录路径尾部加上 /st.name,依次构造一个新的文件名继续递归调用 find。注意不要递归进入 ...,否则将导致无限递归。

以上便是基本思路,具体实现可以阅读完整代码,下面讲一下我遇到的一些问题(bug):

  1. 使用 fstat 获取文件信息时 st.type 始终为 3(T_DEVICE 类型)。

这个问题其实挺难绷的,原因是我把 if ((fd = open(path, 0)) < 0) 写成了 if ((fd = open(path, 0) < 0)),因为 < 的优先级大于 =,所以导致 fd 的值始终为 0 或 1(逻辑表达式的值只能为真或假),那么后续产生意想不到的结果也就不意外了。。。

  1. 出现 find: cannot open file ./sh ,之后所有文件均打开失败

在打印出文件描述符的值后,问题的起因比较明显了。

在这里插入图片描述

文件描述符一直在增大,最终文件打开失败,open 返回 -1。很明显,是因为文件在打开后没有及时关闭,并释放文件描述符,最终文件描述符被全部占用,新的文件无法再被打开。这也解释了既然程序退出后,所有打开的文件会自动关闭,为什么还要建议手动关闭文件的问题。

  1. 读取到空文件名

前面的问题解决之后,我发现程序仍然会出现无限递归搜索的情况(如下图所示),按理说我已经对文件名进行了判断,如果是 . 或者 .. 则不做处理。

在这里插入图片描述

尝试打印文件名之后,我发现目录的最后一个文件名为空,这样的空文件名将导致程序不断往其末尾追加斜杠 / 而并没有递归进入该目录中。

在这里插入图片描述

事实上,使用 read 读取目录时,在读取目录的所有条目之后,会返回一个空的 dirent 结构体,此时 de.name 为空,作为循环结束的标志。其实 user/ls.c 有针对这个特性的判断,不过当时 coding 的时候没有细看。所以正如 Lab guidance 中所说:

Only when you have a firm grasp of the assignment and solution, then start coding.

代码

// user/find.c

#include "kernel/types.h"
#include "kernel/stat.h"
#include "kernel/fs.h"
#include "user/user.h"


char* file_name(char* path) {
	char* p;

	for (p = path + strlen(path); p >= path && *p != '/'; --p);
	++p;

	return p;
}

void find(char* path, char* target) {
	int fd;
	struct dirent de;
	struct stat st;
	char buf[512];
	char* name, * p;

	if ((fd = open(path, 0)) < 0) {
		fprintf(2, "find: cannot open file %s\n", path);
		return;
	}

	if (fstat(fd, &st) < 0) {
		fprintf(2, "find: cannot stat file %s\n", path);
		close(fd);
		return;
	}

	switch (st.type) {
	case T_FILE:
		name = file_name(path);
		if (!strcmp(name, target)) {
			printf("%s\n", path);
		}
		break;
	case T_DIR:
		while (read(fd, &de, sizeof(de)) == sizeof(de)) {
			// prevent infinite recursion
			if (!de.inum || !strcmp(de.name, ".") || !strcmp(de.name, "..")) {
				continue;
			}

			// generate path of sub directory
			strcpy(buf, path);
			p = buf + strlen(buf);
			*p++ = '/';
			memmove(p, de.name, DIRSIZ);
			p[DIRSIZ] = 0;

			find(buf, target);
		}
		break;
	default:
		break;
	}

	close(fd);
}

int main(int argc, char* argv[]) {
	if (argc != 3) {
		fprintf(2, "find: argument count error\n");
		exit(1);
	}

	find(argv[1], argv[2]);

	exit(0);
}

xargs

思路

相较于 findxargs 的实现就简单很多了。由于之前自己实现过一个简单的 shell,因此对于 exec 系统调用还算比较熟悉,本题的主要内容就是根据 argv 和标准输入构造一个新的参数列表,作为指定命令行程序的参数,并使用 exec 来进行调用。

程序的流程比较简单,这里不过多介绍,直接查看完整代码即可。

代码

// user/xargs.c

#include "kernel/types.h"
#include "user/user.h"
#include "kernel/param.h"


int main(int argc, char* argv[]) {
	int i;
	char buf[512];
	char* nargv[MAXARG];

	while (gets(buf, MAXARG)) {
		buf[strlen(buf) - 1] = 0; // remove last '\n'

		for (i = 1; argv[i]; ++i) {
			nargv[i - 1] = argv[i];
		}

		nargv[i - 1] = buf;
		nargv[i] = 0;

		int pid = fork();
		if (pid == 0) {
			exec(argv[1], nargv);
		}
		else if (pid > 0) {
			wait(0);
		}
		else {
			fprintf(2, "xargs: fork error\n");
			exit(1);
		}
	}

	exit(0);
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1858317.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试--花了我一周时间整理各种测试模板

2024软件测试面试刷题&#xff0c;这个小程序&#xff08;永久刷题&#xff09;&#xff0c;靠它快速找到工作了&#xff01;&#xff08;刷题APP的天花板&#xff09;-CSDN博客跳槽涨薪的朋友们有福了&#xff0c;今天给大家推荐一个软件测试面试的刷题小程序。https://blog.c…

北邮《计算机网络》MAC子层笔记

文章目录 缩写复习MAC层所在层次动态分配信道算法们的简要介绍信道的五条基本假设多路访问的协议&#xff08;理论上的协议&#xff09;aloha协议CSMA协议其他冲突避免协议无线局域网协议 &#xff0c;MACA 以太网协议802.3&#xff08;实际协议&#xff0c;刚刚是理论&#xf…

光猫BOB 功率调测误差分析与校验指南

DDM&#xff08;Digital Diagnostic Monitoring&#xff09;数字诊断监控技术&#xff0c;是光模块中使用的技术&#xff0c;以便用户能够监控光模块的实时参数。这些参数包括工作温度、工作电压、工作电流、发射和接收光功率等&#xff0c;还可以显示模块的常规波长、速率、传…

在Vue表单中设置缺省值

有个需求&#xff0c;在新增记录的时候&#xff0c;打开新增页面&#xff0c;员工姓名处获取到当前登录用户的用户名&#xff0c;并将其设置为缺省值。 /** 新增按钮操作 */handleAdd() {this.reset();this.open true;// this.form.employeeName this.$store.state.user.name…

计算机网络 DHCP以及防护

一、理论知识 1.DHCP&#xff1a;用于在网络中自动分配IP地址及其他网络参数&#xff08;如DNS、默认网关&#xff09;给客户端设备。 2.VLAN&#xff1a;逻辑上的局域网分段&#xff0c;用于隔离和管理不同的网络流量。 3.DHCP地址池&#xff1a;为每个VLAN配置不同的DHCP地…

【语义分割系列】基于cityscape的DDRNet算法

基于cityscape的DDRNet算法 前言 DDRNet是专门为实时语义分割设计的高效主干。该模型由两个深度分支组成,在这两个分支之间执行多次双边融合,并且还设计了一个新的上下文信息抽取器,名为深度聚合金字塔池模块(DAPPM),用于扩大有效的接受域,并基于低分辨率特征映射融合…

QT在VS环境中使用,控件显示中文乱码解决方法

首先来看乱码显示的效果如下&#xff1a; 上图左侧显示内容为中文&#xff0c;控件对应代码如下&#xff1a; QLabel* UserNameLabel new QLabel(QString("用户名&#xff1a;")); QLabel* NameLabel new QLabel(tr("姓名&#xff1a;"));下面我们对QL…

【Spine学习15】变换约束

变换约束&#xff1a;能让一个骨骼受另一个骨骼的变化影响。 1、选择m创建一个变换约束&#xff1a; 2、点击这个约束&#xff0c; 将移动数值拉的越满&#xff0c;m越接近s骨骼 当约束为0也就是默认的时候&#xff0c;m骨骼将不会受影响&#xff0c;变换约束可有可无。 tips…

物联网系统运维——实验备份与恢复,数据镜像软件DRBD介绍,DRBD的安装和应用,extundelete的安装和应用(重点),环境准备,配置设置

一.数据备份 1.数据备份的重要性 备份是系统中需要考虑的最重要的事项,虽然这在系统的整个规划,开发和测试过程中甚至占不到1%,看似不太重要且默默无闻的工作只有到恢复的时候才能真正体现出其重要性,任何数据的丢失与数据宕机&#xff0c;都是不可以被接收的。 2.数据备份策…

数据结构与算法笔记:高级篇 - 最短路径:地图软件是如何计算出最优出行路径的?

概述 基础篇的时候&#xff0c;我们学习了图的两种搜索算法&#xff0c;深度优先搜索和广度优先搜索。这两种算法主要是针对无权图的搜索算法。针对有权图&#xff0c;也就是图中的每一条变都有一个权重&#xff0c;我们该如何计算两点之间的最短路径&#xff08;经过的边的权…

ViT:3 Compact Architecture

大模型技术论文不断&#xff0c;每个月总会新增上千篇。本专栏精选论文重点解读&#xff0c;主题还是围绕着行业实践和工程量产。若在某个环节出现卡点&#xff0c;可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技&#xff08;Mamba,xLSTM,KAN&#xff09;则…

VMware共享文件夹设置

1、VMWare设置 1&#xff09;虚拟机 -> 设置 2&#xff09;点击 选项 -> 共享文件夹 -> 设置为 总是启用 -> 并 添加一个本地共享文件夹。设置完毕&#xff0c;点击 确定。 2、创建共享文件夹、挂载 1&#xff09;打开终端&#xff0c;在mnt/目录下创建一个名为…

原Veritas(华睿泰)中国研发中心敏捷教练、项目集经理郑鹤琳受邀为第十三届中国PMO大会演讲嘉宾

全国PMO专业人士年度盛会 原Veritas&#xff08;华睿泰中国&#xff09;中国研发中心敏捷教练、项目集经理郑鹤琳女士受邀为PMO评论主办的2024第十三届中国PMO大会演讲嘉宾&#xff0c;演讲议题为“敏捷项目管理-知行合一”。大会将于6月29-30日在北京举办&#xff0c;敬请关注…

So:万法皆空,唯因果不空

在《long long ago》中&#xff0c;我们说到long一词中藏着因果关系&#xff0c;long通汉字“以”字。long是生育过程中&#xff0c;婴儿已经呱呱坠地&#xff0c;但尚未剪掉脐带的形象。 下面我们来解剖另一个英语单词&#xff1a;so。 一、so&#xff1a;万法皆空&#xff…

前端vue-cli相关知识与搭建过程(项目创建,组件路由)very 详细

一.关于vue-cli 1.什么是vue Vue (读音 /vju ː /&#xff0c;类似于 view) 是一套用于构建用户界面的渐进式框架。Vue 的核心库只关注视图层&#xff0c;不仅易于上手&#xff0c;还便于与第三方库或既有项目整合。 Vue.js 是前端的主流框架之一&#xff0c;和 Angular.js…

【大数据】Hadoop学习笔记

基本概念 Hadoop组成 HDFS: Hadoop分布式文件存储系统, 在Haddop中处于底层/核心地位YARN: 分布式通用的集群资源管理系统和任务调度平台, 支撑各种计算引擎执行MapReduce: 第一代分布式计算引擎, 但因为部分原因, 许多企业都不直接使用MapReduce, 但许多底层软件仍然在使用Ma…

v-jstools插件 - 自动补环境

一、为啥要补环境&#xff1f; 我们每次逆向扣完代码存放在 nodejs 上是运行不出结果的&#xff0c;因为缺少浏览器环境特有的一些 window/document/navigator/localstorage 等参数&#xff0c;所以我们需要把这些缺少的浏览器环境补上&#xff0c;让这份js代码在本地nodejs环…

无人机巡检小羊仿真

详细视频地址 仿真效果 可视化三维仿真 gazebo物理仿真 px4 飞控仿真 仿qgc简易地面站 详细视频地址

每日一题——Python代码实现PAT甲级1059 Prime Factors(举一反三+思想解读+逐步优化)五千字好文

一个认为一切根源都是“自己不够强”的INTJ 个人主页&#xff1a;用哲学编程-CSDN博客专栏&#xff1a;每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 我的写法 代码点评 时间复杂度分析 空间复杂度分析 改进建议 我要更强 时间复杂度…

渗透测试基础(六) MS10-046漏洞攻击

1. 漏洞介绍 1.1 漏洞介绍 Microsoft Windows快捷方式LNK文件自动执行代码漏洞。Windows支持使用快捷方式或LNK文件。LNK文件是指向本地文件的引用,点击LNK文件与点击快捷方式所制定的目标具有相同效果。Windows没有正确的处理LNK文件,特制的LNK文件可能导致Windows自动执行…