【Linux】教你用进程替换制作一个简单的Shell解释器

news2025/1/22 15:44:59

本章的代码可以访问这里获取。

由于程序代码是一体的,本章在分开讲解各部分的实现时,代码可能有些跳跃,建议在讲解各部分实现后看一下源代码方便理解程序。

制作一个简单的Shell解释器

  • 一、观察Shell的运行状态
  • 二、简单的Shell解释器制作原理
    • 1、获取命令行
    • 2、解析命令行
    • 3、创建子进程 进行程序替换 父进程等待
    • 4、实际运行
  • 二、对简单的内建命令进行处理
    • 1、给ls命令加上色彩
    • 2、支持cd命令
    • 3、支持export命令
    • 4、支持env命令
    • 5、支持echo命令


一、观察Shell的运行状态

我们想要制作一个简单的Shell解释器,需要先观察Shell是怎么运行的,根据Shell的运行状态我们再去进行模拟实现。

我们可以先考虑下面的指令与Shell的互动:

在这里插入图片描述

我们仔细进行分析可以发现,Shell执行上面的命令时,可以被理解为下面的过程。

在这里插入图片描述
当然上面的命令都是普通命令,所以Shell都是通过创建子进程的方式来执行的,对于一些内建命令(Shell自己去执行命令)我们现在还不考虑,在后面的部分我们再进行进一步的讨论内建命令应该怎么去处理。

二、简单的Shell解释器制作原理

通过观察Shell的运行状态,我们知道然后Shell读取新的一行输入,建立一个新的子进程,在这个子进程中运行程序并等待这个进程结束。

所以要写一个shell,需要循环以下过程:

  1. 获取命令行
  2. 解析命令行
  3. 建立一个子进程(fork
  4. 替换子进程(execvp),执行替换后的程序
  5. 父进程等待子进程退出(wait

1、获取命令行

我们在在Shell中输入的命令本质上就是输入一个字符串,因此我们想要获取命令行,可以先创建一个字符数组commandstr,然后使用C语言的fgets函数从键盘中进行读取数据到字符数组里面,这样我们就获取了一个命令行了。

注意:

  1. 这里不能使用scanf函数 ,这里的命令会包含空格会导致scanf读取不到完整的数据。
  2. fgets函数会将我们输入的命令时的最后一个的\n符也给读取到字符数组内,我们需要特殊处理将\n进行用\0进行覆盖
//这里包含的头文件是我们整个程序需要用到的所有头文件
#include<stdio.h>
#include<unistd.h>
#include<assert.h>
#include<string.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<stdlib.h>

//这里的N用于定义字符数组的大小
#define N 128

int main()
{
  //存储命令行的字符数组
  char commandstr[N] = "";
  
  //Shell要一直运行接受命令,所以这里必须是死循环!
  while(1)
  {
  	//模拟Shell的提示符
    printf("[hong@machine MiniShell]# ");

    //从标准输入流中读取字符串
    char* s = fgets(commandstr, sizeof(commandstr), stdin);
    assert(s); //判断fgets是否读取成功


    //处理\n   示例字符串:ls -a -l\n\0
    commandstr[strlen(commandstr) - 1] = '\0';
   }
  

2、解析命令行

虽然我们通过前一步已经拿到命令行,但是我们还不能直接使用,因为我们拿到的字符串中间可能有许多空格以及一些其他的问题,我们还需要将命令行的字符进行切割提取出我们想要的子串,这样才符合程序替换函数的要求。例如:将 ls -a -l提取成 ls ,-a , -l

对于字符串的切割,我们可以使用C语言提供的strtok函数,由于切割以后我们的字符串从一个变成了多个,因此我们需要用一个字符串指针数组argv,存储每一部分切割后的首地址,同时这个argv也可以直接传递给execvp函数进行程序替换了。

//在全局域中 定义切割符
#define SEP " "

//main函数的外部 定义一个命令行切割函数
int split(char commandstr[], char* argv[])
{
  assert(commandstr);
  assert(argv);
  
  //第一次切割
  argv[0] = strtok(commandstr, SEP);
  if(argv[0] == NULL)
  {
  	//返回 -1表示异常退出
    return -1; 
  }

  //循环切割
  int i = 1;
  while((argv[i++] = strtok(NULL, SEP)));
  return 0;
}

//main函数内部,while循环上面定义切割后的字符指针数组
char* argv[N] ={NULL};


//while循环内部

	//切割字符串  例如将"ls -a -l " 变为 "ls" "-a" "-l"
    int n = split(commandstr, argv);
    if(n == -1)
    {
      //切割失败就终止本次循环
      continue;
    }

在这里插入图片描述

3、创建子进程 进行程序替换 父进程等待

创建子进程而我们可以使用fork函数进行创建,创建完以后进程的执行流由一个变成了两个,我们在子进程中进行程序替换可以使用execvp命令,同时我们的argv[0]就是程序名,argv中存储的就是命令按照什么方式进行执行。

最后我们的父进程可以在外面进行阻塞等待,然后获取子进程的退出码和退出信息。

//main函数内部,while循环上面定义退出码变量
 int last_status = 0;
 
//while循环内部

//创建子进程,进行命令处理
    pid_t id = fork();
    assert(id >= 0);

    if(id == 0)
    {
      //child process
      execvp(argv[0], argv);  
      //如果执行到这里说明程序替换失败  
      exit(-1);
    }
	
	//父进程等待子进程
    int status;
    int pid = waitpid(id, &status, 0); 
    //等待成功就提取退出码信息
    if(pid >= 0)
    {
      last_status = WEXITSTATUS(status);
    }
  }
  return 0;

4、实际运行

我们可以执行 ls pwd ps -axj命令 看一看效果。
在这里插入图片描述

二、对简单的内建命令进行处理

我们知道内建命令是让Shell自己执行的命令,而不是让子进程执行的命令,例如cd命令就是内建命令,因为我们要改变的是Shell自己的工作目录,而不是子进程的工作目录,类似的命令还有export env echo命令。

由于上面我们写的程序执行命令时都是交给子进程去做的,所以我们上面写的程序是没有办法执行内建命令的,或者说能执行内建命令,但不是我们想要的结果或目的。

所以接下来我们要对这个简单的Shell进行改造,让它能够执行一些简单的内建命令,还有刚刚我们的ls命令没有色彩,我们也要进行一些修改。

1、给ls命令加上色彩

在真正的Shell中我们执行的ls命令其实是ls --color=autols被我们真正的Shell进行了起别名。

在这里插入图片描述
我们在运行我们自己制作的Shell时也可以加上--color=auto

//此段代码应该在切割字符串之后

//argv[0]就是我们的命令名
if(strcmp(argv[0], "ls") == 0)
    {
      int pos = 0;
      //寻找指针数组的结尾
      while(argv[pos++]);
      //在NULL位置加上 --color=auto
      argv[pos - 1] = "--color=auto";
      //将后一个位置置空
      argv[pos] = NULL;
    }

这样以后我们在我们自己制作的Shell中执行ls命令时也会由颜色了!

2、支持cd命令

对于cd命令如果让父进程进行执行,我们可以调用系统调用chdir我们只需要传递一个参数:路径字符串,当执行成功时会返回0,执行失败会返回-1,并设置错误码。

在这里插入图片描述

//此段代码应该在ls添加颜色之后

else if(strcmp(argv[0], "cd") == 0)
    {
      //argv[1]里面存放的是路径字符串
      if(argv[1] == NULL)
      {
        printf("没有正确的路径!\n");
        //设置错误码
        last_status = -1;
        continue;
      }
      	//执行系统调用改变父进程的工作目录
        chdir(argv[1]);
        continue;
    }

3、支持export命令

export命令可以将一个本地变量加入到环境变量表中,我们让我们自己制作的Shell完成expoprt命令可以用C语言提供的函数putenv函数,但是在向环境变量表加入新的环境变量时,我们要维护好我们加入到环境变量,这个环境变量不能够被轻易的覆盖,否则环境变量表在找我们的环境变量时就会找不到,所以我们还要创建一个我们自己维护的二维数组。

//在全局域中定义
// 自己维护的二维数组最多能向环境变量表几个自定义的环境变量
#define MAX 64

//main函数内部,while循环上面定义
//指向下一个要添加的环境变量的位置
 int env_index = 0;
//要维护的二维数组
 char envstr[MAX][N];

//此段代码应该在ls添加颜色之后
 else if(strcmp(argv[0], "export") == 0)
    {
    //声明putenv函数否则会编译器会有警告
      extern int putenv(char *string); 
      //argv[1]位置应该是环境变量
      if(argv[1] == NULL)
      {
        printf("没有输入变量!\n");
        last_status = -1;
        continue;
      }
      //将argv[1]位置的环境变量,拷贝到env_str中,否则下一次解析的命令会覆盖环境变量
      strcpy(envstr[env_index], argv[1]);
      //将环境变量导入环境变量表
      putenv(envstr[env_index++]);
    }

4、支持env命令

对于env命令我们只需要写一个打印环境变量表的函数就能完成此命令了。

//main函数的外部 定义一个打印环境变量表的函数

void showEnv()
{
  extern char** environ;
  int i = 0;
  while(environ[i])
  {
    printf("%d : %s\n", i, environ[i++]);
  }
}

//此段代码应该在ls添加颜色之后
 else if(strcmp(argv[0], "env") == 0)
    {
      showEnv();
      continue;
    }

5、支持echo命令

echo命令可以用于打印环境变量,也可以打印退出码,这取决于$后面是不是??我们就可以打印last_status,不是我们就用getenv命令拿到环境变量的内容。

//此段代码应该在ls添加颜色之后
else if(strcmp(argv[0], "echo") == 0)
    {
      if(*argv[1] == '$')
      {
        if(*(argv[1] + 1) == '?')
        {
          printf("process exit code %d\n", last_status);
          continue;
        }
        else
        {
          char* str = getenv(argv[1] + 1);
          printf("%s\n",str);
          continue;
        }
      }
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/479762.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python+Yolov8+Deepsort入口人流量统计

程序示例精选 PythonYolov8Deepsort入口人流量统计 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对<<PythonYolov8Deepsort入口人流量统计>>编写代码&#xff0c;代码整洁&#x…

[java]云HIS运维运营分系统功能实现(springboot框架)

运维运营分系统 一级菜单包括&#xff1a;系统运维、综合监管、系统运营 系统运维包括二级菜单&#xff1a;环境管理、应用管理、菜单管理、接口管理、任务管理、配置管理 综合监管包括二级菜单&#xff1a;综合监管 系统运营包括二级菜单&#xff1a;机构管理、药品目录管…

计算机组成原理4.2.3提高存储器访问速度的措施

提高存储器访问层次大概有三种方法 采用高速器件 采用层次结构 Cache 主存 调整主存结构 调整存储结构 单体多字系统 利用程序局部性原理&#xff0c;访问一个块 相邻的若干块都会被拿出来&#xff0c;缺点可能会碰到跳转类指令 多体并行系统 高位是体号&#xff0c;低位时地…

手动搭建高可用的 kubernetes 集群(v1.16.6)

手动搭建高可用的 kubernetes 集群(v1.16.6) 目录 手动搭建高可用的 kubernetes 集群(v1.16.6) 1、组件版本和配置策略 1.1 主要组件版本1.2 主要配置策略2、初始化系统和全局变量 2.1 集群规划2.2 初始化系统环境 2.2.1 关闭防火墙2.2.2 关闭 swap 分区2.2.3 关闭 SELinux2.2.…

【网络技术】什么是CNI

序言 你只管努力&#xff0c;其他交给时间&#xff0c;时间会证明一切。 Never look back unless you are planning to go that way. 文章标记颜色说明&#xff1a; 黄色&#xff1a;重要标题红色&#xff1a;用来标记结论绿色&#xff1a;用来标记一级论点蓝色&#xff1a;用…

2023年第十五届华中杯赛题A题详细版思路 新型镇静药物临床实验疗效分析与预测

2023年五一假期期间&#xff0c;数学建模竞赛就有四场&#xff0c;各种比赛各种需求应接不暇。因此&#xff0c;对于本次浅析有不足的地方欢迎大家指出。为了更好的帮助大家华中杯参赛&#xff0c;下面带来&#xff0c;A题详细版思路 问题一&#xff0c;差异性分析 文字分析&a…

JAVA基于Springboot框架的停车场管理系统开发实践和实现【附源码】

运行环境: jdk1.8idea/eclipsemaven3mysql5.6 项目技术: Java,Springboot,mybatis,mysql,jquery,html 该系统为停车场管理人员提供了对停车场中车辆&#xff0c;车位和财务的管理。操作员可以灵活地使用相关权限开展工作。在车位管理&#xff0c;车辆的停放和驶离、缴费&a…

理解Hopcroft DFA最小化算法

问题引入 在构造编译器的Scanner时&#xff0c;常见的解决方法是使用自动机技术。从文法构造出的DFA的状态数过多会影响编译器的性能。DFA中有一些状态本质上是等价的&#xff0c;我们需要一种自动化算法用于最小化DFA。 算法介绍 常见的DFA最小化算法有三种&#xff0c;分别…

栈和队列的转换

在之前的博客当中我们已经学习了栈和队列。在本次的博客当中我们就来学习一下怎么将栈和队列进行相互转换。 栈和队列的相互转换其实是两道OJ题。如果在leetcode上面刷过题的小伙伴们可能早就见过这两种数据结构的相互转换。下面我们就来分别讲解一下这两道OJ题目的编写思路。 …

为生信写的Python简明教程 | 视频2

开源生信 Python教程 生信专用简明 Python 文字和视频教程 源码在&#xff1a;https://github.com/Tong-Chen/Bioinfo_course_python 目录 背景介绍 编程开篇为什么学习Python如何安装Python如何运行Python命令和脚本使用什么编辑器写Python脚本Python程序事例Python基本语法 数…

改进YOLOv8 | 即插即用篇 | CVPR2023最新注意力 | 《BiFormer:视觉变换器与双层路由注意力》

作为视觉变换器的核心构建模块,注意力是一种强大的工具,可以捕捉长程依赖关系。然而,这种强大的功能付出了代价:计算负担和内存占用巨大,因为需要在所有空间位置上计算成对的令牌交互。一系列的研究尝试通过引入手工制作和与内容无关的稀疏性来缓解这个问题,例如将注意力…

【技术分享】防止根据IP查域名,防止源站IP泄露

有的人设置了禁止 IP 访问网站&#xff0c;但是别人用 https://ip 的形式&#xff0c;会跳到你服务器所绑定的一个域名网站上 直接通过 https://IP, 访问网站&#xff0c;会出现“您的连接不是私密连接”&#xff0c;然后点高级&#xff0c;会出现“继续前往 IP”&#xff0c;…

81. read readline readlines 读取文件的三种方法

81. read readline readlines 读取文件的三种方法 文章目录 81. read readline readlines 读取文件的三种方法1. 读取文件的三种方法2. read方法3. readline方法4. readlines方法5. 代码总结5.1 read方法读取全部内容5.2 readline方法读取一行&#xff0c;返回字符串5.3 readli…

stable diffusion的使用

文章目录 1 文生图1.1 mountains and trees and gree1.2 three dogs1.3 cats1.4 three lovely cats1.5 beautiful girl1.6 机器猫1.7 卡通图像生成 1 文生图 1.1 mountains and trees and gree 1.2 three dogs 1.3 cats 1.4 three lovely cats 1.5 beautiful girl stable diff…

CRN Camera Radar Net for Accurate, Robust, Efficient 3D Perception

这是发表在ICLR2023 workshop on Scene Representations for Autonomous Driving上的文章&#xff0c;目前在nuScenes的cameraRadar的3D目标检测赛道上刷到了第一&#xff0c;非常值得一看 一、创新点和贡献 采用了一种两阶段的融合思路&#xff1a; 采用radar-assistant-vie…

【AI工具】bing chat 使用--三种模式+撰写功能

bing chat:三种模式撰写功能 以下为点击复制后粘贴的内容 Bing Chat提供三种对话模式可选择&#xff1a;创造力、平衡和精确。更多创造力&#xff08;Creative&#xff09;&#xff1a;Bing Chat回答的内容将带有更多语气和情绪&#xff0c;更像一个真实的人类与用户对话。更多…

如何实现倾斜摄影三维模型数据裁剪和轻量化一体化处理?

如何实现倾斜摄影三维模型数据裁剪和轻量化一体化处理&#xff1f; 随着数字地球和数字城市的发展&#xff0c;倾斜摄影三维模型成为了重要的数据形式。然而&#xff0c;由于数据量大&#xff0c;处理难度大等问题&#xff0c;如何实现倾斜摄影三维模型数据裁剪和轻量化一体化处…

ChatGPT提示词工程(二):Iterative迭代

目录 一、说明二、安装环境三、Iterative第一次写Prompt第二次写Prompt第三次写Prompt第四次写Prompt第五次写Prompt 四、总结 一、说明 这是吴恩达 《ChatGPT Prompt Engineering for Developers》 的课程笔记系列。 本文是第三讲的内容&#xff1a;Iterative 课程主讲&#…

RabbitMQ 发布订阅模式,routing路由模式,topic模式

发布订阅模式 一个消息可以由多个消费者消费同一个消息 消费者1和2同时消费了该消息 举例 public static void main(String[] args) throws IOException, TimeoutException {//1 创建连接工厂ConnectionFactory connectionFactorynew ConnectionFactory();//2 设置rabbitmq …

机器学习与深度学习——通过knn算法分类鸢尾花数据集iris求出错误率并进行可视化

什么是knn算法&#xff1f; KNN算法是一种基于实例的机器学习算法&#xff0c;其全称为K-最近邻算法&#xff08;K-Nearest Neighbors Algorithm&#xff09;。它是一种简单但非常有效的分类和回归算法。 该算法的基本思想是&#xff1a;对于一个新的输入样本&#xff0c;通过…