目录
整体框架分析
代码演示
代码分析
整体框架分析
考虑下面这个与shell典型的互动:
[xzy@ecs-333953 date16]$ ls makefile mycmd mycmd.cpp myexec myexec.c test.py [xzy@ecs-333953 date16]$ ps PID TTY TIME CMD 21919 pts/0 00:00:00 bash 21947 pts/0 00:00:00 ps [xzy@ecs-333953 date16]$
用下图的时间轴来表示事件的发生次序。其中时间从左到右。shell由表示为bash的方块代表,它随着时间的流逝从左向右移动。shell从用户读入字符串"ls"。shell建立一个新的进程,然后在那个进程中运行ls程序并等待那个进程结束。
然后shell读取新的一行输入,建立一个新的进程,在这个进程中运行程序并等待这个进程结束,所以要写一个shell,需要循环以下过程:
- 获取命令行
- 解析命令行
- 建立一个子进程(fork)
- 替换子进程(execvp)
- 等待子进程退出(wait)
根据这些思路,和我们前面学习的技术,就可以自己来实现一个shell了。
代码演示
#include<stdio.h> #include<stdlib.h> #include<string.h> #include<unistd.h> #include<sys/wait.h> #include<sys/types.h> #define SEP " "//分隔符 #define NUM 1024 #define SIZE 128 char command_line[NUM]; char* command_args[SIZE]; char env_buffer[NUM];//for test //对应上层的内建命令 int ChangeDir(const char* new_path) { chdir(new_path); return 0;//调用成功 } void PutEnvInMyShell(char* new_env) { putenv(new_env); } int main() { //shell本质就是一个死循环 while (1) { //1、显示提示符 printf("[张三@我的主机名 当前目录]# "); fflush(stdout); //2、获取用户输入 memset(command_line, '\0', sizeof(command_line) * sizeof(char)); fgets(command_line, NUM, stdin);//键盘,标准输入,stdin,获取到的是C风格的字符串,'\0'结尾 command_line[strlen(command_line) - 1] = '\0';//清空回车键的\n //3、"ls -a -l -i" -> "ls" "-a" "-l" "-i" 字符串切分 command_args[0] = strtok(command_line, SEP); int index = 1; //给ls命令添加颜色 if (strcmp(command_args[0]/*程序名*/, "ls") == 0) { command_args[index++] = (char*)"--color=auto"; } // = 是故意这么写的 // strtok截取成功,返回字符串起始地址;截取失败,返回NULL while (command_args[index++] = strtok(NULL, SEP)); //for debug //for (int i = 0; i < index; i++) //{ // printf("%d : %s\n", i, command_args[i]); //} //4、TOOD,编写后面的逻辑,内建命令 if (strcmp(command_args[0], "cd") == 0 && command_args[1] != NULL) { ChangeDir(command_args[1]);//让调用方进行路径切换,父进程 continue; } if (strcmp(command_args[0], "export") == 0 && command_args[1] != NULL) { //目前,环境变量信息在command_line,会被清空 //此处我们需要自己保存一下环境变量内容 strcpy(env_buffer, command_args[1]); PutEnvInMyShell(env_buffer);//export myval=100; continue; } //5、创建进程,执行 pid_t id = fork(); if (id == 0) { //child //6、程序替换 execvp(command_args[0]/*此处下标0就是保存的我们要执行的程序名字*/, command_args); exit(1);//执行到这里,子进程一定替换失败 } int status = 0; pid_t ret = waitpid(id, &status, 0); if (ret > 0) { printf("等待子进程成功:sig: %d, code: %d\n", status & 0x7F, (status >> 8) & 0xFF); } }//end while return 0; }
运行gif动图演示:
代码分析
首先,一个shell本质就是一个死循环,所以写成while(1)死循环。接下来进入如下几大步骤:
一、显示提示符:
- 这里只是简易模拟,不关心属性的接口,所以用“张三@我的主机名 当前目录”来简易表示,为了让输出的内容在#的后面,要加上fflush(stdout)刷新缓冲区。
//1、显示提示符 printf("[张三@我的主机名 当前目录]# "); fflush(stdout);
二、获取用户输入
- 先宏定义NUM,再定义一个command_line[NUM]数组,利用mmset把数组设置为'\0',我们平时在输入指令时或有带空格的场景(ls -a -l -i),需要将其整体当成字符串获取,用fgets来解决,注意输出指令后会按下回车键,回车也是字符,要把其去掉,否则会多输出一行,只需要把数组里最后一个字符设为'\0'即可。
#define NUM 1024 char command_line[NUM]; //2、获取用户输入 memset(command_line, '\0', sizeof(command_line) * sizeof(char)); fgets(command_line, NUM, stdin);//键盘,标准输入,stdin,获取到的是C风格的字符串,'\0'结尾 command_line[strlen(command_line) - 1] = '\0';//清空回车键的\n
三、字符串切分 + 给ls命令添加颜色
- 下面我们需要把获取到的一整个字符串("ls -a -l -i")拆分成("ls" "-a" "-l" "-i"),因为后续要一个一个或以数组的形式把这一个个命令传给替换函数。这里我们利用strtok函数(把一串字符串按照分隔符来切割)来解决,先定义一个command_args指针数组,把下表0的位置利用strtok截取到以空格" '为分隔符的位置,这就让下表0为ls了,提取成功了,接下来截取剩下的,利用while语句,注意如果第一个已经截取了,那么strtok截取剩下的字符串的函数的第一个参数要设为NULL。
我们利用which指令看下正常的ls里的内容:
- 这里面的--color=auto就是能够让ls命令有颜色的选项,并且利用alias将其取别名为ls指令,我们需要给自己写的ls指令加上--color=auto这个选项,首先利用strcmp函数判断当command_args数组下标0程序名的位置和"ls"是一样的,那么就在数组下标1处添加--color=auto即可。
#define SEP " "//分隔符 #define SIZE 128 char* command_args[SIZE]; //3、字符串切分"ls -a -l -i" -> "ls" "-a" "-l" "-i" command_args[0] = strtok(command_line, SEP); int index = 1; //给ls命令添加颜色 if (strcmp(command_args[0]/*程序名*/, "ls") == 0) { command_args[index++] = (char*)"--color=auto"; } // = 是故意这么写的 // strtok截取成功,返回字符串起始地址;截取失败,返回NULL while (command_args[index++] = strtok(NULL, SEP));
4、内建命令
内建命令1:
理想状态下,使用cd ..可以回退上级目录,但是就现在模拟的程序中是执行不了的:
- 如果exec*执行,发生了程序替换,只影响子进程,最多只是让子进程进行程序路径切换,但是子进程是一运行就完毕的进程!那么路径切换就没有意义了,所以我们在shell中更希望父进程的路径shell本身发生变化, 而不是让子进程路径发生变化。
- 如果有些行为,是必须让父进程shell执行的,不想让子进程执行,在这样的场景下是绝对不能创建子进程。所以只能是父进程自己实现对应的代码,这种由shell自己执行的命令,我们称之为内建(内置 build -in)命令。
为了解决上述路径切换的问题,我们需要用到chdir函数,其作用是更改工作路径,哪个进程调用此函数,那么它的工作路径就要发生变化。
- 这里我们手写一个ChangeDir函数,内部调用系统的chdir,接下来利用strcmp函数判断当command_args[0]的位置为"cd"指令时,直接调用ChangeDir函数切换成父进程,路径就是command_args[1],并加上continue,目的是不进行后续的创建进程。
//4、内建命令完成路径切换 if (strcmp(command_args[0], "cd") == 0 && command_args[1] != NULL) { ChangeDir(command_args[1]);//让调用方进行路径切换,父进程 continue; }
内建命令2:
- 在我们之前的学习中,清楚使用export可以将变量导入环境变量,如下的hello.c程序即可帮我们演示前后的变化:
我们运行此程序,接着执行export xxx=123后,环境变量应该会多一个:
但是在我已经使用export添加xxx环境变量后,运行myshell程序,再次执行hello_env程序,并不能在我写的shell里看到添加过的环境变量:
产生此现象的原因不奇怪:
- 因为myshell的父进程系统中的shell,所以继承的是系统中的环境变量,我们使用的是execvp的程序替换,这也足以证明默认的不带e的程序替换是默认会把环境变量传给所有子进程的,契合了环境变量具有全局属性。当我们使用execvpe,并且手动传入环境变量后,就能看到我们导入的xxx=123环境变量了。
如果我现在就想用execvp替换函数,并且导出环境变量还要能让子进程看到,解决过程如下:
运行我自己写的myshell,利用export导入环境变量:
我们调整hello.c的代码:
为了解决上述问题,又要用到内建命令了,需要用到putenv函数,作用是把特定的环境变量导入当前进程的上下文环境中。
这里我们手写一个PutEnvInMshell的函数,内部调用putenv函数,利用strcmp函数判断当comand_args[0]的位置为export命令时,直接调用PutEnvInMshell函数,但是注意目前的环境变量信息在command_line中,会被清空,所以需要提前保存一下环境变量内容。
char env_buffer[NUM];//for test void PutEnvInMyShell(char* new_env) { putenv(new_env); } if (strcmp(command_args[0], "export") == 0 && command_args[1] != NULL) { //目前,环境变量信息在command_line,会被清空 //此处我们需要自己保存一下环境变量内容 strcpy(env_buffer, command_args[1]); PutEnvInMyShell(env_buffer);//export myval=100; continue; }
综上,我们根据环境变量的数据在进程的上下文中,总结出如下两点:
- 环境变量会被子进程继承下去,所以它会有全局属性
- 当我们进行程序替换的时候,当前进程的环境变量非但不会被替换,而且是继承父进程的
5、创建进程,执行 && 6、程序替换
- 这里的目的是让子进程去执行程序替换,而不是让自己本身去执行,所以要创建进程,创建的过程都是基操
- 程序替换函数这里要选择execvp最为方便,因为我们输入的命令行参数全部被打散到了command_args数组里头,何不利用起来呢,此外执行的程序名字就是此数组的下标0位置
//5、创建进程,执行 pid_t id = fork(); if (id == 0) { //child //6、程序替换 execvp(command_args[0]/*此处下标0就是保存的我们要执行的程序名字*/, command_args); exit(1);//执行到这里,子进程一定替换失败 } int status = 0; pid_t ret = waitpid(id, &status, 0); if (ret > 0) { printf("等待子进程成功:sig: %d, code: %d\n", status & 0x7F, (status >> 8) & 0xFF); }