进程控制
- 一、进程创建
- 1.1 fork 的补充
- 1.2 写时拷贝
- 1.3 fork 的使用场景
- 二、进程终止
- 2.1 退出码
- 2.2 退出情况
- 2.3 退出方式
- 三、进程等待
- 3.1 进程等待的原因
- 3.2 进程等待的方法
- 3.2.1 status 位图结构
- 3.2.2 阻塞等待和非阻塞等待
- 四、进程程序替换
- 4.1 程序替换的原理
- 4.2 程序替换函数
- 4.2.1 函数名规律
- 4.2.2 函数使用
- 五、手写简易shell
一、进程创建
1.1 fork 的补充
在上一篇的进程概念讲解中,我们讲解了fork的函数的基础知识进程概念详述,就不再过多赘述。这里需要补充一个细节:进程并不是fork之后创建的,而是在fork函数内部就已经创建好了。
1.2 写时拷贝
进程具有独立性,当一个进程的数据发生修改,为了不让另一个进程也被改变,所以会拷贝一份数据再修改。
好处:提高效率(不修改就共享)
1.3 fork 的使用场景
我们为什么需要创建子进程呢?有以下两种情况:
1️⃣ 父进程需要子进程复制自己,来执行不同的代码段。
2️⃣ 父进程想让子进程执行不同的程序(后面讲的进程替换)
二、进程终止
2.1 退出码
我们在写C/C++程序的时候,在结尾总是会return 0,他其实是一个进程退出码。作用:标定进程结束时程序是否正确。
获取最近一个执行完毕进程的退出码:
echo $?
我们用0表示成功,非0表示失败。而非0的不同数字表示不同的错误。
但是数字对于我们人类很难看懂,所以每个退出码都会有对应的文字描述。
退出码转换文字描述:
strerror
一部分展示:
2.2 退出情况
当一个进程退出后,只会有三种情况:
2.3 退出方式
进程退出有三种方式:
1️⃣ 在main函数return
2️⃣ 任意地方调用exit
3️⃣ 任意地方调用_exit
exit和_exit的区别
首先exit是库函数,_exit是系统调用。所以其实 exit 的底层是 _exit 函数,exit 是 _exit 的封装。
当我们要输出一句话的时候(不带’\0’,数据还在缓冲区),此时使用exit后主动刷新缓冲区(数据会被打印出来),但是使用_exit数据并不会被打印出来。
三、进程等待
3.1 进程等待的原因
我们创建子进程是为了让它帮助父进程做某些事,所以父进程需要它的执行结果,所以在子进程退出的时候,会变成僵尸进程,把退出结果写入PCB中,父进程来回收以便获得结果(退出状态)。
但是我们在前面讲过父子进程执行的先后顺序并不确定,所以有可能父进程先退出,造成内存泄漏,所以我们需要进程等待。
3.2 进程等待的方法
我们一般就是用这两个函数实现进程等待。
参数说明:
返回值:成功返回子进程id,失败返回-1;如果options为WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;
status:输出型参数,获取子进程退出状态。
pid_t:要等待进程的id,如果传>0的数字就表示要等待的进程,如果是-1,则表示等待随机一个进程。
options:指定父进程等待方式,有阻塞式等待和非阻塞式等待。
演示一下:
我们可以看到status并不是我们预想的数字100,那么是什么原因呢?
3.2.1 status 位图结构
我们知道一个int类型有32个比特位,而我们的status的高16位我们是不使用的,所以我们只看低16位的情况。
查看进程退出信号:
kill -l
所以上面我们想要获取退出状态我们需要让(status >> 8) & 0xff
才可以获得我们想要我们想要的数字。
通过这样我们就知道以后使用waitpid应该这么用:
printf("exit signal:%d, exit code:%d \n", (status & 0x7f), (status >> 8 & 0xff));
而linux给我们提供了两个宏函数,不用我们自己进行位操作。
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
用法:
3.2.2 阻塞等待和非阻塞等待
阻塞和非阻塞是由第三个参数options决定的,0代表阻塞式等待,options 为 WNOHANG 代表非阻塞式等待,他们的区别:
阻塞等待: 当子进程没有退出的时候,父进程"什么都不干",专门等待该进程。直到子进程退出,才能执行后面的语句。
非阻塞等待: 每隔一段时间访问一次,若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID,采取的是轮询等待方式。
上面写的代码都是阻塞等待,下面展示一个非阻塞等待的程序:
四、进程程序替换
我们在上面fork处说了fork有两种使用场景,前面我们用的都是第一种,现在来说说第二种(父进程想让子进程执行不同的程序):
4.1 程序替换的原理
进程程序替换是指父进程用 fork 创建子进程后,子进程通过调用 exec 系列函数来执行另一个程序,该进程的用户空间代码和数据完全被新程序替换(覆盖自己的代码和数据),但是不会创建新的进程,是用原来的进程执行新的程序。
看一下被覆盖是什么意思:
可以看到execl函数后面的语句"消失不见了",execl就是程序替换函数,execl执行完后,代码全部被覆盖,开始执行新程序的代码了,所以最后一个printf无法执行。
4.2 程序替换函数
linux提供了一系列exec函数,有六个库函数和一个系统调用。
由此看出六个库函数接口就是execve的封装。所以我们就学习一下六个系统调用。
返回值:
可以看到,成功不再返回,失败则返回-1。(成功了后面的代码都被替换了,要返回值也没意义)。
4.2.1 函数名规律
我们发现这些函数前面都是exec,后面的几个字母都有各自的含义:
l (list):表示参数采用列表。
v (vector):表示参数采用数组。
p (path):有p自动搜索环境变量PATH。
e (env):表示自己维护环境变量。
4.2.2 函数使用
int execlp(const char *file, const char *arg, ...);
(l + p)
int execv(const char *path, char *const argv[]);
(v)
int execvp(const char *file, char *const argv[]);
(v + p)
int execle(const char *path, const char *arg, ...,char *const envp[]);
(l + e)
这里我们使用mytest程序调用mybin程序:
运行结果:
可以看到自定义的环境变量为NULL,因为没有设置,现在我们可以使用execle来传递环境变量:
如果我们想让系统提供的环境变量和自定义环境变量同时存在:
调用函数:
int putenv(char *string);
作用是把自定义变量导入到系统的环境变量中。
五、手写简易shell
在学习了上面的知识点后,我们就可以实现一个简易的shell命令行解释器。
而我们需要做哪些事情呢?
1.命令行提示符
2.解析输入的字符串(分开每个指令)
3.让子进程执行程序替换
4.父进程等待
代码如下:
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <string.h>
#define NUM 128
#define NUM_A 64
int main()
{
char command[NUM];
while(1)
{
char* argv[NUM_A] = {NULL};
command[0] = 0;
printf("[who@myhostname minishell]# ");
fgets(command, NUM, stdin);
command[strlen(command) - 1] = '\0';
fflush(stdout);
// 解析命令字符串
const char* str = " ";
argv[0] = strtok(command, str);
int i = 1;
while(argv[i] = strtok(NULL, str))
{
i++;
}
if(fork() == 0)// child
{
execvp(argv[0], argv);
exit(-1);
}
waitpid(-1, NULL, 0);
}
return 0;
}
但是当我们cd之后使用pwd,路径却没有被改变。
思考一下就可以知道我们是让子进程执行的cd,父进程不会受影响。
那我们就可以使用内建命令:
内建命令:不需要让子进程执行,而是让shell自己执行的命令。
int chdir(const char *path);
所以我们只需要判断一下是不是cd即可:
if(argv[0] != NULL && strcmp(argv[0], "cd") == 0)
{
if(argv[1] != NULL)
{
chdir(argv[1]);
continue;
}
}
cecho $?
也是个内建命令,因为是获取子进程的退出结果,经过上文的介绍,我们知道就是获取status的值,设置一个全局变量,来获取退出码。
完整代码如下:
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <string.h>
#define NUM 128
#define NUM_A 64
int last_code = 0;
int main()
{
char command[NUM];
while(1)
{
char* argv[NUM_A] = {NULL};
command[0] = 0;
printf("[who@myhostname minishell]# ");
fgets(command, NUM, stdin);
command[strlen(command) - 1] = '\0';
fflush(stdout);
// 解析命令字符串
const char* str = " ";
argv[0] = strtok(command, str);
int i = 1;
while(argv[i] = strtok(NULL, str))
{
i++;
}
if(argv[0] != NULL && strcmp(argv[0], "cd") == 0)
{
if(argv[1] != NULL)
{
chdir(argv[1]);
continue;
}
}
if(argv[0] != NULL && strcmp(argv[0], "echo") == 0)
{
if(strcmp(argv[1], "$?") == 0)
{
printf("%d\n", last_code);
}
}
if(fork() == 0)// child
{
execvp(argv[0], argv);
exit(-1);
}
int status = 0;
waitpid(-1, &status, 0);
last_code = (status >> 8) & 0xff;
}
return 0;
}