进程的等待与替换
- 一、进程等待
- 1、进程等待的必要性
- 2、获取子进程status
- 3、进程等待的方法
- (1)wait()函数
- (2)waitpid函数
- 4、多进程创建以及等待的代码模型
- 5、非阻塞接口 轮询
- 二、进程替换
- 1、替换原理
- 2、替换函数
- (1)execl函数
- (2)execlp函数(p:就是文件)
- (3)execle函数(以e结尾:environment环境变量)
- (4)execv函数(以v结尾:vector 数组)
- (5)execvp函数(v+p:数组+文件)
- (6)execve函数(v+p:数组+环境变量)
- 3、函数解释
- 4、命名理解
- 5、代码演示
- (1)演示一
- (2)演示二
- (3)execv 和 execvp 调用举例
- (4)execvpe调用举例
一、进程等待
1、进程等待的必要性
- 子进程退出,父进程如果不读取子进程的退出信息,子进程就会变成僵尸进程,进而造成内存泄漏。
- 进程一旦变成僵尸进程,那么就算是kill -9命令也无法将其杀死,因为谁也无法杀死一个已经死去的进程。
- 对于一个进程来说,最关心自己的就是其父进程,因为父进程需要知道自己派给子进程的任务完成的如何。
- 父进程需要通过进程等待的方式,回收子进程资源,获取子进程的退出信息。
2、获取子进程status
1、下面进程等待所使用的两个函数wait和waitpid,都有一个status参数,该参数是:一个输出型参数,由操作系统进行填充。
2、如果对status参数传入NULL,表示不关心子进程的退出状态信息。
否则,操作系统会通过该参数,将子进程的退出信息反馈给父进程。
3、对于此,系统当中提供了两个宏来获取退出码和退出信号。
- WIFEXITED(status):用于查看进程是否是正常退出,本质是检查是否收到信号。
- WEXITSTATUS(status):用于获取进程的退出码。
需要注意的是,当一个进程非正常退出时,说明该进程是被信号所杀,那么该进程的退出码也就没有意义了。
3、进程等待的方法
(1)wait()函数
- 函数原型:pid_t wait(int* status);
- 作用:等待任意子进程
- 返回值:等待成功返回被等待进程的pid,等待失败返回-1。
- 参数:输出型参数,获取子进程的退出状态,不关心可设置为NULL。
例如,创建子进程后,父进程可使用wait函数一直等待子进程,直到子进程退出后读取子进程的退出信息。
(2)waitpid函数
-
函数原型:pid_t waitpid(pid_t pid, int* status, int options);
-
作用:等待指定子进程或任意子进程。
-
返回值:
(1)等待成功返回被等待进程的pid。
(2)如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0。
(3)如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在。4、参数:
(1)pid:待等待子进程的pid,若设置为-1,则等待任意子进程。
(2)status:输出型参数,获取子进程的退出状态,不关心可设置为NULL。
(3)options:当设置为WNOHANG时,若等待的子进程没有结束,则waitpid函数直接返回0,不予以等待。若正常结束,则返回该子进程的pid。
例如,创建子进程后,父进程可使用waitpid函数一直等待子进程(此时将waitpid的第三个参数设置为0),直到子进程退出后读取子进程的退出信息。
在父进程运行过程中,我们可以尝试使用kill -9命令将子进程杀死,这时父进程也能等待子进程成功。
注意: 被信号杀死而退出的进程,其退出码将没有意义。
4、多进程创建以及等待的代码模型
上面演示的都是父进程创建以及等待一个子进程的例子,实际上我们还可以同时创建多个子进程,然后让父进程依次等待子进程退出,这叫做多进程创建以及等待的代码模型。
例如,以下代码中同时创建了10个子进程,同时将子进程的pid放入到ids数组当中,并将这10个子进程退出时的退出码设置为该子进程pid在数组ids中的下标,之后父进程再使用waitpid函数指定等待这10个子进程。
运行代码,这时我们便可以看到父进程同时创建多个子进程,当子进程退出后,父进程再依次读取这些子进程的退出信息。
5、非阻塞接口 轮询
上述所给例子中,当子进程未退出时,父进程都在一直等待子进程退出,在等待期间,父进程不能做任何事情,这种等待叫做阻塞等待。
实际上我们可以让父进程不要一直等待子进程退出,而是当子进程未退出时父进程可以做一些自己的事情,当子进程退出时再读取子进程的退出信息,即非阻塞等待。
做法很简单,向waitpid函数的第三个参数potions传入WNOHANG,这样一来,等待的子进程若是没有结束,那么waitpid函数将直接返回0,不予以等待。而等待的子进程若是正常结束,则返回该子进程的pid。
例如,父进程可以隔一段时间调用一次waitpid函数,若是等待的子进程尚未退出,则父进程可以先去做一些其他事,过一段时间再调用waitpid函数读取子进程的退出信息。
二、进程替换
1、替换原理
用fork创建子进程后,子进程执行的是和父进程相同的程序(但有可能执行不同的代码分支),若想让子进程执行另一个程序,往往需要调用一种exec类函数。
当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,并从新程序的启动例程开始执行。(其他都不变!)
- 当进行进程程序替换时,有没有创建新的进程?
进程程序替换之后,该进程对应的task_struct、进程地址空间 以 及页表等 数据结构 都没有发生改变,只有进程在物理内存当中的数据和代码发生了改变,所以并没有创建新的进程,而且进程程序替换前后该进程的pid并没有改变。
2.子进程进行进程程序替换后,会影响父进程的代码和数据吗?
子进程刚被创建时,与父进程共享代码和数据,但当子进程需要进行进程程序替换时,也就意味着子进程需要对其数据和代码进行写入操作,这时便需要将父子进程共享的代码和数据进行写时拷贝,此后父子进程的代码和数据也就分离了,因此子进程进行程序替换后不会影响父进程的代码和数据
2、替换函数
替换函数有六种以exec开头的函数,它们统称为exec函数:
(1)execl函数
int execl(const char *path, const char *arg, …);
第一个参数是要执行程序的路径,第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾。
例如,要执行的是ls程序
execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
(2)execlp函数(p:就是文件)
int execlp(const char *file, const char *arg, …);
第一个参数是要执行程序的名字,第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾。
例如,要执行的是ls程序
execlp("ls", "ls", "-a", "-i", "-l", NULL);
(3)execle函数(以e结尾:environment环境变量)
int execle(const char *path, const char *arg, …, char *const envp[]);
第一个参数是要执行程序的路径,第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾,第三个参数是你自己设置的环境变量。
例如,你设置了MYVAL环境变量,在mycmd程序内部就可以使用该环境变量。
char* myenvp[] = { "MYVAL=2021", NULL };
execle("./mycmd", "mycmd", NULL, myenvp);
(4)execv函数(以v结尾:vector 数组)
int execv(const char *path, char *const argv[]);
第一个参数是要执行程序的路径,第二个参数是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾。
例如,要执行的是ls程序
char* myargv[] = { "ls", "-a", "-i", "-l", NULL };
execv("/usr/bin/ls", myargv);
(5)execvp函数(v+p:数组+文件)
int execvp(const char *file, char *const argv[]);
第一个参数是要执行程序的名字,第二个参数是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾。
例如,要执行的是ls程序。
char* myargv[] = { "ls", "-a", "-i", "-l", NULL };
execvp("ls", myargv);
(6)execve函数(v+p:数组+环境变量)
int execve(const char *path, char *const argv[], char *const envp[]);
第一个参数是要执行程序的路径,第二个参数是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾,第三个参数是你自己设置的环境变量。
第一个参数是要执行程序的路径,第二个参数是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾,第三个参数是你自己设置的环境变量。
例如,你设置了MYVAL环境变量,在mycmd程序内部就可以使用该环境变量。
char* myargv[] = { "mycmd", NULL };
char* myenvp[] = { "MYVAL=2021", NULL };
execve("./mycmd", myargv, myenvp);
3、函数解释
- 这些函数如果调用成功,则加载指定的程序并从启动代码开始执行,不再返回。
- 如果调用出错,则返回-1。
也就是说,exec系列函数只要返回了,就意味着调用失败。
4、命名理解
这六个exec系列函数的函数名都以exec开头,其后缀的含义如下:
- l(list):表示参数采用列表的形式,一一列出。
- v(vector):表示参数采用数组的形式。
- p(path):表示能自动搜索环境变量PATH,进行程序查找。(其实参数就是文件~)
- e(env):表示可以传入自己设置的环境变量。
5、代码演示
(1)演示一
(2)演示二
如果替换失败,就直接忽视,继续执行原来的进程代码!
(3)execv 和 execvp 调用举例
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
代码:
#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
#include<wait.h>
// 多进程版本
int main()
{
printf("testexec ... begin!\n");
pid_t id = fork();
if(id == 0)
{
// child
printf("I am child process,pid:%d\n",getpid());
sleep(2);
char* const argv[]=
{
(char*)"ls",
(char*)"-a",
(char*)"-l",
(char*)"--color",
NULL
};
// execv("/usr/bin/ls",argv);
execvp("ls",argv);
}
// father
int status = 0;
pid_t rid = waitpid(id,&status,0);
if(rid > 0)
{
printf("father wait success,child exit code:%d\n",WEXITSTATUS(status));
}
else
{
printf("father wait failed!\n");
}
printf("testexec ... end!\n");
return 0;
}
(4)execvpe调用举例
int execvpe(const char *file, char *const argv[],char *const envp[]);
代码:
#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
#include<wait.h>
#include<stdlib.h>
// 多进程版本
int main()
{
printf("testexec ... begin!\n");
pid_t id = fork();
if(id == 0)
{
// child
// 我的父进程本身就有一批环境变量,从bash来,自己想添加可以使用putenv
putenv("HHHH=333333333");// 头文件 stdlib.h
char* const argv[]=
{
(char*)"mypragma",
(char*)"-a",
(char*)"-b",
NULL
};
printf("I am child process,pid:%d\n",getpid());
sleep(2);
extern char** environ;
execvpe("./mypragma",argv,environ);
}
// father
int status = 0;
pid_t rid = waitpid(id,&status,0);
if(rid > 0)
{
printf("father wait success,child exit code:%d\n",WEXITSTATUS(status));
}
else
{
printf("father wait failed!\n");
}
printf("testexec ... end!\n");
return 0;
}
事实上,只有execve是真正的系统调用,其它六个函数最终都调用 execve,所以execve在man手册 第2节,其它函数在man手册第3节。这些函数之间的关系如下图所示。