一、进程状态
进程一共有五种状态分别为:创建态
,就绪态
,运行态
,阻塞态(挂起态)
,退出态(终止态)
其中创建态和退出态维持的时间是非常短的,稍纵即逝。主要是就绪态
, 运行态
, 挂起态
三者之间的状态切换。
- 就绪态:万事俱备,只欠东风(
CPU资源
) - 运行态:获取到CPU资源的进程,正在运行
- 阻塞态:进程被强制放弃CPU
- 退出态:进程被销毁,占用的资源被释放
二、进程命令
2.1、查看进程
$ ps aux
- a: 查看所有终端的信息
- u: 查看用户相关的信息
- x: 显示和终端无关的进程信息
2.2、杀死进程
kill
命令可以发送某个信号到对应的进程,进程收到某些信号之后默认的处理动作就是退出进程。
查看Linux中有哪些标准信号:
kill -l
1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP
6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1
11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM
16) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP
21) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ
26) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR
31) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN+2 37) SIGRTMIN+3
38) SIGRTMIN+4 39) SIGRTMIN+5 40) SIGRTMIN+6 41) SIGRTMIN+7 42) SIGRTMIN+8
43) SIGRTMIN+9 44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
48) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7
58) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2
63) SIGRTMAX-1 64) SIGRTMAX
9号信号(SIGKILL)的行为是无条件杀死进程,想要杀死哪个进程就可以把这个信号发送给这个进程,操作
kill -9 进程ID
三、创建进程
3.1、进程相关函数
3.1.1、获取当前进程的进程ID(PID)
#include <sys/types.h>
#include <unistd.h>
pid_t getpid(void);
3.1.2、获取当前进程父进程ID(PPID)
#include <sys/types.h>
#include <unistd.h>
pid_t getppid(void);
3.1.3、创建一个新的进程
#include <unistd.h>
pid_t fork(void);
fork
调用会获得一份完整的系统程序镜像,子进程执行fork调用后返回的pid为0,父进程执行fork调用后返回的pid为子进程的PID。
3.2、fork剖析
fork
调用后,父子进程的相同点:
- 代码区:默认情况下父子进程地址空间中的源代码始终相同。
- 全局数据区:父进程中的全局变量和变量值全部被拷贝一份放到了子进程地址空间中
- 堆区:父进程中的堆区变量和变量值全部被拷贝一份放到了子进程地址空间中
- 动态库加载区(内存映射区):父进程中数据信息被拷贝一份放到了子进程地址空间中
- 栈区:父进程中的栈区变量和变量值全部被拷贝一份放到了子进程地址空间中
- 环境变量:默认情况下,父子进程地址空间中的环境变量始终相同。
- 文件描述符表: 父进程中被分配的文件描述符都会拷贝到子进程中,在子进程中可以使用它们打开对应的文件。
区别:
- 父子进程各自的虚拟地址空间是相互独立的,不会互相干扰和影响。
- 父子进程地址空间中代码区代码虽然相同,但是父子进程执行的代码逻辑可能是不同的。
- 由于每个进都有自己的进程ID,因此内核区存储的父子进程ID是不同的。
fork
成功之后,会返回两个值,父子进程的返回值是不同的。根据两个不同的值区分父进程子进程,并执行不同的逻辑。
四、exec族函数
在项目开发过程中,有时候有这种需求,需要通过现在运行的进程启动磁盘上的另一个可执行程序,也就是通过一个进程启动另一个进程,这种情况下我们可以使用exec族函数,函数原型如下:
#include <unistd.h>
extern char **environ;
int execl(const char *path, const char *arg, ... /* (char *) NULL */);
int execlp(const char *file, const char *arg, ... /* (char *) NULL */);
int execle(const char *path, const char *arg, ... /*, (char *) NULL, char * const envp[] */);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execvpe(const char *file, char *const argv[], char *const envp[]);
这些函数执行成功后不会返回,因为调用进程的实体,包括代码段,数据段和堆栈等都已经被新的内容取代(也就是说用户区数据基本全部被替换掉了),只留下进程ID等一些表面上的信息仍保持原样。只有调用失败了,它们才会返回一个 -1。
exec族
函数中最常用的有两个execl()
和execlp()
4.1、execl
#include <unistd.h>
int execl(const char *path, const char *arg, ...);
path
: 要启动的可执行程序的路径, 推荐使用绝对路径arg
: ps aux 查看进程的时候, 启动的进程的名字, 可以随意指定, 一般和要启动的可执行程序名相同...
: 要执行的命令需要的参数,可以写多个,最后以 NULL 结尾,表示参数指定完了。- 函数执行成功, 没有返回值,如果执行失败, 返回 -1。
4.2、execlp
int execlp(const char *file, const char *arg, ...);
-
file
: 可执行程序的名字- 在环境变量PATH中,可执行程序可以不加路径
- 没有在环境变量PATH中, 可执行程序需要指定绝对路径
-
arg
: ps aux 查看进程的时候, 启动的进程的名字, 可以随意指定, 一般和要启动的可执行程序名相同 -
...
: 要执行的命令需要的参数,可以写多个,最后以 NULL 结尾,表示参数指定完了。 -
函数执行成功, 没有返回值,如果执行失败, 返回 -1
4.3、仿真
#include <stdio.h>
#include <unistd.h>
int main() {
execl("/bin/ps", "title", "aux", NULL);
return 0;
}
五、进程控制
5.1、结束进程
#include <stdlib.h>
void exit(int status);
status
退出码, 如果参数值为 0 程序退出之后的状态码就是0, 如果是100退出的状态码就是100。
在 main 函数中直接使用 return
也可以退出进程, 假如是在一个普通函数中调用 return 只能返回到调用者的位置,而不能退出进程。
5.2、孤儿进程
在一个启动的进程中创建子进程,这时候父子进程同时运行,但是父进程由于某种原因先退出了,子进程还在运行,这时候这个子进程就可以被称之为孤儿进程(父亲死了,成孤儿了)。
操作系统是非常关爱运行的每一个进程的,当检测到某一个进程变成了孤儿进程,这时候系统中就会有一个固定的进程领养这个孤儿进程(有干爹了)。如果使用Linux没有桌面终端,这个领养孤儿进程的进程就是 init 进程(PID=1)也就是第一个进程,如果有桌面终端,这个领养孤儿进程就是桌面进程。
系统为什么要领养这个孤儿进程呢?在子进程退出的时候, 进程中的用户区可以自己释放, 但是进程内核区的pcb资源自己无法释放,必须要由父进程来释放子进程的pcb资源,孤儿进程被领养之后,这件事儿干爹就可以代劳了,这样可以避免系统资源的浪费。
下面这段代码可以得到一个僵尸进程
#include <sys/types.h>
#include <stdio.h>
#include <unistd.h>
int main()
{
// 创建子进程
pid_t pid = fork();
// 父进程
if(pid > 0) {
printf("我是父进程, pid=%d\n", getpid());
}
else if(pid == 0) {
// 休眠,等待父进程退出
sleep(1);
// 子进程
printf("我是子进程, pid=%d, 父进程ID: %d\n", getpid(), getppid());
}
return 0;
}
领养子进程的是桌面进程,ID号为1449
5.3、僵尸进程
在一个启动的进程中创建子进程,这时候就有了父子两个进程,父进程正常运行, 子进程先与父进程结束, 子进程无法释放自己的PCB资源, 需要父进程来做这个件事儿, 但是如果父进程也不管, 这时候子进程就变成了僵尸进程。
僵尸进程不能将它看成是一个正常的进程,这个进程已经死亡了,用户区资源已经被释放了,只是还占用着一些内核资源(PCB)。
僵尸进程的出现是由于这个已死亡的进程的父进程不作为造成的。
创建五个僵尸进程
int main()
{
pid_t pid;
// 创建子进程
for(int i=0; i<5; ++i)
{
pid = fork();
if(pid == 0)
{
break;
}
}
// 父进程
if(pid > 0)
{
// 需要保证父进程一直在运行
// 一直运行不退出, 并且也做回收, 就会出现僵尸进程
while(1)
{
printf("我是父进程, pid=%d\n", getpid());
sleep(1);
}
}
else if(pid == 0)
{
// 子进程, 执行这句代码之后, 子进程退出了
printf("我是子进程, pid=%d, 父进程ID: %d\n", getpid(), getppid());
}
return 0;
}
得到了五个僵尸进程
消灭僵尸进程的方法是,杀死这个僵尸进程的父进程,这样僵尸进程的资源就被系统回收了。通过
kill -9 僵尸进程PID
的方式是不能消灭僵尸进程的,这个命令只对活着的进程有效,僵尸进程已经死了,鞭尸是不能解决问题的。
5.4、进程回收
为了避免僵尸进程的产生,一般我们会在父进程中进行子进程的资源回收,回收方式有两种,一种是阻塞方式wait()
,一种是非阻塞方式waitpid()
。
5.4.1、wait
wait
是阻塞函数,如果没有子进程退出, 函数会一直阻塞等待, 当检测到子进程退出了, 该函数阻塞解除回收子进程资源。这个函数被调用一次, 只能回收一个子进程的资源,如果有多个子进程需要资源回收, 函数需要被调用多次。
#include <sys/wait.h>
pid_t wait(int *status);
-
status
是一个指向整数的指针,用于存储子进程的终止状态。如果不关心子进程的终止状态,可以将该参数设置为NULL
。 -
wait
函数返回已终止子进程的进程ID(PID),如果出错,则返回-1
。
<sys/wait.h>头文件中定义了几个宏来帮助解释子进程的退出状态信息:
- WIFEXITED(status):如果子进程正常退出(通过调用
exit()
或_exit()
),则此宏返回非零值。- WEXITSTATUS(status):如果
WIFEXITED(status)
为真,这个宏返回子进程的退出状态码。- WIFSIGNALED(status):如果子进程因为信号而终止,此宏返回非零值。
- WTERMSIG(status):如果
WIFSIGNALED(status)
为真,这个宏返回导致子进程终止的信号编号。- WIFSTOPPED(status):如果子进程当前是停止的,并且没有被恢复,此宏返回非零值(仅对使用
waitpid()
并指定WUNTRACED
选项时有效)。- WSTOPSIG(status):如果
WIFSTOPPED(status)
为真,这个宏返回导致子进程停止的信号编号。
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
int main() {
pid_t pid;
int status;
// 创建子进程
pid = fork();
if (pid < 0) {
// 错误处理
perror("fork");
exit(EXIT_FAILURE);
} else if (pid == 0) {
// 子进程执行的代码
printf("Child process: My PID is %d\n", getpid());
exit(EXIT_SUCCESS);
} else {
// 父进程等待子进程的退出
printf("Parent process: Waiting for child process to exit...\n");
wait(&status);
printf("Parent process: Child process with PID %d has exited\n", pid);
}
return 0;
}
5.4.2、waitpid
waitpid() 函数可以看做是 wait() 函数的升级版,通过该函数可以控制回收子进程资源的方式是阻塞还是非阻塞,另外还可以通过该函数进行精准打击,可以精确指定回收某个或者某一类或者是全部子进程资源。
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *status, int options);
- 参数:
pid
:-1
:回收所有的子进程资源, 和wait()是一样的, 无差别回收,并不是一次性就可以回收多个, 也是需要循环回收的大于0
:指定回收某一个进程的资源 ,pid是要回收的子进程的进程ID0
:回收当前进程组的所有子进程ID小于 -1
:pid 的绝对值代表进程组ID,表示要回收这个进程组的所有子进程资源
status
: NULL, 和wait的参数是一样的options
: 控制函数是阻塞还是非阻塞0
: 函数是行为是阻塞的 ==> 和wait一样WNOHANG
: 函数是行为是非阻塞的
- 返回值:
- 如果函数是非阻塞的, 并且子进程还在运行, 返回0
- 成功: 得到子进程的进程ID
- 失败: -1
- 没有子进程资源可以回收了, 函数如果是阻塞的, 阻塞会解除, 直接返回-1
- 回收子进程资源的时候出现了异常
#include <sys/wait.h>
int main() {
pid_t pid;
// 创建子进程
for(int i=0; i<5; ++i) {
pid = fork();
if(pid == 0) {
break;
}
}
// 父进程
if(pid > 0) {
while(1) {
int status;
pid_t ret = waitpid(-1, &status, WNOHANG); // 非阻塞
if(ret > 0)
{
printf("成功回收了子进程资源, 子进程PID: %d\n", ret);
if(WIFEXITED(status)) {
printf("子进程退出时候的状态码: %d\n", WEXITSTATUS(status));
}
if(WIFSIGNALED(status)) {
printf("子进程是被这个信号杀死的: %d\n", WTERMSIG(status));
}
}
else if(ret == 0) {
printf("子进程还没有退出, 不做任何处理...\n");
}
else {
printf("回收失败, 或者是已经没有子进程了...\n");
break;
}
printf("我是父进程, pid=%d\n", getpid());
}
}
// 子进程
else if(pid == 0) {
printf("===我是子进程, pid=%d, 父进程ID: %d\n", getpid(), getppid());
}
return 0;
}