进程的管理与控制详解：创建、终止、阻塞等待与非阻塞等待

一、进程创建

1、实例

2、fork函数详解

(1)fork函数模板

(2). fork() 函数的工作原理

(3). fork() 返回值和错误处理

3、如何理解进程创建过程

二、进程终止

1、终止是在做什么？

2、进程终止，有三种情况

3、进程如何终止？

三、进程等待

1、为什么要等待？

2、怎么等待？

（1）wait函数

（2）waitpid函数

四、阻塞等待与非阻塞等待

一、进程创建

1、实例

int main()
{ 
  pid_t pid;
  pid = fork();
  
  if(pid < 0)
  {
    //创建失败
    printf("forkfailed\n");
    return 1;//终止程序，退出码设置为1，以显示错误退出
  }
  else if(pid == 0)
  {
    //子进程

    printf("I am a child process!,chailPID:%d\n",getpid());
  }
  else 
  {
    //父进程，返回值>0 
    printf("I am a father process!,fatherPID:%d,childPID:%d\n",getpid(),pid);
  }

  return 0;
}

2、fork函数详解

(1)fork函数模板

#include <unistd.h>

pid_t fork(void);

fork() 函数返回两次，
一次在父进程中返回子进程的进程 ID （PID),
一次在子进程中返回 0。
如果 fork() 失败，返回一个负值，表示错误。

(2). fork() 函数的工作原理

调用 fork() 函数时，操作系统会创建一个新的进程（子进程），该子进程是调用进程（父进程）的一个副本。
新进程（子进程）会复制父进程的地址空间、代码段、数据段和堆栈等信息，但是它们会有各自独立的内存空间。
子进程的 PID 和父进程不同，但是它们会继承父进程的文件描述符和信号处理器等。
fork() 后，父进程和子进程同时开始执行代码，但是它们执行的顺序和执行的内容可能有所不同，具体取决于操作系统的调度策略。

(3). fork() 返回值和错误处理

如果 fork() 返回值 > 0，则这是在父进程中返回的子进程的 PID。
如果 fork() 返回值等 == 0，则这是在子进程中返回的。
如果 fork() 返回值 < 0，则表示创建新进程失败，可能是因为系统资源不足或者其他错误。

3、如何理解进程创建过程

进程：内核的相关管理数据结构（task_struct mm_struct）+ 页表 + 代码和数据
上述对进程的描述，是从进程具有独立性的角度出发去看待
进程具有独立性，说明有各自的PCB、页表、数据；
而代码虽然是共享的，但是权限是只读的不能修改，因此互不影响

当使用fork创建进程时：
分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝给子进程
添加子进程到系统进程列表中
fork返回，开始调度器调度

为什么给父进程返回子进程的PID，给子进程返回0？
前者因为方便父进程对子进程标识的管理
后者因为返回创建成功与否的标志

fork常规用法：子进程执行和父进程类似的任务 / 子进车执行全新的任务

fork调用失败的原因
系统进程太多，资源不够

二、进程终止

1、终止是在做什么？

释放曾经的代码和数据所占据的空间
释放内核数据结构（但是task_struct延后，Z状态的僵尸进程）

2、进程终止，有三种情况

a、代码跑完，结果正确

b、代码跑完，结果不正确
那么，代码跑完，正确不正确，我怎么知道？怎么判断？
可以通过进程的退出码决定

c、代码没有跑完，异常提前退出
如果进程异常，退出码就没有意义
但是，如果出现了异常，我想知道，为什么出现异常？出现了什么异常？
出现什么异常，通过看退出信号是多少判断
进程出现异常，本质是因为进程收到了OS发给进程的信号
例如：kill -9 XXX
这个命令本质是XXX进程收到了OS的信号，为9，就会以killed的形式终止

那么，如何判断进程终止是处于上述三种情况的哪一种？
1、先确认是否异常退出
2、如果不是异常，就说明代码跑完，看退出码

因此，衡量一个进程退出到底是什么情况？
需要两个数字：退出码（跑完） + 退出信号（异常）的组合
而这个退出信息，要给父进程bash知道，确保父进程对子进程的管理
因此，进程的PCB task_struct就会存在两个属性：

int sig_code
int exit_code

在vs编程运行崩溃时，发生了什么？
是因为进程做了不该做的事情，OS杀掉了进程

main函数的返回值是什么意思？

int main()

{

//...

return 0;

}

是本进程的退出码，这个退出码交给父进程，让父进程知道子进程退出的情况（成功 / 失败且失败的原因是什么）
退出码为0，表示成功
退出码不为0，表示失败

查看退出码：

echo $?

？这个问号，是父进程bash获取到的，最近一个子进程退出的退出码

返回值返回给谁？返回给父进程bash
这个返回值是退出码，退出码交给bash之后，如果不是0，表示错误
此时bash会通过一定的形式将退出码转化为错误描述，strerrot函数

char* strerrot(int erronum)：错误码转化为错误描述

以下是常见错误：

错误码 (errnum)	错误描述 (错误码对应的错误描述)
1	操作不允许的权限
2	系统找不到指定的文件
3	系统找不到指定的路径
4	系统没有空间供处理此操作
5	输入/输出错误
6	设备不可用
7	存储设备无法访问
8	请求的文件描述符超出范围
9	文件已经打开
10	操作过多的文件系统
11	资源暂时不可用
12	文件名过长
13	权限不足，拒绝访问
14	资源暂时不可用，尝试再次

main函数为什么要有返回值？
这是因为本质上，我们自己写的所有进程任务，都是bash的子进程
而子进程的运行状况如何，父进程得知道，便于对子进程的管理
所以，父进程怎么知道子进程的状态呢？通过main函数的返回值判断
所以，main函数返回值的本质，是通知父进程任务执行情况

又为什么返回0?
0表示进程执行成功
非0表示失败，而且用不同的非0数字表示错误的原因类型，每个数字对应一个错误的描述

char* strerrot(int erronum)：错误码转化为错误描述

3、进程如何终止？

a、main函数中直接return，表示进程终止（非main函数，return表示函数结束）

b、代码调用exit函数（引起一个正常的进程终止）
参数类似于main函数的return退出码
当调用exit函数时，可以在进程的任意位置退出

c、_exit（终止一个调用进程）
exit和_exit的区别是什么？
区别在于exit在退出时，会刷新缓冲区；_exit不会
exit是C语言库函数；_exit是系统调用
所以，本质上，exit一定会调用_exit系统接口
因为不允许用户直接越过操作系统访问底层的进程数据
所以，我们可以知道，缓冲区是介于系统调用和库函数之间的
也就是说，缓冲区不是操作系统内核缓冲区

三、进程等待

任何进程，在退出的情况下，一般必须要被父进程进行等待
如果退出时，父进程不管不顾，退出进程就会处于Z（僵尸状态），长期如此，就会造成内存泄漏
僵尸状态：进程没有被执行，不在CPU的运行队列，此时操作系统就会回收存在内存中的代码数据，但是不会释放PCB结构体
同时，僵尸进程无法被杀死，因为已经死了的僵尸，不能死两次
具体详情，可以参考博主的其他文章：零基础进程最详解：进程状态、僵尸进程、孤儿进程、阻塞态、挂起态、进程切换、进程常用命令、进程创建、队列优先级_僵尸进程孤儿进程-CSDN博客https://blog.csdn.net/qq_51216031/article/details/140850173?spm=1001.2014.3001.5501

1、为什么要等待？

（1）通过父进程等待，解决子进程退出时的僵尸问题，回收系统资源
（2）获取子进程的退出信息（因为父进程要知道子进程因为什么退出，但是并非必要）

2、怎么等待？

通过wait / waitpid函数

（1）wait函数

wait 函数是一个阻塞式的系统调用，用于暂停父进程的执行，直到一个子进程结束或者收到一个信号为止。一旦子进程终止，wait 函数会获取子进程的终止状态并返回。

pid_t wait (int *status);//返回值是，等待成功时，子进程的pid
status：等待父进程中，任意一个子进程退出，如果不关心子进程的退出状态，可以传入 NULL。

返回值：如果成功，返回终止子进程的进程ID（PID）。
如果出错，返回 -1。

如果子进程没有退出，父进程一直在阻塞等待状态，即S（sleeping）状体
这种阻塞，本质是在等待子进程这个软件状态就绪，即返回信息，再死亡释放子进程

（2）waitpid函数

pid_t waitpid(pid_t pid, int *status, int options);
返回值：当正常返回的时候，返回收集到子进程的进程ID

参数：

第一个参数pid：等待的子进程PID：
< -1：等待进程组ID等于pid绝对值的任何子进程。
-1：等待任何子进程。
0：等待与调用进程在同一进程组的任何子进程。
> 0：等待指定PID的子进程。

第二个参数status：一个整型指针，用于存储子进程的退出状态信息。如果不关心子进程的退出状态，可以传入 NULL。

第三个参数options：指定等待的选项，例如 WNOHANG 可以使 waitpid 成为非阻塞的。

返回值：如果成功，返回终止子进程的进程ID（PID）。
如果出错，返回 -1。

WIFEXITED（status）：获取退出码，返回值非0为正常退出，不正常为0

子进程返回的信息，就是通过wait_pid中的参数status获取的
因此，status不能简单视为一个整数
status在32位下，我们只关心低16位
在这16位中，8-15表示退出状态，0-6表示退出信号

低16位的含义：

退出状态：位于低16位的8-15位。这个部分表示子进程的退出状态。通常，如果子进程正常退出，这个状态会是0。
退出信号：位于低16位的0-6位。这部分表示导致子进程终止的信号。如果子进程不是正常退出（比如因为接收到了某个信号而终止），那么这部分会包含有关信号的信息。

四、阻塞等待与非阻塞等待

如果子进程没有退出
此时父进程在执行waitpid进行等待，处于阻塞等待状态
进程阻塞的本质就是进程不在运行调度队列中，状态不为R
如果父进程一直处于阻塞状态，就相当于父进程什么也没有做，就只是在等待子进程的退出
这样不好
那么可不可以让父进程不处于阻塞状态去等待呢？
可以，这种状态叫做非阻塞等待
怎么做？设置函数参数

pid_t waitpid(pid_t pid, int *status, int options);

对于该函数的options参数值设置为WNOHANG值（一个宏）
WNOHANG 是一个宏定义，通常在使用 waitpid 函数时用作参数，用于指定在调用 waitpid 函数时的父进程处于非阻塞等待状态。
具体来说：WNOHANG 的全称是 "Wait No Hang"。
非阻塞等待的时候 + 循环 = 非阻塞轮询
在非阻塞轮询情形下，父进程就可以做其他的事情

如何理解呢？

假设，你有一个女朋友，假设，注意，我说的是假设哈
你在大学谈了一个女朋友
周末你约她出去玩，可是她说他要化妆，要打扮一下
于是你就到她的宿舍楼下等
此时，你和你女朋友的处境就相当于子进程和父进程
你是父进程，你女朋友是子进程

如果在等的期间，你一句话都不敢说，啥也不敢做，
就像一个二棒槌一样杵在楼下等待
那么，此时你这个父进程就相当于阻塞等待状态
啥也没做，就是等，浪费生命，浪费时间

但是，如果你在等的期间，你每隔几分钟打个电话问个情况，说好了没有啊？
如果她告诉你好了，就出发
如果她告诉你没有好，那你也不能像棒槌一样干杵着
所以，你就刷刷抖音，欣赏欣赏风景，做自己的事情
然后再时不时打电话问情况
好了，就出发；没好，就做自己的事情
于是，此时，你和你女朋友的状态，就相当于非阻塞等待状态
打电话相当于一个函数调用，她给你的答复好没好是返回值
你拿到这个返回值当作一个参数，作为参考
返回值为好了，你就结束等待
返回值为没好，你就继续做手头的事情
这就是非阻塞等待状态
同时，你每隔几分钟打一次电话，
这个就叫做轮询
所以，
非阻塞等待的时候 + 循环 = 非阻塞轮询
在非阻塞轮询情形下，父进程就可以做其他的事情