进程控制-操作系统

1. 进程概述

进程和程序的区别:程序和进程是两个不同的概念，他们的状态，占用的系统资源都是不同的。

程序：就是磁盘上的可执行文件文件, 并且只占用磁盘上的空间，是一个静态的概念。
进程：被执行之后的程序叫做进程，不占用磁盘空间，需要消耗系统的内存，CPU资源，每个运行的进程的都对应一个属于自己的虚拟地址空间，这是一个动态的概念。

1.1 并行和并发

CPU时间片

CPU时间片是多任务操作系统中，每个进程被分配的执行时间段。通过调度算法，操作系统确保每个进程有机会执行，防止某个进程长时间占用CPU。时间片的大小影响系统响应和效率，是一种权衡考虑。

并发和并行

并发： 多个任务在同一时间段内交替执行，它们可能不是同时进行的，而是通过快速切换实现感觉上的同时进行。并发主要强调任务之间的相互独立和独立进展。
并行： 多个任务在同一时刻同时执行，真正的同时性。这通常涉及到物理上的多个处理单元（例如多核处理器）或多台计算机。

简而言之，并发是指多个任务交替执行，而并行是指多个任务同时执行。并发通常用于处理大量的任务，使系统更加响应，而并行则是通过同时执行多个任务来提高整体的处理速度。

1.2 PCB

PCB - 进程控制块（Processing Control Block），Linux内核的进程控制块本质上是一个叫做 task_struct的结构体。在这个结构体中记录了进程运行相关的一些信息

PCB 是进程存在的唯一标识，这意味着一个进程的存在，必然会有一个 PCB，如果进程消失了，那么 PCB 也会随之消失。

包含的信息: 进程id(pid), 进程的状态, 进程优先级, 进程对应的虚拟地址空间的信息等, PCB 的信息在进程切换时被保存和恢复，以确保操作系统能够正确地管理和调度多个进程。

1.3 进程状态

进程一共有五种状态分别为：**创建态，就绪态，运行态，阻塞态(挂起态)，退出态(终止态)**其中创建态和退出态维持的时间是非常短的，稍纵即逝。

就绪状态（Ready）： 进程已经准备好执行，等待分配CPU时间。通常，进程在等待操作系统的调度时处于就绪状态。
运行状态（Running）： 进程正在CPU上执行指令。在任何给定时刻，只能有一个进程处于运行状态。
阻塞状态（Blocked）： 进程被阻塞，无法执行。这可能是因为等待某个事件的发生，例如等待输入/输出完成、等待资源的释放等。在阻塞状态中的进程会等待操作系统的通知，以便重新进入就绪状态。

在这里插入图片描述

1.4 进程命令

ps： 显示当前进程的快照。

ps aux     # 显示所有用户的所有进程
ps -ef     # 显示所有进程的详细信息

top： 实时显示系统中正在运行的进程的信息，以及系统的整体性能。
```
top
```

kill： 终止一个进程。

kill PID    # 使用进程ID（PID）终止进程

在这里插入图片描述

9号信号（SIGKILL）的行为是无条件杀死进程，想要杀死哪个进程就可以把这个信号发送给这个进程，操作如下：

# 无条件杀死进程, 进程ID通过 ps aux 可以查看
$ kill -9 进程ID
$ kill -SIGKILL 进程ID

2. 进程创建

2.1 函数

Linux中进程ID为 pid_t 类型，其本质是一个正整数

获取当前进程的进程ID(PID)

#include <sys/types.h>
#include <unistd.h>
pid_t getpid(void);

获取当前父进程的进程ID(PPID)

#include <sys/types.h>
#include <unistd.h>
pid_t getppid(void);

创建一个新的进程

#include <unistd.h>
pid_t fork(void);

2.2 fork()函数

fork 函数是在Unix/Linux操作系统中用于创建新进程的系统调用之一。调用 fork 会创建一个与调用进程几乎完全相同的新进程，这两个进程将在不同的内存空间中运行。

基本语法：

#include <unistd.h>

pid_t fork(void);

返回值：
- 在父进程中，fork 返回新创建子进程的进程ID（PID）。
- 在子进程中，fork 返回0。
- 如果出现错误，返回-1。

工作原理：

当 fork 被调用时，它会复制调用进程的内存和资源（文件描述符、环境变量等）。
在父进程和子进程中，fork 返回不同的值，这样程序可以根据返回值来确定自己是父进程还是子进程。
子进程是父进程的副本，它从 fork 返回的位置开始执行。

示例：

#include <stdio.h>
#include <unistd.h>

int main() {
    pid_t pid;

    pid = fork();

    if (pid == -1) {
        // 错误处理
        perror("fork");
        return 1;
    } else if (pid > 0) {
        // 父进程
        printf("Parent process, child PID = %d\n", pid);
    } else {
        // 子进程
        printf("Child process\n");
    }

    // 父子进程都会执行到这里
    printf("This is common code for both parent and child\n");

    return 0;
}

这段代码调用 fork 创建一个新的进程。父进程得到子进程的PID，而子进程得到0。接下来，父子进程都会执行相同的代码，但可以通过 if (pid > 0) 判断来执行不同的逻辑。

需要注意的是，fork 创建的新进程是父进程的副本，但并不共享父进程和子进程之间的变量。如果在父子进程中都修改同一个变量，它们互不影响。

3. 父子进程

3.1 子进程执行位置

父进程肯定是从main()函数开始运行的，子进程是在父进程中调用fork()函数之后被创建, 子进程就从fork()之后开始向下执行代码。

在这里插入图片描述

3.2 循环创建子进程

我们可以只让父进程创建子进程，如果是子进程不让其继续创建子进程，因此只需要在程序中添加关于父子进程的判断即可。

// 需要在上边的程序中控制不让子进程, 再创建子进程即可
// process_loop.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>

int main()
{
    pid_t pid;
    // 在循环中创建子进程
    for(int i=0; i<3; ++i)
    {
        pid = fork();
        if(pid == 0)
        {
            // 不让子进程执行循环, 直接跳出
            break;
        }
    }
    printf("当前进程pid: %d\n", getpid());

    return 0;
}

3.3 终端显示问题

执行上述代码后会出现以下显示问题, 回车后即可恢复

在这里插入图片描述

a.out 进程启动之后，共创建了3个子进程，其实 a.out 也是有父进程的就是当前的终端
终端只能检测到 a.out 进程的状态，a.out执行期间终端切换到后台，a.out执行完毕之后终端切换回前台
当终端切换到前之后，a.out的子进程还没有执行完毕，当子进程输出的信息就显示到终端命令提示符的后边了，导致终端显示有问题，但是此时终端是可以接收键盘输入的，只是看起来不美观而已。
想要解决这个问题，需要让所有子进程退出之后再退出父进程，比如：在父进程代码中调用 sleep()

修改后的代码:

在这里插入图片描述

执行结果:

在这里插入图片描述

3.4 进程数数

当父进程创建一个子进程，那么父子进程之间可以通过全局变量互动，实现交替数数的功能吗？不过不确定可以写一段测试代码：

// number.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>

// 定义全局变量
int number = 10;

int main()
{
    printf("创建子进程之前 number = %d\n", number);

    pid_t pid = fork();
    // 父子进程都会执行这一行
    printf("当前进程fork()的返回值: %d\n", pid);

    //如果是父进程
    if(pid > 0)
    {
        printf("我是父进程, pid = %d, number = %d\n", getpid(), ++number);
        printf("父进程的父进程(终端进程), pid = %d\n", getppid());
        sleep(1);
    }
    else if(pid == 0)
    {
        // 子进程
        number += 100;
        printf("我是子进程, pid = %d, number = %d\n", getpid(), number);
        printf("子进程的父进程, pid = %d\n", getppid());
    }

    return 0;
}

结果:

在这里插入图片描述

两个进程中是不能通过全局变量实现数据交互的，因为每个进程都有自己的地址空间，两个同名全局变量存储在不同的虚拟地址空间中，二者没有任何关联性。如果要进行进程间通信需要使用：管道，共享内存，本地套接字，内存映射区，消息队列等方式。

4. exexl 和 execlp函数

在项目开发过程中，有时候有这种需求，需要通过现在运行的进程启动磁盘上的另一个可执行程序，也就是通过一个进程启动另一个进程，这种情况下我们可以使用 exec族函数

也就是说 exec族函数并没有创建新进程的能力，只是有大无畏的牺牲精神，让起启动的新进程寄生到自己虚拟地址空间之内，并挖空了自己的地址空间用户区，把新启动的进程数据填充进去。

4.1 execl()

#include <unistd.h>
// 变参函数
int execl(const char *path, const char *arg, ...);

参数:

path: 要启动的可执行程序的路径, 推荐使用绝对路径
arg: ps aux 查看进程的时候, 启动的进程的名字, 可以随意指定, 一般和要启动的可执行程序名相同
… : 要执行的命令需要的参数，可以写多个，最后以 NULL 结尾，表示参数指定完了。

返回值：如果这个函数执行成功, 没有返回值，如果执行失败, 返回 -1

4.2 execlp()

该函数常用于执行已经设置了环境变量的可执行程序, 因此使用这个函数执行可执行程序不需要指定路径，只需要指定出名字即可。

// p == path
int execlp(const char *file, const char *arg, ...);

参数:

file: 可执行程序的名字
- 在环境变量PATH中，可执行程序可以不加路径
- 没有在环境变量PATH中, 可执行程序需要指定绝对路径
arg: ps aux 查看进程的时候, 启动的进程的名字, 可以随意指定, 一般和要启动的可执行程序名相同
… : 要执行的命令需要的参数，可以写多个，最后以 NULL 结尾，表示参数指定完了。

返回值：如果这个函数执行成功, 没有返回值，如果执行失败, 返回 -1

4.3 函数的使用

一般不会在进程中直接调用这个函数, 因为这样的话这个进程的代码区代码会被替换, 我们一般在调用这些函数的时候都会先创建一个子进程，在子进程中调用 exec 族函数，子进程的用户区数据被替换掉开始执行新的程序中的代码逻辑，但是父进程不受任何影响仍然可以继续正常工作。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>

int main()
{
    // 创建子进程
    pid_t pid = fork();
    // 在子进程中执行磁盘上的可执行程序
    if(pid == 0)
    {
        // 磁盘上的可执行程序 /bin/ps
#if 1
        execl("/bin/ps", "title", "aux", NULL);
        // 也可以这么写
        // execl("/bin/ps", "title", "a", "u", "x", NULL);
#else
        execlp("ps", "title", "aux", NULL);
        // 也可以这么写
        // execl("ps", "title", "a", "u", "x", NULL);
#endif
        // 如果成功当前子进程的代码区别 ps中的代码区代码替换
        // 下面的所有代码都不会执行
        // 如果函数调用失败了,才会继续执行下面的代码
        perror("execl");
        printf("++++++++++++++++++++++++\n");
        printf("++++++++++++++++++++++++\n");
        printf("++++++++++++++++++++++++\n");
        printf("++++++++++++++++++++++++\n");
        printf("++++++++++++++++++++++++\n");
        printf("++++++++++++++++++++++++\n");
    }
    else if(pid > 0)
    {
        printf("我是父进程.....\n");
    }

    return 0;
}

在这里插入图片描述

5. 进程控制

进程控制主要是指进程的退出, 进程的回收和进程的特殊状态孤儿进程和僵尸进程。

5.1 结束进程

如果想要直接退出某个进程可以在程序的任何位置调用exit()或者_exit()函数。函数的参数相当于退出码

exit 函数是用于终止程序的标准库函数，它可在C和C++中使用。当程序执行到 exit 函数时，它会正常退出，并返回一个状态码给操作系统。

基本语法：

#include <stdlib.h>

void exit(int status);

status：指定要返回给操作系统的状态码。通常，0 表示正常退出，非零值表示异常退出或错误状态。

示例：

#include <stdio.h>
#include <stdlib.h>

int main() {
    printf("Before exit function\n");

    // 使用 exit 函数退出程序，返回状态码 0
    exit(0);

    // 以下代码不会执行
    printf("After exit function\n");

    return 0;
}

在这个例子中，当程序执行到 exit(0) 时，程序将立即终止，不会执行后面的代码。此时，操作系统将收到状态码 0，表示程序正常退出。

exit 函数的主要作用是确保程序在退出时执行一些清理工作，例如关闭文件、释放动态分配的内存等。如果不使用 exit 而直接让 main 函数返回，那么可能会导致一些清理工作无法完成。

5.2 孤儿进程

在操作系统中，**孤儿进程是指其父进程先于它自己退出，导致它成为孤立的进程。**当一个进程创建子进程，而子进程的父进程在子进程退出之前就已经终止，这个子进程就会变成孤儿进程。

孤儿进程通常会被 init 进程（在现代系统中可能是 systemd 或其他类似的进程）接管。init 进程(PID= 1)会定期检查系统中是否存在孤儿进程，并负责清理这些进程的资源，防止它们变成僵尸进程。

以下是孤儿进程的主要特征和处理方式：

没有父进程： 孤儿进程的父进程已经退出，因此它没有父进程。
接管： 通常由 init 进程或类似的进程接管。init 进程会通过 wait 或类似的机制来收集孤儿进程的退出状态，确保它们正常终止。
不影响系统正常运行： 孤儿进程并不会影响系统的正常运行，但它们可能会占用系统资源，因此需要及时被清理。

下面是一个产生孤儿进程的简单示例，使用 fork 创建子进程，并在子进程中让它先于父进程退出：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == -1) {
        perror("fork");
        return 1;
    } else if (pid > 0) {
        // 父进程
        printf("Parent process (PID=%d) is sleeping...\n", getpid());
        sleep(2);
        printf("Parent process exits.\n");
    } else {
        // 子进程
        printf("Child process (PID=%d) exits.\n", getpid());
        exit(0);
    }

    return 0;
}

在这个例子中，子进程在创建后立即退出，而父进程会休眠一段时间后退出。因此，子进程成为了一个孤儿进程。

5.3 僵尸进程

在一个启动的进程中创建子进程，这时候就有了父子两个进程，父进程正常运行, 子进程先与父进程结束, 子进程无法释放自己的PCB资源, 需要父进程来做这个件事儿, 但是如果父进程也不管, 这时候子进程就变成了僵尸进程。

僵尸进程不能将它看成是一个正常的进程，这个进程已经死亡了，用户区资源已经被释放了，只是还占用着一些内核资源（PCB）。

要处理僵尸进程，父进程通常需要调用 wait 或 waitpid 等系统调用，以获取子进程的终止状态。一旦父进程处理了子进程的终止状态，该子进程的资源就会被释放，它不再是僵尸进程。

以下是一个简单的示例，演示了一个父进程创建子进程，然后父进程休眠一段时间，导致子进程成为僵尸进程：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == -1) {
        perror("fork");
        return 1;
    } else if (pid > 0) {
        // 父进程
        printf("Parent process (PID=%d) is sleeping...\n", getpid());
        sleep(5); // 父进程休眠一段时间，让子进程成为僵尸进程
        printf("Parent process exits.\n");
    } else {
        // 子进程
        printf("Child process (PID=%d) exits.\n", getpid());
        exit(0);
    }

    return 0;
}

消灭僵尸进程的方法是，杀死这个僵尸进程的父进程，这样僵尸进程的资源就被系统回收了。通过kill -9 僵尸进程PID的方式是不能消灭僵尸进程的，这个命令只对活着的进程有效，僵尸进程已经死了

5.4 进程回收

在父进程中进行子进程的资源回收，回收方式有两种，一种是阻塞方式wait()，一种是非阻塞方式waitpid()。

5.4.1 wait

这是个阻塞函数，**如果没有子进程退出, 函数会一直阻塞等待, 当检测到子进程退出了, 该函数阻塞解除回收子进程资源。font>**这个函数被调用一次, 只能回收一个子进程的资源，如果有多个子进程需要资源回收, 函数需要被调用多次。

基本语法：

#include <sys/types.h>
#include <sys/wait.h>

pid_t wait(int *status);

status：用于存储子进程终止状态的指针。可以为NULL，表示不关心子进程的终止状态。

在这里插入图片描述

返回值：如果成功，返回被等待子进程的进程ID（PID）。如果调用出错，返回-1，并设置 errno 表示错误类型。

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == -1) {
        perror("fork");
        return 1;
    } else if (pid > 0) {
        // 父进程
        printf("Parent process (PID=%d) is waiting for the child process...\n", getpid());

        int status;
        pid_t terminated_child = wait(&status);

        if (terminated_child == -1) {
            perror("wait");
            return 1;
        }

        if (WIFEXITED(status)) {
            printf("Child process (PID=%d) exited with status %d.\n", terminated_child, WEXITSTATUS(status));
        } else if (WIFSIGNALED(status)) {
            printf("Child process (PID=%d) terminated by signal %d.\n", terminated_child, WTERMSIG(status));
        }

        printf("Parent process exits.\n");
    } else {
        // 子进程
        printf("Child process (PID=%d) exits.\n", getpid()); 
        exit(0); // 子进程退出后, 上面的wait函数解除阻塞
    }

    return 0;
}

在这里插入图片描述

5.4.2 waitpid

waitpid 函数是用于等待指定子进程终止并获取其终止状态的系统调用。与 wait 不同，waitpid 允许指定等待的子进程，从而可以避免等待所有子进程的终止。

#include <sys/types.h>
#include <sys/wait.h>

pid_t waitpid(pid_t pid, int *status, int options);

参数:

pid:
- -1：回收所有的子进程资源, 和wait()是一样的, 无差别回收，并不是一次性就可以回收多个, 也是需要循环回收的
- 大于0：指定回收某一个进程的资源，pid是要回收的子进程的进程ID
- 0：回收当前进程组的所有子进程ID
- 小于 -1：pid 的绝对值代表进程组ID，表示要回收这个进程组的所有子进程资源
status: NULL, 和wait的参数是一样的
options: 控制函数是阻塞还是非阻塞
- 0: 函数是行为是阻塞的 ==> 和wait一样
- WNOHANG: 函数是行为是非阻塞的

返回值:

如果函数是非阻塞的, 并且子进程还在运行, 返回0
成功: 得到子进程的进程ID
失败: -1
- 没有子进程资源可以回收了, 函数如果是阻塞的, 阻塞会解除, 直接返回-1
- 回收子进程资源的时候出现了异常

阻塞回收的例子和wait基本一样, 举一个非阻塞回收的例子:

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == -1) {
        perror("fork");
        return 1;
    } else if (pid > 0) {
        // 父进程
        printf("Parent process (PID=%d) is waiting for the child process...\n", getpid());

        int status;
        int options = WNOHANG;  // 使用 WNOHANG 选项，非阻塞等待
        pid_t terminated_child;

        do {
            terminated_child = waitpid(pid, &status, options);
            
            if (terminated_child == -1) {
                perror("waitpid");
                return 1;
            }

            if (terminated_child == 0) {
                // 子进程还没有终止
                printf("No child process has terminated yet. Sleeping for a while...\n");
                sleep(1);
            }

        } while (terminated_child == 0);

        if (WIFEXITED(status)) {
            printf("Child process (PID=%d) exited with status %d.\n", terminated_child, WEXITSTATUS(status));
        } else if (WIFSIGNALED(status)) {
            printf("Child process (PID=%d) terminated by signal %d.\n", terminated_child, WTERMSIG(status));
        }

        printf("Parent process exits.\n");
    } else {
        // 子进程
        printf("Child process (PID=%d) exits.\n", getpid());
        exit(0);
    }

    return 0;
}