Linux多进程和多线程(一)

进程

进程的概念

进程（Process）是操作系统对一个正在运行的程序的一种抽象。它是系统运行程序的最小单位，是资源分配和调度的基本单位。

进程的特点如下

进程是⼀个独⽴的可调度的活动, 由操作系统进⾏统⼀调度, 相应的任务会被调度到cpu 中进⾏执⾏
进程⼀旦产⽣，则需要分配相关资源，同时进程是资源分配的最⼩单位

进程和程序的区别

程序是静态的，它是⼀些保存在磁盘上的指令的有序集合，没有任何执⾏的概念
进程是⼀个动态的概念，它是程序执⾏的过程，包括了动态创建、调度和消亡的整个过程
并⾏执⾏ : 表示多个任务能够同时执⾏，依赖于物理的⽀持，⽐如 cpu是4核⼼，则可以同时执⾏4个任务
并发执⾏ : 在同⼀时间段有多个任务在同时执⾏，由操作系统调度算法来实现，⽐较典型的就是时间⽚轮转

LINUX进程管理

在 Linux 系统中管理进程使⽤树型管理⽅式

每个进程都需要与其他某⼀个进程建⽴⽗⼦关系, 对应的进程则叫做⽗进程
Linux 系统会为每个进程分配 id , 这个 id 作为当前进程的唯⼀标识, 当进程结束, 则会回收

进程的 id 与⽗进程的 id 分别可以通过 getpid() 与 getppid() 来获取

getpid()

#include <unistd.h>

pid_t getpid(void);

该函数用来获取当前进程的 id

getppid()

#include <unistd.h>

pid_t getppid(void);

该函数用来获取当前进程的⽗进程的 id

进程的地址空间

⼀旦进程建⽴之后, 系统则要为这个进程分配相应的资源, ⼀般系统会为每个进程分配 4G 的地址空间
4G 的进程地址空间主要分为两部分:
0 - 3G : ⽤户空间
3G - 4G ：内核空间
⽤户空间⼜具体分为如下区间

stack : 存放⾮静态的局部变量

heap : 动态申请的内存

.bss : 未初始化过的全局变量（包括初始化为 0 的, 未初始化过的静态变量 (包括初始化为 0)

.data : 初始化过并且值不为 0 的全局变量, 初始化过的不为 0 静态变量

.rodata : 只读变量（字符串之类）

.text : 程序⽂本段（包括函数，符号常量）

当⽤户进程需要通过内核获取资源时, 会切换到内核态运⾏, 这时当前进程会使⽤内核空间的资源⽤户需要切换到内核态运⾏时, 主要是通过系统调⽤

虚拟地址和物理地址

虚拟地址 : 程序运行时使用的地址, 由操作系统管理, 程序只能通过虚拟地址访问内存
物理地址 : 实际物理内存中存储数据的地址, 由硬件管理, 程序只能通过物理地址访问内存
虚拟地址和物理地址的转换关系由操作系统完成, 程序只能通过虚拟地址访问内存
虚拟地址空间和物理地址空间的映射关系由操作系统完成, 程序只能通过虚拟地址访问内存

在 cpu 中有⼀个硬件 MMU(内存管理单元) , 负责虚拟地址与物理地址的映射管理以
及虚拟地址访问
操作系统可以设置 MMU 中的映射内存段

在这里插入图片描述

在操作系统中使⽤虚拟地址空间主要是基于以下原因:
直接访问物理地址, 会导致地址空间没有隔离, 很容易导致数据被修改
通过虚拟地址空间可以实现每个进程地址空间都是独⽴的，操作系统会映射到不⽤的
物理地址区间，在访问时互不⼲扰.

进程状态管理

进程是动态过程，操作系统内核在管理整个动态过程时会使⽤了
状态机,

给不同时间节点设计⼀个状态，通过状态来确定当前的过程进度
在管理动态过程时，使⽤状态机是⼀种⾮常好的⽅式

进程的状态⼀般分为如下

运⾏态 (TASK_RUNNING) : 此时进程或者正在运⾏，或者准备运⾏, 就绪或者正在进⾏都属于运⾏态
睡眠态 () : 此时进程在等待⼀个事件的发⽣或某种系统资源

可中断的睡眠 (TASK_INTERRUPT) : 可以被信号唤醒或者等待事件或者资源就绪

不可中断的睡眠 (TASK_UNTERRUPT) : 只能等待特定的事件或者资源就绪

停⽌态 (TASK_STOPPED) : 进程暂停接受某种处理。例如：gdb 调试断点信息处理。
僵死态（TASK_ZOMBIE）：进程已经结束但是还没有释放进程资源

在这里插入图片描述

进程相关命令

ps

参数:

-e 显示所有进程
-f 显示进程详细信息
-l 显示进程详细信息，包括线程信息
-u 显示指定用户的进程
-aux 显示所有进程，包括其他用户的进程

ps -aux
ps -ef | grep " 进程名 "  # 查找进程

top

实时显示系统中进程的运行状态

top [-] [d delay] [q] [c] [S] [s] [i] [n] [b]

选项:

d : 改变显示的更新速度，或是在交谈式指令列 (interactive command) 按 s
q : 没有任何延迟的显示速度，如果使⽤者是有 superuser 的权限，则 top 将会以最⾼的优先序执⾏
c : 切换显示模式，共有两种模式，⼀是只显示执⾏档的名称，另⼀种是显示完整的路径与名称
S : 累积模式，会将⼰完成或消失的⼦进程 (dead child process) 的 CPU time 累积起来
s : 安全模式，将交谈式指令取消, 避免潜在的危机
i : 不显示任何闲置 (idle) 或⽆⽤ (zombie) 的进程
n : 更新的次数，完成后将会退出 top
b : 批次档模式，搭配 “n” 参数⼀起使⽤，可以⽤来将 top 的结果输出到档案内

top - 14:34:29 up 7 days, 18:51, 1 user, load average: 1.00, 0.95, 0.61

top：名称
14:34:29 ：系统当前时间
up 7 days, 14:30：系统以及运⾏的时间，和 uptime 命令相等
1 users：当前有 1 个⽤户在线
load average: 1.00, 0.95, 0.61：系统负载，即任务队列的平均⻓度。三个数值分别为 1 分钟、5 分钟、15 分钟前到现在的平均值。

Tasks: 290 total, 2 running, 287 sleeping, 0 stopped, 1 zombie

Tasks：任务，也就是进程
290 total：当前总共有 290 个任务，也就是 290 个进程
2 running：2 个进程正在运⾏
287 sleeping：263 个进程正在休眠
0 stopped：0 个停⽌的进程
1 zombie：1 个僵⼫进程

%Cpu(s): 51.0 us, 0.7 sy, 0.0 ni, 47.8 id, 0.0 wa, 0.0 hi, 0.5 si, 0.0 st

%Cpu(s)：CPU 使⽤率
51.0 us：⽤户空间占⽤ CPU 时间的百分⽐（⼤部分进程都运⾏在⽤户态，通常都是希望⽤户空间 CPU 越⾼越好）
0.7 sy：内核空间占⽤ CPU 时间的百分⽐（Linux 内核态占⽤的 CPU 时间，系统 CPU 占⽤越⾼，表明系统某部分存在瓶颈。通常这个值越低越好）
0.0 ni：占⽤ CPU 时间的百分⽐（ni 是 nice 的缩写，进程⽤户态的优先级，如果调整过优先级，那么展示的就是调整过 nice 值的进程消耗掉的 CPU 时间，如果系统中没有进程被调整过 nice 值，那么 ni 就显示为 0）
47.8 id：空闲 CPU 占⽤率，等待进程运⾏
0.0 wa：等待输⼊输出的 CPU 时间百分⽐（CPU 的处理速度是很快的，磁盘 IO 操作是⾮常慢的。wa 表示 CPU 在等待 IO 操作完成所花费的时间。系统不应该花费⼤量的时间来等待 IO操作，否则就说明 IO 存在瓶颈）
0.0 hi：CPU 硬中断时间百分⽐（硬中断是硬盘、⽹卡等硬件设备发送给 CPU 的中断消息）
0.5 si：CPU 软中断时间百分⽐（软中断是由程序发出的中断）
0.0 st：被强制等待（involuntary wait）虚拟 CPU 的时间，此时 Hypervisor 在为另⼀个虚拟处理器服务。

MiB Mem : 3889.9 total, 366.0 free, 1535.2 used, 1988.6 buﬀ/cache

MiB Mem：内存
3889.9 total：物理内存总量
366.0 free：空闲内存量
1535.2 used：已使⽤的内存量
1988.6 buﬀ/cache：⽤作内核缓存的内存量

MiB Swap: 2048.0 total, 2035.2 free, 12.8 used. 2082.9 avail Mem

MiB Swap：交换空间（虚拟内存，当内存不⾜的时候，把⼀部分硬盘空间虚拟成内存使⽤）
2048.0 total：交换区总量
2035.2 free：空闲交换区总量
12.8 used：使⽤的交换区总量
2082.9 avail Mem：可⽤于启动⼀个新应⽤的内存（物理内存），和 free 不同，它计算的是可回收的 page cache 和 memory slab

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

PID：进程 id
USER：进程所有者
PR：进程的优先级，越⼩优先级越⾼
NI：nice 值，负值表示⾼优先级，正值表示低优先级
VIRT：进程使⽤的虚拟内存，单位是 kb
RES：进程使⽤的物理内存，单位 kb
SHR：进程使⽤的共享内存，单位 kb
S：进程状态（S 表示休眠，R 表示正在运⾏， Z 表示僵死状态，N 表示该进程优先值为负数，I 表示空闲状态）
%CPU：进程占⽤ CPU 时间的百分⽐
%MEM：进程占⽤内存的百分⽐
TIME+：进程实际运⾏的时间
COMMAND：进程的名称

pstree

显示进程树

在这里插入图片描述

kill

kill 命令是⽤于结束进程的命令或者⽤于显示相关信号

kill [选项] [参数]

选项:

-l ：显示信号名称
-s ：指定发送的信号
-a ：杀死进程组中的所有进程
-p ：杀死进程组中的进程，并将它们从进程组中剔除
-u ：指定用户
-signal ：发送指定的信号

参数:

进程号：要结束的进程号

进程的创建

并发和并行

并发：多个任务在同⼀时间段被调度运行，⽐如同时有两个任务在运行，这就是并发。在有限的 cpu 核⼼的情况下（如只有⼀个 cpu 核⼼) , 利⽤快速交替 (时间⽚轮
转) 执⾏来达到宏观上的同时执⾏
并行：多个任务在不同时间段被调度运行，⽐如同时有两个任务在不同 CPU 上运行，这就是并行。在 cpu 多核的⽀持下，实现物理上的同时执⾏

并⾏是基于硬件完成，⽽并发则可以使⽤软件算法来完成, 在完成任务时，可以创建多个进程并发执⾏

fork()

创建子进程

返回值:

0：子进程
-1：出错
创建子进程的过程:
父进程 fork() 系统调用，创建子进程，返回子进程的进程号
子进程复制父进程的地址空间
子进程从 fork() 系统调用返回，父进程继续执行

⽗⼦进程并发执⾏, ⼦进程从 fork() 之后开始执⾏
⽗⼦进程的执⾏顺序由操作系统算法决定的，不是由程序本身决定
⼦进程会拷⻉⽗进程地址空间的内容, 包括缓冲区、⽂件描述符等 (COPY ON WRITE)

父子进程执行不同的任务

使用 fork() 创建子进程，⽗进程和⼦进程可以并发执⾏不同的任务，
执行不同的任务需要利用fork()函数返回值

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>
int main(void)
{
    pid_t cpid;
    cpid = fork();
    if (cpid == -1){
        perror("[ERROR] fork()");
        exit(EXIT_FAILURE);
    }else if(cpid == 0){// 子进程
        printf("Child process task.\n");
        exit(EXIT_SUCCESS);
    }else if (cpid > 0){// 父进程
        printf("Parent process task.\n");
    }
    //父子进程都要执行的代码
    printf("Child and Process Process task.\n");
return 0;
}

创建多个进程

在创建多个进程时, 最主要的原则为由⽗进程统⼀创建，统⼀管理, 不能进⾏递归创建

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>


int main(){
    int cpid;
    cpid = fork();
    if (cpid == -1){
        perror("fork(): ");
        exit(EXIT_FAILURE);
    }else if (cpid == 0){// 子进程
        printf("The child process < %d > running...\n",getpid());
        sleep(2);
        printf("The child process < %d > has exited\n",getpid());
        exit(EXIT_SUCCESS);
    }else if (cpid > 0){// 父进程
        cpid = fork();
        if (cpid == -1){
            perror("fork(): ");
        }else if (cpid == 0){
            printf("The child process < %d > running...\n",getpid());
            sleep(3);
            printf("The child process < %d > has exited\n",getpid());
            exit(EXIT_SUCCESS);
        }else if (cpid > 0){

        }
    }
    return 0;
}

进程的退出

在进程结束时，需要释放进程地址空间以及内核中产⽣的各种数据结构
资源的释放需要通过调⽤ exit 函数或者 _exit 函数来完成
在程序结束时，会自动调⽤ exit 函数

exit()和_exit()

exit()函数让当前进程退出,并且刷新缓冲区

#include <stdlib.h>
void exit(int status);

参数:

status：进程退出状态
系统中定义了 EXIT_SUCCESS 和 EXIT_FAILURE 两个宏，用来表示成功和失败的状态码,具体定义在头文件 stdlib.h 中

#define EXIT_FAILURE 1
#define EXIT_SUCCESS 0

示例:
创建⼀个⼦进程，让⼦进程延时 3 s 后退出


#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>
int main(){

pid_t cpid;
cpid = fork();
if (cpid == -1){
perror("[ERROR] fork(): ");
exit(EXIT_FAILURE);
}else if(cpid == 0){printf("Child Process < %d > running...\n",getpid());
sleep(3);
printf("Child Process < %d >  has exited.\n",getpid());
exit(EXIT_SUCCESS);
}else if(cpid > 0){
sleep(5);
}
return 0;
}

_exit()

exit 函数与 _exit 函数功能相似, 但有很多不同, 具体如下:

_exit() 属于系统调⽤, 能够使进程停⽌运⾏, 并释放空间以及销毁内核中的各种数据结构
exit() 基于_exit() 函数实现, 属于库函数, 可以清理 I/O 缓冲区

进程的等待

在⼦进程运⾏结束后，进⼊僵死状态, 并释放资源, ⼦进程在内核中的数据结构依然保留
⽗进程调⽤ wait() 与 waitpid() 函数等待⼦进程退出后，释放⼦进程遗留的资源

task_struct 结构体随着进程的创建而创建和销毁而销毁, 它包含了进程的所有信息, 包括进程号、进程状态、进程调度信息、进程资源使用信息等

wait()函数和 waitpid()函数

wait()函数

函数头文件

#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *wstatus);

功能:
让函数调⽤者进程进⼊到睡眠状态, 等待⼦进程进⼊僵死状态后，释放相关资源并返回

参数:

wstatus：指向整数的指针，用来接收⼦进程的退出状态

获取具体值需要使⽤ WEXITSTATUS() 宏定义

若成功，返回值是⼦进程的进程号
若出错，返回值是 -1

会阻塞调⽤者进程（⼀般为⽗进程）
在⼦进程状态为僵死态时，回收资源，并释放资源后返回

创建⼀个⼦进程, 延时 3s 后退出, ⽗进程等待⼦进程退出

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/wait.h>
int main(void)
{
    pid_t cpid;
    cpid = fork();
    if (cpid == -1){
        perror("[ERROR] fork(): ");
        exit(EXIT_FAILURE);
    }else if(cpid == 0){
        printf("The Child process < %d > running...\n",getpid());
        sleep(3);
        exit(88);
    }else if(cpid > 0){
        int rpid,status = 0;
        rpid = wait(&status);//会阻塞父进程,等待子进程的状态变化,自动释放资源并返回
        if (rpid == -1){
            perror("[ERROR] wait() : ");
            exit(EXIT_FAILURE);
        }
        printf("The Child Process < %d > has exited,exit code < %d >.\n",rpid,WEXITSTATUS(status));
    }
    return 0;
}

在 wait 存储在 satus 变量的值, 存储了很多信息, 通过⼀系列 W 开头的宏来解析获取

WIFEXITED(status) : 进程是否正常结束

WEXITSTATUS(wstatus) : 获取进程退出状态值, exit 函数的参数

WIFSIGNALED(wstatus) : 表示该⼦进程是否被信号结束的, 返回真，则表示被信号结束的

WTERMSIG(wstatus) : 返回结束该⼦进程的那个信号的信号值

WCOREDUMP(wstatus) : 表示该⼦进程被信号唤醒的

WIFSTOPPED(wstatus) : 表示该⼦进程是否被信号中⽌ (stop) 的 , 返回真，则表示是被信号中⽌的

waitpid()函数

waitpid 函数的功能与 wait 函数⼀样，但⽐ wait() 函数功能更强⼤, waitpid() 函数可以指定等待的进程

####函数头⽂件

#include <sys/types.h>
#include <sys/wait.h>

函数原型

pid_t waitpid(pid_t pid, int *wstatus, int options);

函数参数

pid : 进程 id

-1 : 可以等待任意⼦进程
>0 : 等待 id 为 pid 的进程

wstatus : 保存⼦进程退出状态值变量的指针

options : 选项

WNOHANG : ⾮阻塞选项 // 若没有可等待的进程, 则返回 0, 否则返回 -1
WUNTRACED : 等待被跟踪的进程
WCONTINUED : 继续被跟踪的进程
WEXITED : 等待退出的进程
WSTOPPED : 等待停止的进程
WNOWAIT : 不创建新的进程组

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/wait.h>
int main(void)
{
    pid_t cpid;
    cpid = fork();
    if (cpid == -1){
        perror("[ERROR] fork(): ");
        exit(EXIT_FAILURE);
    }else if(cpid == 0){
        printf("The Child process < %d > running...\n",getpid());
        sleep(3);
        exit(88);
    }else if(cpid > 0){int rpid,status = 0;
        //rpid = waitpid(-1,&status,0);//-1是等待任意子进程退出 // 0是默认阻塞的
        rpid = waitpid(-1,&status,WNOHANG);//WNOHANG是非阻塞
        if (rpid == -1){
            perror("[ERROR] wait() : ");
            exit(EXIT_FAILURE);
        }
#if 0
        //没有子进程退出就返回0
        while((rpid = waitpid(-1,&status,WNOHANG)) == 0){
}
#endif
        printf("The Child Process < %d > has exited,exit code < %d >.\n",rpid,WEXITSTATUS(status));
    }
    return 0;
}

进程的替换

创建⼀个进程后，pid 以及在内核中的信息保持保持不变, 但进程所执⾏的代码进⾏替换

作⽤ : 通过⼀个进程启动另外⼀个进程

应⽤场景:Linux 终端应⽤程序，执⾏命令时，通过创建⼀个进程后，在替换成命令的可执⾏程序再执⾏

在 Linux 系统中提供了⼀组⽤于进程替换的替换，共有 6 个函数

函数原型:

int execl (const char *__path, const char *__arg, ... / (char *) NULL */)
 > pathname 指向一个字符数组，即字符串。这个字符串表示可执行文件的路径
 > arg 指向一个字符数组，即命令行参数。这个参数列表可以为空。
 > 省略号 ... 表示可变参数列表，它允许传递任意数量的参数给可执行文件，包括命令行参数。在参数列表的最后必须以 (char *) NULL 来指示结束。
 > NULL 是一个字符型指针表示空值，用来指示参数列表的结束。


int execlp(const char *file, const char arg, … / (char *) NULL */);

int execle(const char *pathname, const char arg, … /, (char *) NULL, char *const envp[] */);

int execv(const char *pathname, char *const argv[]);

int execvp(const char *file, char *const argv[]);

int execvpe(const char *file, char *const argv[], char *const envp[]);

> 函数参数:
        path：可执文件的路径名
        file : 可执文件名，可以通过 path 环境变量指定的路径
        arg : 参数列表，以 NULL 结尾
        argv[] : 参数数组
        envp[] : 环境变量数组
> 函数返回值:
        成功 : 0
        失败 : -1

示例:通过 execl 函数族执⾏ ls -l 命令

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(void)
{
    int ret;

#if 0
    ret = execl("/bin/ls","ls","-l",NULL);//替换当前进程,启动ls命令
    if (ret == -1){
        perror("[ERROR] execl(): ");
        exit(EXIT_FAILURE);//退出当前进程
    }
#endif

    char *const argv[]={"ls","-l",NULL};//参数列表
    ret= execv("/bin/ls",argv);//替换当前进程,启动ls命令
    if (ret == -1){
        perror("[ERROR] execl(): ");
        exit(EXIT_FAILURE);
    }

     //env可以查看环境变量
    ret= execlp("ls","ls","-l",NULL);//函数会搜索环境变量当作路径
    if (ret == -1){
        perror("[ERROR] execl(): ");
        exit(EXIT_FAILURE);
    }

    
    return 0;
}
//这个操作替换了当前进程,启动了另外的程序
//一般是先创建子进程,然后在子进程中调用 execl 函数族,替换子进程
//替换当前进程,启动ls命令
    if (ret == -1){
        perror("[ERROR] execl(): ");
        exit(EXIT_FAILURE);//退出当前进程
    }
#endif

    char *const argv[]={"ls","-l",NULL};//参数列表
    ret= execv("/bin/ls",argv);//替换当前进程,启动ls命令
    if (ret == -1){
        perror("[ERROR] execl(): ");
        exit(EXIT_FAILURE);
    }

     //env可以查看环境变量
    ret= execlp("ls","ls","-l",NULL);//函数会搜索环境变量当作路径
    if (ret == -1){
        perror("[ERROR] execl(): ");
        exit(EXIT_FAILURE);
    }

    
    return 0;
}
//这个操作替换了当前进程,启动了另外的程序
//一般是先创建子进程,然后在子进程中调用 execl 函数族,替换子进程