概述
在Linux系统中,进程是指一个正在运行的程序实例。每个进程都有一个唯一的进程标识符,即PID,操作系统通过这个PID来唯一识别和管理各个进程。进程不仅仅是程序代码的运行实例,它还包含了程序运行时所需的各种资源,包括:内存空间、文件描述符、输入输出设备等。
进程的组成
一个Linux进程主要由以下几个部分组成。
程序段:进程执行的机器指令,通常是从磁盘或Flash上的可执行文件加载到内存中的。
数据段:包含全局变量和静态变量,通常也被加载到内存中。
堆:动态分配的内存区域,用于存储动态分配的数据结构,比如:通过malloc或new分配的内存。
栈:用于存储函数调用时的局部变量和函数参数,每次函数调用都会在栈上分配一个新的栈帧。
文件描述符表:用于记录进程打开的文件和网络连接等,每个进程都有一个文件描述符表。
进程控制块:英文全称为Process Control Block,通常简写为PCB。操作系统为每个进程维护的一个数据结构,记录了进程的所有相关信息,包括PID、状态、内存分配情况等。
进程的状态
Linux进程的生命周期是指从进程被创建开始,到进程终止并释放所有资源为止的整个过程。在这个过程中,进程会经历不同的状态,并随着系统环境和任务需求的变化而在这些状态之间转换。
一个典型的Linux进程,其生命周期通常包括以下几个阶段。
创建:通过fork系统调用,创建一个新的进程。
执行:进程在CPU上执行,可能经历多次状态转换。
阻塞:进程因等待I/O操作或其他事件,暂停执行。
终止:进程正常结束,或因错误而终止。
回收:父进程通过wait或waitpid系统调用,回收子进程的资源。
在Linux系统中,进程可以处于以下几种状态之一。
就绪状态:进程已经准备好运行,等待CPU时间片。
运行状态:进程正在CPU上执行。
阻塞状态:进程因为等待某些事件的发生而暂停运行,如等待I/O操作完成。
终止状态:进程已经完成或者因错误而终止。
僵尸状态:进程已经结束,但其父进程尚未调用 wait 或 waitpid 函数回收其资源。
停止状态:进程被暂停执行,通常是因为接收到 SIGSTOP 或 SIGTSTP 信号。
进程的上述状态之间可以互相转换,常见的状态转换如下。
就绪 -> 运行:当进程被调度程序选中,并分配到CPU上执行时,从就绪状态转换为运行状态。
运行 -> 就绪:当进程的时间片用尽,或被更高优先级的进程抢占时,从运行状态转换为就绪状态。
运行 -> 阻塞:当进程等待I/O操作完成,或其他事件发生时,从运行状态转换为阻塞状态。
阻塞 -> 就绪:当进程等待的事件发生后,从阻塞状态转换为就绪状态。
运行 -> 终止:当进程正常结束,或因错误终止时,从运行状态转换为终止状态。
终止 -> 僵尸:当进程结束,但父进程尚未回收其资源时,从终止状态转换为僵尸状态。
运行 -> 停止:当进程接收到SIGSTOP或SIGTSTP信号时,从运行状态转换为停止状态。
停止 -> 运行:当进程接收到SIGCONT信号时,从停止状态转换为运行状态。
为了更清晰地查看进程状态之间的转换过程,可参考下面的状态转换图。
如果想查看进程的当前状态,可以使用ps、top等命令。比如:使用ps aux命令可以查看系统中所有进程的详细信息,包括:状态、PID、CPU使用率、内存使用率等。
进程控制块
进程控制块,即PCB,是操作系统为每个进程维护的一个数据结构,记录了进程的所有相关信息。PCB是系统感知进程存在的唯一标志,系统通过PCB来管理和控制进程。PCB可以被操作系统中的多个模块读取或修改,比如:调度程序、资源分配程序、中断处理程序等。这些模块通过访问或修改PCB,来管理和控制进程的执行状态和资源分配情况。
PCB中包含的主要信息如下。
进程标识符:即PID,唯一标识进程的整数。PID在任何时刻都是唯一的,但可以重用。当进程终止并被系统回收后,其PID可以被其他新创建的进程使用。
进程状态:记录进程当前所处的状态。
程序计数器:指向进程下一条要执行的指令。
寄存器状态:保存进程的寄存器值,用于进程切换时恢复现场。
内存管理信息:包括进程的虚拟地址空间、页表等。
文件描述符表:记录进程打开的文件和网络连接等。
优先级:用于调度程序确定进程的优先级。
父进程ID:记录创建该进程的父进程的PID。
子进程列表:记录该进程创建的所有子进程的PID。
资源限制:包括进程可以使用的最大内存、文件描述符数量等。
// 进程控制块PCB
struct task_struct
{
pid_t pid; // 进程ID
char comm[16]; // 进程名
mm_struct *mm; // 内存描述符
files_struct *files; // 文件描述符表
fs_struct *fs; // 文件系统信息
signal_struct *signal; // 信号处理信息
thread_info *thread_info; // 线程信息
struct list_head tasks; // 进程链表节点
struct task_struct *parent; // 父进程指针
struct task_struct *children; // 子进程链表头
struct task_struct *sibling; // 兄弟进程链表
unsigned long state; // 进程状态
int priority; // 进程优先级
int nice; // 进程的nice值
int static_prio; // 静态优先级
int policy; // 调度策略
struct sched_param sched_param; // 调度参数
unsigned long flags; // 进程标志
unsigned long timeout; // 超时时间
unsigned long rt_priority; // 实时优先级
unsigned long deadline; // 截止时间
unsigned long runtime; // 运行时间
unsigned long vruntime; // 虚拟运行时间
unsigned long utime; // 用户模式下的运行时间
unsigned long stime; // 内核模式下的运行时间
unsigned long nvcsw; // 自愿上下文切换次数
unsigned long nivcsw; // 非自愿上下文切换次数
unsigned long start_time; // 进程启动时间
unsigned long exit_time; // 进程退出时间
// ...
};
进程调度
Linux系统中的所有进程形成一个树状结构,称为进程树。进程树的根节点是进程ID为1的init进程,它是系统启动后的第一个进程,负责启动其他系统进程和服务。每个进程都可以创建子进程,子进程又可以创建自己的子进程,从而形成一个多级的进程树。
Linux内核负责决定哪个进程何时获得CPU时间,调度算法决定了进程的优先级和执行顺序,常见的调度策略如下。
先来先服务:英文全称为“First-Come, First-Served”,缩写为FCFS。FCFS是一种简单的调度算法,按照进程到达的顺序进行调度。第一个到达的进程最先执行,然后是第二个到达的进程,依此类推。FCFS算法逻辑简单,容易理解和实现。但不够公平,缺乏优先级。比如:如果一个长作业首先到达,它会占用CPU较长时间,导致后续到达的短作业等待时间过长。
短作业优先:英文全称为“Shortest Job First”,缩写为SJF。SJF是一种基于进程预计执行时间的调度算法,优先调度执行时间较短的进程。SJF可以减少平均等待时间,提高系统的整体吞吐量。但必须预先知道或估计每个进程的执行时间,这在实际应用中可能难以实现。
时间片轮转:英文全称为“Round Robin”,缩写为RR。RR是一种基于时间片的调度算法,每个进程轮流分配固定的时间片,时间片用尽后切换到下一个进程。这样,每个进程都能获得平等的CPU时间,避免了某些进程长时间占用CPU。RR适用于交互式系统,可以快速响应用户的输入,但频繁的上下文切换可能会增加系统开销。
优先级调度:英文全称为“Priority Scheduling”,缩写为PS。PS根据进程的优先级进行调度,高优先级的进程优先获得CPU时间。它的特点是比较灵活,可以根据进程的重要性和紧急程度动态调整优先级。缺点是低优先级的进程可能会因为高优先级进程的存在,而长期得不到CPU时间。
完全公平调度:英文全称为“Completely Fair Scheduler”,缩写为CFS。CFS是Linux内核从版本2.6.23开始采用的默认调度算法,其设计目标是:在所有可运行的任务之间公平地分配CPU时间,确保没有任务长期得不到处理。CFS的主要特点有以下几点。
(1)公平性。CFS使用一个称为虚拟运行时间的概念来衡量任务的执行时间,虚拟运行时间反映了任务相对于其他任务的执行情况。另外,CFS使用红黑树来维护等待执行的任务列表。任务根据其虚拟运行时间进行排序,确保运行时间最少的任务优先得到CPU时间。
(2)可预测性。CFS提供了确定性的响应时间,实时任务优先于普通任务执行,这对于需要及时响应的应用程序非常重要。
(3)适应性。CFS能够动态调整其行为,以适应不同的工作负载,包括:交互式应用和批处理任务。在多核系统中,CFS尝试将任务分配到不同的核心上,以减少CPU的空闲时间。
(4)调度延迟。CFS会设定一个目标调度周期(通常为100毫秒),并试图让所有任务在这个周期内至少执行一次。CFS还会动态调整每个任务的时间片,确保运行时间较少的任务获得更多的机会。
(5)优先级支持。CFS根据nice值调整任务的权重,从而影响其虚拟运行时间。