写在最前
记录一下linux的进程学习专题
1. 程序和进程的区别
1.1 程序
程序是包含一系列信息的文件,这些信息描述了如何在运行时创建一个进程:
- 二进制格式标识:每个程序文件都包含用于描述可执行文件格式的元信息。内核利用此信息来解
释文件中的其他信息。(ELF可执行连接格式) - 机器语言指令:对程序算法进行编码。
- 程序入口地址:标识程序开始执行时的起始指令位置。
- 数据:程序文件包含的变量初始值和程序使用的字面量值(比如字符串)。
- 符号表及重定位表:描述程序中函数和变量的位置及名称。这些表格有多重用途,其中包括调试
和运行时的符号解析(动态链接)。 - 共享库和动态链接信息:程序文件所包含的一些字段,列出了程序运行时需要使用的共享库,以
及加载共享库的动态连接器的路径名。 - 其他信息:程序文件还包含许多其他信息,用以描述如何创建进程
1.2 进程
进程是正在运行的程序的实例。是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元
可以用一个程序来创建多个进程,进程是由内核定义的抽象实体,并为该实体分配用以执行程序的各项系统资源。从内核的角度看,进程由用户内存空间和一系列内核数据结构组成,其中用户内存空间包含了程序代码及代码所使用的变量,而内核数据结构则用于维护进程状态信息。记录在内核数据结构中的信息包括许多与进程相关的标识号(IDs)
、虚拟内存表
、打开文件的描述符表
、信号传递及处理的有关信息
、进程资源使用及限制
、当前工作目录和大量的其他信息
我的理解:程序相当于面向对象的类,进程相当于面对对象的实例对象。
2. 时间片的概念
- 时间片(timeslice)又称为“量子(quantum)”或“处理器片(processor slice)”是操作系统分配给每个正在运行的进程微观上的一段 CPU 时间。事实上,虽然一台计算机通常可能有多个 CPU,但是同一个 CPU 永远不可能真正地同时运行多个任务。在只考虑一个 CPU 的情况下,这些进程“看起来像”同时运行的,实则是轮番穿插地运行,由于时间片通常很短(在 Linux 上为 5ms- 800ms),用户不会感觉到。
- 时间片由操作系统内核的调度程序分配给每个进程。首先,内核会给每个进程分配相等的初始时间片,然后每个进程轮番地执行相应的时间,当所有进程都处于时间片耗尽的状态时,内核会重新为每个进程计算并分配时间片,如此往复。
3. 并行和并发
- 并行(parallel):指在同一时刻,有多条指令在多个处理器上同时执行。
- 并发(concurrency):指在同一时刻只能有一条指令执行,但多个进程指令被快速的轮换执行,使得在宏观上具有多个进程同时执行的效果,但在微观上并不是同时执行的,只是把时间分成若干段,使多个进程快速交替的执行。
并发是两个队列交替使用一台咖啡机。
并行是两个队列同时使用两台咖啡机。
4. 进程控制块PCB
-
为了管理进程,内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个
PCB(Processing Control Block)
进程控制块,维护进程相关的信息,Linux 内核的进程控制块是task_struct
结构体。 -
在
/usr/src/linux-headers-xxx/include/linux/sched.h
文件中可以查看struct task_struct
结构体定义。其内部成员有很多,我们只需要掌握以下部分即可:- 进程id:系统中每个进程有唯一的 id,用
pid_t
类型表示,其实就是一个非负整数 - 进程的状态:有就绪、运行、挂起、停止等状态
- 进程切换时需要保存和恢复的一些CPU寄存器
- 描述虚拟地址空间的信息
- 描述控制终端的信息
- 当前工作目录(
Current Working Directory
) umask
掩码- 文件描述符表,包含很多指向 file 结构体的指针
- 和信号相关的信息
- 用户 id 和组 id
- 会话(Session)和进程组
- 进程可以使用的资源上限
(Resource Limit)
- 进程id:系统中每个进程有唯一的 id,用
5. 进程状态
进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中,进程状态分为三个基本状态,即就绪态,运行态,阻塞态。在五态模型中,进程分为新建态、就绪态,运行态,阻塞态,终止态
运行态
:进程占有处理器正在运行就绪态
:进程具备运行条件,等待系统分配处理器以便运行。当进程已分配到除CPU以外的所有必要资源后,只要再获得CPU,便可立即执行。在一个系统中处于就绪状态的进程可能有多个,通常将它们排成一个队列,称为就绪队列阻塞态
:又称为等待(wait)态或睡眠(sleep)态,指进程不具备运行条件,正在等待某个事件的完成新建态
:进程刚被创建时的状态,尚未进入就绪队列终止态
:进程完成任务到达正常结束点,或出现无法克服的错误而异常终止,或被操作系统及有终止权的进程所终止时所处的状态。进入终止态的进程以后不再执行,但依然保留在操作系统中等待善后。一旦其他进程完成了对终止态进程的信息抽取之后,操作系统将删除该进程。
6. 进程号
- 每个进程都由进程号来标识,其类型为
pid_t
(整型),进程号的范围:0~ 32767
。进程号总是唯一的,但可以重用。当一个进程终止后,其进程号就可以再次使用 - 任何进程(除 init 进程)都是由另一个进程创建,该进程称为被创建进程的父进程,对应的进程号称为父进程号(
PPID
) - 进程组是一个或多个进程的集合。他们之间相互关联,进程组可以接收同一终端的各种信号,关联的进程有一个进程组号(
PGID
)。默认情况下,当前的进程号会当做当前的进程组号。
总结
本文主要介绍了程序,进程的相关概念,包括时间片,并行和并发,PCB,进程的五种状态