文章目录
- 【王道操作系统】ch2进程与线程-01进程与线程
- 01 进程的概念、组成和特征
- (1)进程的概念
- (2)进程(进程实体)的组成
- ①PCB(给操作系统用的)
- ②程序段(给进程自己用的)和数据段(给进程自己用的)
- (3)进程的特征
- 02 进程的状态与转换、进程的组织
- (1)进程的状态:创建态、就绪态、阻塞态、终止态
- (2)进程的状态转换模型
- (3)进程的组织
- ①链接方式
- ②索引方式
- (4)进程的状态与转换、进程的组织小结
- 03 进程控制
- (1)什么是进程控制
- (2)如何实现进程控制——用“原语”实现
- 为什么进程控制(进程的状态转换过程)需要一气呵成,不能被打断?
- 为什么原语具有“原子性”,具有一气呵成不被中断的性质呢?
- 如果关中断指令和开中断指令允许用户程序使用的话,会发生什么?
- (3)进程控制相关的原语
- ①创建原语
- ②撤销原语
- ③阻塞原语和唤醒原语
- ④切换原语
- 什么是进程的运行环境?
- 进程控制原语小结
- 04 进程通信
- (1)什么是进程间通信?
- (2)为什么进程通信需要操作系统的支持?
- (3)进程通信的三种方式(共享存储、消息传递、管道通信)
- ①共享存储
- ②消息传递
- 直接通信示意图:
- 间接通信示意图:
- ③管道通信
- 管道通信的特点
- 总结:管道通信和共享存储的区别和联系
- 05 线程的概念与特点
- (1)什么是线程
- (2)引入了线程机制带来的变化
- (3)线程的属性
- 06 线程实现方式和多线程模型
- (1)用户级线程(User-Level Thread,ULT)
- 线程管理的工作由谁来完成
- 线程切换是否需要CPU变态
- 操作系统是否能意识到用户级线程的存在
- 优缺点
- (2)内核级线程(Kernel-Level Thread,KLT)
- 1.线程管理的工作由谁来完成
- 2.线程切换是否需要CPU变态
- 3.操作系统是否能意识到用户级线程的存在
- 4.优缺点
- (3)多线程模型
- (4)用户级线程和内核级线程小结
- 07 线程的状态与转换
- 08 线程的组织与控制
【王道操作系统】ch2进程与线程-01进程与线程
01 进程的概念、组成和特征
(1)进程的概念
- 程序:静态的,存放在磁盘里的可执行文件,就是一系列的指令集合
- 进程:进程时动态的。进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
PCB是进程存在的唯一标志。
(进程的调度:操作系统决定让这个进程上CPU运行)
操作系统是进程的管理者,当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的身份证号——PID(Process ID)
- 操作系统需要记录PID、进程所属用户ID(UID)【基本的进程描述信息,让操作系统区分各个进程】
- 记录给进程分配了哪些资源(分配了多少内存、正在使用哪些I/O设备、正在使用哪些文件)【可用于实现操作系统对资源的 管理】
- 记录进程的运行情况(CPU使用时间、磁盘使用情况、网络流量使用情况等)【可用于操作系统对进程的控制、调度】
以上信息都被保存在一个数据结构PCB(Process Control Block)中,即进程控制块。操作系统需要对各个并发运行的进程进行管理,但凡管理时所需要的信息,都会被放在PCB中。
(2)进程(进程实体)的组成
①PCB(给操作系统用的)
PCB是进程存在的唯一标志,当进程被创建时,操作系统为其创建PCB,当进程结束时,会回收PCB。
②程序段(给进程自己用的)和数据段(给进程自己用的)
- 进程:进程时动态的。进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
PCB是进程存在的唯一标志。
(进程的调度:操作系统决定让这个进程上CPU运行) - 进程实体:一个进程实体(进程映像)由PCB、程序段、数据段组成。进程实体是静态的。可以将进程实体理解为进程在某一时刻的快照,进程实体反映了进程在某一时刻的状态。
例如:一个程序运行多次会对应多个进程。
同时挂3个QQ号会对应三个QQ进程,它们的PCB、数据段各不相同,但是程序段的内容相同,都是运行的相同的QQ程序。
(3)进程的特征
tips:进程是能独立运行、独立获得资源、独立接收调度的基本单位。注意,在引入了线程之后,进程就不再是独立接收调度的基本单位了,但进程仍然是独立获得资源的基本单位
02 进程的状态与转换、进程的组织
(1)进程的状态:创建态、就绪态、阻塞态、终止态
- 创建态:进程正在被创建,操作系统为进程分配资源、初始化PCB
- 就绪态:当进程创建完成后,进入就绪态。处于就绪态的进程已经具备运行条件,但由于没有空闲CPU,暂时不能运行。
- 运行态:如果一个处于就绪态的进程被操作系统调度,这个进程就可以上CPU运行,当一个进程在CPU上运行时就处于运行态。
- 阻塞态:在进程的运行过程中,可能会请求等待某个事件的发生(如等待某种系统资源的分配,或者等待其他进程的响应),在这个事件发生之前,进程无法继续往下执行,此时操作系统会让这个进程下CPU,并让它进入阻塞态。
- 终止态:一个进程可以执行exit系统调用,请求操作系统终止该进程。此时进程会进入终止态,操作系统会让该进程下CPU,并回收内存空间等资源,最后还要回收该进程的PCB。
(2)进程的状态转换模型
(3)进程的组织
①链接方式
②索引方式
两种进程组织方式中,用得比较多的是链接方式。
(4)进程的状态与转换、进程的组织小结
03 进程控制
(1)什么是进程控制
定义:进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。
通俗理解:进程控制就是要实现进程的状态转换。
(2)如何实现进程控制——用“原语”实现
计算机进程的控制通常由原语完成。所谓原语,一般是指由若干条指令组成的程序段,用来实现某个特定功能,在执行过程中不可被中断。在操作系统中,某些被进程调用的操作,如队列操作、对信号量的操作、检查启动外设操作等,一旦开始执行,就不能被中断,否则就会出现操作错误,造成系统混乱。所以,这些操作都要用原语来实现。原语是操作系统核心(不是由进程,而是由一组程序模块组成)的一个组成部分,并且常驻内存,通常在管态下执行。原语一旦开始执行,就要连续执行完,不允许中断。
(内核态=核心态=管态)
总结:原语的执行具有“原子性”,一气呵成,不允许中断。
为什么进程控制(进程的状态转换过程)需要一气呵成,不能被打断?
- 回答:如果不能“一气呵成”,就有可能导致操作系统中的某些关键数据结构信息不统一的情况,这会影响操作系统进行别的管理工作。
- 例如:假设PCB中的变量state表示进程所处的状态,1表示就绪态,2表示阻塞态。
假设此时进程2等待的事件发生,则操作系统中负责进程控制的内核至少需要做两件事:
①将PCB2的state设为1
②将PCB2从阻塞队列放到就绪队列
而如果在完成第一步之后收到进程中断信号,那么PCB2的state=1,但是PCB2这个进程却位于阻塞队列,这就产生了错误,造成了系统混乱。因此进程的状态转换过程必须一气呵成,从第一步到第二步不容许打断,因此必须用原语来实现。
为什么原语具有“原子性”,具有一气呵成不被中断的性质呢?
- 回答:用 “关中断指令” 和 “开中断指令” 这两个 特权指令 实现原子性。
如果关中断指令和开中断指令允许用户程序使用的话,会发生什么?
普通的用户程序一旦在CPU上被执行,就有可能已知霸占着CPU的资源,但是这种情况是我们不希望发生的,所以这两个指令只能被内核程序使用,必须是特权指令。
(3)进程控制相关的原语
①创建原语
②撤销原语
③阻塞原语和唤醒原语
一个进程由什么事件阻塞,就应该由什么事件唤醒。即阻塞原语和唤醒原语必须成对使用。
④切换原语
什么是进程的运行环境?
进程的运行环境也叫“进程上下文(Context)”,一个进程下CPU时会将其需要的运行环境存入PCB中,而当一个进程需要重新回到CPU运行时,就可以从PCB中恢复它的运行环境,让它继续往下执行。
进程控制原语小结
无论是哪个进程控制源于,无非就是做三件事:
- 更新PCB中的信息
- 将PCB插入合适的队列
- 分配/回收资源
04 进程通信
(1)什么是进程间通信?
进程间通信(Inter-Process Communication,IPC)是指两个进程之间产生数据交互。
(2)为什么进程通信需要操作系统的支持?
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。为了保证安全,一个进程不能直接访问另一个进程的地址空间。
(3)进程通信的三种方式(共享存储、消息传递、管道通信)
①共享存储
-
通过 “增加页表项/段表项” 即可将同一片共享内存区映射到各个进程的地址空间中(第三章的内容)
-
为避免出错,各个进程对共享空间的访问应该是互斥的。各个进程可以使用操作系统内核提供的同步互斥工具(如P、V操作)。多个进程可以同时从共享空间中读,但是不可以同时写入共享空间。
-
- 基于数据结构的共享
比如共享空间里只能放长度为20的数组。这种共享方式速度慢、限制多,是一种低级通信方式。
- 基于数据结构的共享
-
- 基于存储区的共享
操作系统在内存中划出一块共享存储区,数据的形式、存放的位置都由通信进程控制,操作性系统不做限制。这种共享方式速度快,是一种高级通信方式。
- 基于存储区的共享
②消息传递
进程间的数据交换以格式化的消息(Message) 为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
- 直接通信方式:消息发送进程要知名接收进程的ID
- 间接通信方式:通过“信箱”间接通信。又称“信箱通信方式”
直接通信示意图:
间接通信示意图:
间接通信方式以“信箱”作为中间实体进行消息传递。可以多个进程往同一个信箱send消息,也可以多个进程从同一个信箱中receive消息。
③管道通信
- “管道”是一个特殊的共享文件,又名pipe文件。和共享存储类似,也是P和Q在内存中都可以访问的一块大小固定的内存缓冲区。这个内存缓冲区本质上就是一个循环队列。
- 进程P往“管道”中依次写入数据,进程Q从管道中依次读取数据。管道中的数据符合“先进先出(First In First Out,FIFO)”的原则,先被进程P写入的数据也会被进程Q先读取。而在共享存储的方式中,P想往这一块存储区域的什么地方写就往什么地方写,Q想从什么地方读就从什么地方读,P没有写入限制,Q没有读取限制,很自由。
管道通信的特点
- 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现全双工通信,则需要设置两个管道。
- 各进程要互斥地访问管道(由操作系统实现)
- 当管道写满时,写进程将阻塞,直到读进程将管道中的数据取走,即可唤醒写进程。
- 当管道读空时,读进程将阻塞,直到写进程往管道中写入数据,即可唤醒读进程。
- 管道中的数据一旦被读出,就彻底消失。因此,当多个进程读同一个管道时,可能会错乱。对此,通常有两种解决方案:①一个管道究许多个写进程,一个读进程(2014年408真题高教社官方答案)﹔② 允许有多个写进程,多个读进程,但系统会让各个读进程轮流从管道中读数据(Linux的方案)。
总结:管道通信和共享存储的区别和联系
特征 | 管道通信 | 共享存储 |
---|---|---|
通信方式 | 单向通信,只支持单向数据流 | 双向通信,支持双向数据流 |
数据传输 | 通过管道传输数据,通常是字符或字节流 | 数据存储在共享的内存区域中 |
进程关系 | 通常用于父子进程之间的通信 | 适用于任意进程间的通信 |
同步/异步 | 通常是同步的,一个进程写入,另一个进程读取 | 可以是同步或异步,具体取决于实现方式 |
性能 | 适用于小量数据的传输,轻量级通信 | 适用于大量数据的共享,但需要考虑同步和互斥 |
通信开销 | 有一定的通信开销,因为数据需要在管道中传递 | 通信开销较小,直接读写内存区域 |
实现难度 | 相对简单,适用于简单的通信需求 | 相对复杂,需要考虑同步、互斥和内存管理等方面 |
05 线程的概念与特点
(1)什么是线程
- 传统的进程是程序执行流的最小单位
- 引入线程之后,线程成为了程序执行流的最小单位,是一个基本的CPU执行单元。进程内的各线程之间也可以并发,进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件);进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)
(2)引入了线程机制带来的变化
(3)线程的属性
特性 | 描述 |
---|---|
处理机调度单位 | 线程是处理机调度的基本单位,可独立执行和调度 |
多CPU支持 | 在多CPU计算机中,不同线程可以占用不同的CPU |
标识符 | 每个线程有唯一的线程ID,用于标识和区分不同的线程 |
线程控制块(TCB) | 每个线程有自己的线程控制块,用于保存线程的状态信息 |
基本状态 | 线程有就绪、阻塞、运行等基本状态 |
系统资源拥有 | 线程几乎不拥有系统资源,共享进程的资源 |
资源共享 | 同一进程的不同线程之间共享进程的资源,如内存地址空间 |
通信方式 | 由于共享内存地址空间,同一进程中的线程间通信无需系统干预 |
同一进程切换开销 | 切换同一进程内的线程开销较小,不会引起整个进程的切换 |
不同进程切换开销 | 切换不同进程中的线程会引起整个进程切换,系统开销相对较大 |
06 线程实现方式和多线程模型
线程的实现可以分为两类:用户级线程(User-Level Thread,ULT)和内核级线程(Kernel-Level Thread,KLT)。
(1)用户级线程(User-Level Thread,ULT)
描述:在用户级线程中,有关线程管理的所有工作都由应用程序在用户空间中完成,内核意识不到线程的存在。
历史背景:早期的操作系统(如:早期Unix)只支持进程,不支持线程。当时的“线程”是由线程库实现的。
int main() {
int i = 0;
while (true) {
if ( i==0){处理视频聊天的代码;}
if ( i==1){处理文字聊天的代码;}
if ( i==2){处理文件传输的代码;}
i = (i+1)83;//i的值为0,1,2,0,1,2.. .
}
}
从代码的角度看,线程其实就是一段代码逻辑。上述三段代码逻辑上可以看作三个“线程”。while循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)
很多编程语言提供了强大的线程库,可以实现线程的创建、销毁、调度等功能。
线程管理的工作由谁来完成
用户级线程的管理工作是由应用程序通过线程库完成的,并不是操作系统负责的。
线程切换是否需要CPU变态
线程切换是由线程库应用程序自己完成的,在用户态下就可以完成线程的切换工作,不需要操作系统干涉。
操作系统是否能意识到用户级线程的存在
他只知道这个进程是一块代码,但在这块代码里又被分为了几个线程,操作系统是意识不到这些线程的存在的。
优缺点
- 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
- 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞(从上面的伪代码可以看到),并发度不高。多个线程不可在多核处理机上并行运行。
(2)内核级线程(Kernel-Level Thread,KLT)
描述:内核级线程即操作系统支持的线程。
1.线程管理的工作由谁来完成
内核级线程的管理工作由操作系统内核完成。
2.线程切换是否需要CPU变态
.线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
3.操作系统是否能意识到用户级线程的存在
操作系统会为每个内核级线程建立相应的TCB ( Thread Control Block,线程控制块),通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程”
4.优缺点
- 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
- 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
(3)多线程模型
在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系,可以划分为几种多线程模型。
模型 | 一对一模型 | 多对一模型 | 多对多模型 |
---|---|---|---|
描述 | 每个线程对应一个独立的执行线程,退化为纯粹的内核级线程的线程实现方式 | 多个线程共享一个执行线程,由调度器管理 ,退化为纯粹的用户级线程的实现方式 | n用户及线程映射到m个内核级线程(n >= m) 。每个用户进程对应m个内核级线程 |
图片 | |||
优点 | 当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。 | 用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高 | 克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。 |
缺点 | 一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。 | 当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行 | — |
(4)用户级线程和内核级线程小结
- 用户级线程是“代码逻辑”的载体;
- 内核级线程是“运行机会”的载体。
- 内核级线程才是CPU分配的单位。 例如多核CPU的环境下,上表的一对多模型这个进程最多可以被分配两个核。
- 一段代码逻辑只有获得了运行机会才能被CPU执行
- 内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞