进程(一)
- 2.1 进程的定义、组成、组织方式、特征
- 2.1.1 定义
- 2.1.2 组成
- 2.1.3 组织方式
- 2.1.4 特征
- 2.1.5 本小节总结
- 2.2 进程的状态与转换
- 2.2.1 进程的状态
- 2.2.3 进程状态的转换
- 2.2.4 本小节总结
- 2.3 进程控制
- 2.3.1 基本概念
- 2.3.2 进程控制相关的原语
- 2.3.3 本小节总结
- 2.4 进程通信
- 2.4.1 共享存储
- 2.4.2 消息传递
- 2.4.3 管道通信
- 2.4.4 本小节总结
- 2.5 线程概念和多线程模型
- 2.5.1 什么是线程,为什么要引入线程
- 2.5.2 引入线程机制后,有什么变化
- 2.5.3 线程的实现方式
- 2.5.4 多线程模型
- 2.5.5 本小节总结
该章节包括:
2.1 进程的定义、组成、组织方式、特征
2.2 进程的状态与转换
2.3 进程控制
2.5 线程概念和多线程模型
2.1 进程的定义、组成、组织方式、特征
本小节知识概览
2.1.1 定义
在早期的计算机中,只能处理单个任务,
引入多道程序之后,在内存中需要存储多个程序需要的数据,那么操作系统是如何知道各个程序的存放位置呢?
因此就引出了进程、进程实体的概念。
程序段、数据段、PCB三部分组成了进程实体(进程映像〉。一般情况下,我们把进程实体就简称为进程,例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,实质上是撤销进程实体中的PCB。
注意:PCB是进程存在的唯一标志
2.1.2 组成
进程(进程实体)由程序段、数据段、PCB三部分组成
PCB的组成:
PCB:记录管理进程所需要的信息
程序段、数据段:记录程序需要的数据
2.1.3 组织方式
在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。
注意:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题。
链接方式: 将处于不同状态的PCB连接成队列
索引方式:指针通过索引表指向不同状态的PCB
2.1.4 特征
2.1.5 本小节总结
2.2 进程的状态与转换
本小节知识概览
2.2.1 进程的状态
进程是程序的一次执行。在这个执行过程中,有时进程正在被CPU处理,有时又需要等待CPU服务可见,进程的状态是会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。
进程的创建状态:为进程分配内存、PID…
进程的终止状态:销毁PCB、释放内存…
2.2.3 进程状态的转换
上面说道进程的五种状态,那么这几种状态之间是如何转换的呢?
2.2.4 本小节总结
2.3 进程控制
本小节知识总览
2.3.1 基本概念
什么是进程控制?
如何实现进程控制?
简单来说进程的控制就是通过修改 PCB 中的标志,以及放入相应的队列中。
如果 PCB 中的标志位是就绪状态,但却在阻塞队列中,就会发生系统错误,因此需要原语实现进程的控制!
2.3.2 进程控制相关的原语
用原语实现进程控制。原语的特点是执行期间不允许中断,只能一气呵成。这种不可被中断的操作即原子操作。
原语采用**“关中断指令”和“开中断指令”**实现
当代码中有一些外部中断信号,由于执行了关中断指令,这些外部中断信号是被忽略的,也就是不会被执行,保证了原子性。在执行开中断指令后,才会去处理这些中断信号。
进程控制的相关原语:
学习技巧:进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:
1. 更新PCB中的信息(如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
a.所有的进程控制原语一定都会修改进程状态标志
b.剥夺当前运行进程的CPU使用权必然需要保存其运行环境
c.某进程开始运行前必然要恢复运行环境
2.将PCB插入合适的队列
3.分配/回收资源
创建原语
撤销原语
阻塞、唤醒原语
切换原语
2.3.3 本小节总结
2.4 进程通信
本小节知识概览
什么是进程通信?
顾名思义,进程通信就是指进程之间的信息交换。
进程是分配系统资源的单位〈包括内存地址空间),因此各进程拥有的内存地址空间相互独立。
2.4.1 共享存储
顾名思义,就是通过一个共享的内存空间达到数据共享
值的注意的是:
- 两个进程对共享空间的访问必须是互斥的(互斥访问通过操作系统提供的工具实现)。
- 操作系统只负责提供共享空间和同步互斥工具(如P、V操作)
俩种共享存储的方式 :
基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式
基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
思考:
有过Java基础的,我们可以想想为什么 wait/notify 必须要在同步代码块中使用呢?
首先我们需要明确 wait/notify 是用来实现通信的一种手段,使用的正是 共享存储的方式,而在共享空间中,俩个进程对共享空间中数据的读和写必须是互斥的,而想要达到这一个条件,就需要我们使用互斥锁来实现。
2.4.2 消息传递
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
俩种消息传递的方式:
直接通信方式:
每一个进程都会有一个消息缓冲队列, 进程1 想要给 进程2 发送消息,首先会创建一个消息Message,通过发送原语直接挂到进程2的缓冲队列上。
间接通信方式:
进程之间通过 信箱 的方式进行通信,进程1通过发送原语将消息发送到信箱中,进程2通过接收原语接受消息
2.4.3 管道通信
1.管道只能采用半双工通信(对讲机),某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
2.各进程要互斥地访问管道。
3.数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞。
4.如果没写满,就不允许读。如果没读空,就不允许写。
5.数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。
2.4.4 本小节总结
共享存储是双向通信,可以进行数据交换,管道通信和消息传递属于单向通信。
2.5 线程概念和多线程模型
本小节知识概览、
2.5.1 什么是线程,为什么要引入线程
因此在引入线程之后,CPU调度的并不是一个个进程了,而是进程中的某一个线程,更加细粒度。
- 可以把线程理解为“轻量级进程”
- 线程是一个基本的CPU执行单元,也是程序执行流的最小单位。
- 引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)
- 引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)
2.5.2 引入线程机制后,有什么变化
线程的属性:
2.5.3 线程的实现方式
用户级线程(User-Level Thread,ULT)
- 用户级线程由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责(包括线程切换)
- 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
- 在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)
- 可以这样理解,“用户级线程”就是“从用户视角看能看到的线程”
内核级线程(Kernel-Level Thread,KLT 又称:内核支持的线程)
- 内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
- 可以这样理解,“内核级线程”就是“从操作系统内核视角看能看到的线程”
在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n个用户级线程映射到m个内核级线程上( n >= m)
重点重点重点;
操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。
例如:
左边这个模型中,该进程由两个内核级线程,三个用户级线程,在用户看来,这个进程中有三个线程。但即使该进程在一个4核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户线程并行执行。
2.5.4 多线程模型
在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题。
多对一模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行
一对一模型:一个用户及线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
多对多模型:n用户及线程映射到m个内核级线程(n >= m)。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。