进程与线程
- 一、进程的概念
- 1、进程和进程实体
- 2、进程的组织方式
- 3、进程的特征
- 二、进程的状态与转换
- 1、进程的状态
- 2、进程的转换
- 三、进程控制
- 1、定义
- 2、原语控制
- ①创建原语
- ②撤销原语
- ③阻塞原语
- ④唤醒原语
- ⑤切换原语
- 四、进程通信
- 方法一:共享内存
- 方法二:管道通信
- 方法三:消息传递
- 五、线程、多线程模型
- 1、与传统进程的对比
- 2、线程属性
- 3、线程的实现方式
- ①用户级线程
- ②内核级线程
- ③组合方式
- 问题
一、进程的概念
1、进程和进程实体
- 进程实体,由程序段、数据段、PCB三部分组成。
- PCB,系统为每个运行的程序配置一个数据结构,称为进程控制块(PCB),用来描述进程的各种信息(如程序代码存放位置)
- 程序段,存放要执行的代码。
- 数据段,存放程序运行过程中处理的各种数据。
- 进程,进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
进程实体是静态的,进程则是动态的
PCB组成
- 进程描述信息
- 进程标识符PID
- 用户标识符UID
- 进程控制和管理信息
- 进程当前状态
- 进程优先级
- 资源分配清单
- 程序段指针
- 数据段指针
- 键盘
- 鼠标
- 处理及相关信息
- 各种寄存器值(当进程切换时需要把进程当前的运行情况记录下来保存在PCB中,如程序计数器的值表示了当前程序执行到哪一句)
2、进程的组织方式
进程的组织讨论的是多个进程之间的组织方式问题
链接方式
索引方式
索引使用数组存放?链接是通过链表存放?
3、进程的特征
①动态性
进程是程序的依次执行过程,是动态地产生、变化和消亡的
②并发性
内存中有多个进程实体,各进程可并发执行
③独立性
进程是能独立运行、独立获得资源、独立接受调度的基本单位
④异步性
各进程按各自独立的、不可预知的速度向前推进,操作系统要提供“进程同步机制”来解决异步问题
⑤结构性
每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成。
二、进程的状态与转换
1、进程的状态
①运行态
占有CPU,并在CPU上运行
②就绪态
已经具备运行条件,但由于没有空闲CPU,而暂时不能运行(进程已经拥有了除处理机之外所有需要的资源,一旦获得处理及,即可立即进入运行态开始运行。)
③阻塞态
因等待某一事件而暂时不能运行
④创建态
进程正在被创建,操作系统为进程分配资源、初始化PCB
⑤终止态
进程正在从系统中撤销,操作系统会回收进程拥有的资源、撤销PCB
2、进程的转换
三、进程控制
1、定义
进程控制,主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能
2、原语控制
使用原语实现进程控制。
原语的特点是执行期间不允许中断,只能一气呵成。
原语采用“关中断指令” 和 “开中断指令” 实现
关/开中断的指令权限非常大,必然是只允许在核心态下执行的特权指令
进程控制相关的原语
进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:
- 更新PCB中的信息(如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
- 所有的进程控制原语一定都会修改进程状态标志
- 剥夺当前运行进程的CPU使用权必然需要保存其运行环境
- 某进程开始运行前必然要恢复前运行环境
- 将PCB插入合适的队列
- 分配/回收资源
①创建原语
状态转换: 无 -> 创建态 -> 就绪态
功能:申请空白PCB、为新进程分配所需资源、初始化PCB、将PCB插入就绪队列
引起条件:
- 用户登录 :分时系统中,用户登录成功,系统会建立为其建立一个新的进程
- 作业调度:多道批处理系统中,有新的作业放入内存时,会为其建立一个新的进程
- 提供服务:用户向操作系统提出某些请求时,会新建一个进程处理该请求
- 应用请求:由用户进程主动请求创建一个子进程
②撤销原语
状态转换: 就绪态/阻塞态/运行态 -> 终止态 -> 无
功能:
- 从PCB集合中找到终止进程的PCB
- 若进程正在运行,立即剥夺CPU,将CPU分配给其他进程
- 终止其所有子进程
- 将该进程拥有的资源归还给父进程或操作系统
- 删除PCB
引起条件:
- 正常结束
- 异常结束
- 外界干预
③阻塞原语
状态转换: 运行态 -> 阻塞态
功能:
- 找到阻塞的进程对应的PCB
- 保护进程运行现场,将PCB状态信息设置为“阻塞态”,暂时停止进程运行
- 将PCB插入相应事件的等待队列
引起条件:
- 需要等待系统分配某种资源
- 需要等待相互合作的其他进程完成工作
④唤醒原语
状态转换:阻塞态 -> 就绪态
功能:
- 在事件等待队列中找到PCB
- 将PCB从等待队列移除,设置进程为就绪态
- 将PCB插入就绪队列,等待被调度
引起条件:
等待的事件发生
⑤切换原语
状态转换:运行态 -> 阻塞态/就绪态 | 就绪态 -> 运行态
功能:
- 将运行环境信息存入PCB
- PCB移入相应队列
- 选择另一个进程执行,并更新其PCB
- 根据PCB恢复新进程所需的运行环境
引起条件:
- 当前进程时间片到
- 有更高优先级的进程到达
- 当前进程主动阻塞
- 当前进程终止
阻塞和唤醒要成对出现
四、进程通信
**进程通信:**就是指进程之间的信息呼唤。
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。
为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。
方法一:共享内存
①基于数据结构的共享
比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多、是一种低级通信方式。
②基于存储区的共享
在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
方法二:管道通信
管道,是指用于连接读写进程的一个共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的缓冲区。
- 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
- 各进程要互斥地访问管道。
- 数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待都进程将数据取走。当读进程将数据全部取走后,管道变空,此时都进程的read()系统调用将被阻塞。
- 如果没写满,就不允许读。如果没读空,就不允许写。
- 数据一旦被读出,就从管道被抛弃,这就意味着读进程最多只能有一个,否则可能会有都错数据的情况。
方法三:消息传递
进程间的数据交换以 格式化的消息 为单位。进程通过操作系统提供的 “发送消息/接收消息” 两个原语进行数据交换。
五、线程、多线程模型
有的进程可能需要"同时"做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了"线程",来增加并发度。
传统的进程时程序执行流的最小单位。
引入线程后,线程成为了程序执行流的最小单位。进程只作为除CPU之外的系统资源的分配单元。(如打印机、内存地址空间等都是分配给进程的)
1、与传统进程的对比
①资源分配、调度
- 传统进程机制中,进程时资源分配、调度的基本单位
- 引入线程后,进程是资源分配的基本单位,线程是调度的基本单位
②并发性
- 传统进程机制中,只能进程间并发
- 引入线程后,各线程间也能并发,提升了并发度
③系统开销
- 传统的进程间并发,需要切换进程的运行环境,系统开销大
- 线程间并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小
- 引入线程后,并发所带来的系统开销减小
2、线程属性
- 线程是处理机调度的单位
- 多CPU计算机中,各个线程可占用不同的CPU
- 每个线程都有一个线程ID,线程控制块(TCB)
- 线程也有就绪、阻塞、运行三种基本状态
- 线程几乎不拥有系统资源
- 同意进场的不同线程间共享进程的资源
- 由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预
- 同一进程中的线程切换,不会引起进程切换
- 不同进程中的线程切换,会引起进程切换
- 切换同进程内的线程,系统开销很小
- 切换进程,系统开销大
3、线程的实现方式
①用户级线程
用户级线程,由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责(包括线程切换)。
线程切换可以在用户态下即可完成,无需操作系统干预。
②内核级线程
内核级线程,管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
③组合方式
在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n各用户级线程映射到m各内核级线程上( n >= m )
key: 操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位
3.1 组合方式——多对一模型
多对一模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不想需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理及上并行运行
为什么会被阻塞?
因为线程切换是在核心态进行的,操作系统只能看到内核级线程,用户级线程阻塞反映在内核级线程也是阻塞的,所以整个进程会被阻塞?
3.2 组合方式——一对一模型
一对一模型:一个用户及线程映射到一个内核级线程。每个用户进程有于用户级同数量的内核级线程
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
3.3 组合方式——多对多模型
多对多模型:n用户及线程映射到 m 各内核级线程 (n >= m )。每个用户进程对应 m 各内核级线程。
克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销头太大的缺点。
问题
为什么同时需要内核级和用户级线程?
用户级线程不暴露在内核态,不一定需要转换到内核态操作,可以节省开销。