操作系统学习
二.处理机管理
19.生产者-消费者问题
问题:
代码:
20.多生产者-多消费者问题
实现:
21.吸烟者问题(单生产者-多消费者)
问题:
实现:
22.读者-写者问题
问题:
读优先的代码:
如果要实现读写平衡算法:可以在各个函数前加一个P(w)锁起来,在最后用V(w)解锁
23.哲学家进餐问题
问题:
代码:
24.管程
管程的定义:管程是一种特殊的软件模块,有以下这些部分组成:
- 局部于管程的共享数据结构说明
- 对该数据结构进行操作的一组过程(函数)
- 对局部于管程的共享数据设置初始值的语句
- 管程有一个名字
基本特征:
- 局部于管程的数据只能被局部于管程的过程所访问
- 一个进程只有通过调用管程内的过程才能进入管程访问共享数据
- 每次仅允许一个进程在管程内执行某个内部过程
管程一般是由编译器实现的,程序员无需实现,只需要调用接口
补充:
- 各进程必须互斥访问管程的特性是由编译器实现的
- 可在管程中设置条件变量及等待/唤醒操作以解决同步问题
25.死锁、饥饿、死循环
死锁:在并发环境中,各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象
饥饿:由于进程长期得不到想要的资源,某进程无法向前推进的现象
死循环:某进程执行过程中一直挑不出来某个循环的现象
不同点 | |
---|---|
死锁 | 至少两个进程 |
饥饿 | 可能只有一个进程发生饥饿 |
死循环 | 死锁和饥饿是管理者的问题,死循环是被管理者的问题 |
产生死锁必须满足四个条件:
- 互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁
- 不剥夺条件:进程所获得的资源,其它进程不能强行夺走
- 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有
- 循环等待条件:存在一种进程资源的循环等待链
注意:死锁一定循环等待,循环等待未必死锁
产生死锁的情况:
- 对系统资源的竞争
- 进程推进顺序非法
- 信号量使用不当
26.预防死锁
思路:破坏死锁的四个条件,就不会产生死锁
①将互斥使用的资源改成允许共享使用,比如SPOOLing技术将打印机改造为共享设备
②破坏不剥夺条件:剥夺调度方式,将处理机资源强行剥夺给优先级更高的进程使用。缺点:实现复杂,增加系统开销
③破坏请求和保持条件:静态分配方法,即进程在运行前一次申请完所有需要的资源。缺点:资源利用率低,可能导致饥饿
④破坏循环等待条件:顺序资源分配法,给系统中的资源编号,规定每个进程递增的顺序请求资源,同类资源一次申请完。缺点:不方便增加新的设备,进程实际使用资源的顺序可能和编号递增顺序不一致
27.避免死锁
安全序列:就是系统按照这种序列分配资源,则每个进程都能顺利完成。安全序列可能有多个
如果分配了资源之后,系统中找不到一个安全序列,则系统进入不安全状态
因此可以在资源分配之前预先判断这次分配是否导致系统进入不安全状态,这也是"银行家算法"的核心思想
实现思路:
- 用一个n*m的矩阵表示各种进程对各种资源的最大需求数,称为最大需求矩阵Max
- 用一个n*m的分配矩阵Allocation表示对所有进程的资源分配情况
- Max-Allocation=Need矩阵,表示还需要多少各种资源
- 用一个长度为m的一维数组Available表示可用资源
- 用一个长度为m的一维数组Request表示本次申请的各种资源
- 如果Request[j]<=Need[i, j](0<=j<=m),则下一步,否则需要资源超过最大值
- 如果Request[j]<=Available[j](0<=j<=m),则下一步,否则尚无资源
- 系统试探着把资源分配给进程,并修改相应的数据
- 操作系统执行安全性算法,检查此次资源分配后,系统是否处于安全状态
28.死锁的检测和解除
死锁定理:如果某时刻的资源分配图是不可完全简化的,那么此时系统死锁
解除死锁的主要方法:
- 资源剥夺法
- 撤销进程法(终止进程法)
- 进程回退法,但要系统记录进程
决定对"谁"动手:
- 进程优先级
- 已执行多长时间
- 还要多久能完成
- 进程已经使用了多少资源
- 进程是交互式的还是批处理式的
三.内存管理
1.内存的基础知识
内存可存放数据。程序执行前需要先放到内存中才能被CPU处理–缓和CPU与硬盘之间的速度毛肚
Windows中的可执行文件也叫装入模块
程序中的地址是相对地址
解决地址转换的三种策略:
- 绝对装入:在编译时,将相对地址转换为绝对地址。适用于单道程序的环境
- 静态重定位(可重定位装入):装入时对地址进行重定位,将逻辑地址转换为物理地址
- 动态重定位(动态运行时装入):在程序真正要执行的时候转换逻辑地址。这种方式需要一个重定位寄存器的支持
程序写入的过程:
链接的三种方式:
- 静态链接:在程序运行前,先将各目标模块及它们所需的库函数连接成一个完整的可执行文件,之后不再拆开
- 装入时动态链接:将各目标模块装入内存时,边装入边链接的链接方式
- 运行时动态链接:在程序执行中需要该目标模块时,才对它进行连接。其优点是便于修改和更新,便于实现对目标模块的共享
2. 内存管理的概念
操作系统负责内存空间的分配与回收
操作系统需要提供某种技术从逻辑上对内存空间进行扩充
操作系统需要提供地址转换功能,负责程序的逻辑地址与物理地址的转换
操作系统需要提供内存保护功能,保证各进程在各自存储空间内运行,互不干扰
内存保护的实现方式:
①在CPU中设置一对上、下限寄存器,存放进程的上、下限地址。进程的指令访问某个地址时,CPU检查是否越界
②采用重定位寄存器(又称基址寄存器)和界地址寄存器(又称限长寄存器)进行越界检查。重定位寄存器放的是进程的其实物理地址,界地址寄存器存放的是最大逻辑地址
3.覆盖与交换
覆盖技术的思想:将程序分为多个段(多个模块),常用的段常驻内存,不常用的段在需要时调入内存
内存中分为一个"固定区"和若干个"覆盖区"
需要常驻内存的段放在固定区中,调入后就不再调出
不常用的放在覆盖区,需要时调入内存
必须由程序员声明覆盖结构,操作系统完成自动覆盖,这增加了用户编程负担,现已成为历史
交换(对换)技术的思想:内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存
暂时换出外存等待的进程状态就是挂起态
挂起态又可以分为就绪挂起、阻塞挂起
注意:
- 具有对换功能的操作系统中,通常把磁盘空间分为文件区和对换区两部分,文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配方式。相对的,对换区的空间采用连续分配方式,换入换出速度更快
- 交换主要在内存吃紧时进行,系统负荷降低就暂停
- 可优先换出阻塞进程,可换出优先级低的进程。为了防止优先级低的进程在被调入后又很快被换出,有的系统会考虑进程在内存的驻留时间
4.连续分配管理方式
连续分配:指为用户进程分配的必须是一个连续的内存空间
单一连续分配
在单一连续分配中,内存被分为系统区和用户区
系统区常位于内存的低地址部分,用于存放操作系统的相关数据;用户区用于存放用户进程相关数据
缺点:内存中只能有一道用户程序,有内部碎片
优点:无外部碎片
内部碎片,分配给某进程的内存区域中,如果有些部分没有用上
外部碎片,是指内存中的某些空闲空间分区由于太小而难以利用
固定分区分配
固定分区分配:将整个用户控件分为若干个固定大小的分区,每个分区存放一道作业
固定分区分配分为分区大小相等和分区大小不等两种策略
优点:无外部碎片
缺点:有内部碎片
动态分区分配
又称可变分区分配。这种分配方式不会预先划分内存分区,而是根据进程的大小动态地建立分区
系统会采用空闲分区表或空闲分区链的数据结构来记录内存的使用情况
缺点:有外部碎片,但可以用紧凑(拼凑)技术来解决外部碎片
5.动态分区分配算法
首次适应算法算法思想:每次都从低地址开始查找,找到第一个能满足大小的空闲分区
实现方法:空闲分区以地址递增的次序排列,每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区
最佳适应算法算法思想:由于动态分区分配是一种连续分配方式,为各进程分配的空间必须是连续的一整片区域。因此为了保证有连续的大空间,进程优先使用小空间
实现方法:空闲分区按容量递增的次序链接。每次分配式顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区
缺点:会产生外部碎片
最坏适应算法算法思想:每次分配优先使用最大的连续空闲区,这样分配后剩余的空闲区就不会太小,更方便使用
如何实现:空闲分区按容量递减的次序链接。每次分配式顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区
邻近适应算法算法思想:每次都从上次查找结束的位置开始检索
如何实现:空闲分区以地址递增的顺序排列(可排成一个循环链表)。每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区
6.基本分页存储管理的概念
将内存空间一个个大小相等的分区,每个分区就是一个页框(页框=页帧=内存块=物理块=物理页面)。每个页框有一个编号,即页框号,页框号从0开始
将进程的逻辑地址空间也分为与页框大小相等的一个个部分,每个部分称为一个页或页面。每个页面也有一个编号,即页号,页号也是从0开始
操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框内,也就是说,进程的页面与内存的页框有一一对应的关系
各个页面不必连续存放,可以放到不相邻的各个页框内
为了能知道进程的每个页面在内存中存放的位置,操作系统要为每个进程建立一张页表(一种数据结构)
注意:页表通常在PCB中
如果某系统物理内存为nGB,页面大小为mKB,进程的逻辑地址空间有k页,则整个页表至少要
⌈
⌈
log
2
n
∗
1024
∗
1024
m
⌉
/
8
⌉
∗
(
k
+
1
)
B
y
t
e
\left \lceil\left \lceil\log{2}{\frac{n*1024*1024}{m}}\right \rceil/8\right \rceil*(k+1)Byte
⌈⌈log2mn∗1024∗1024⌉/8⌉∗(k+1)Byte
进程的各个页面是离散存在的,但是页面内部是连续存放的,所以逻辑地址对应的物理地址=页面在内存中的其实地址+页面偏移量
页面大小一般取2的整数幂,优点有:逻辑地址的拆分更加迅速,物理地址的计算更加迅速
分页存储管理的逻辑地址结构如下:
地址结构包含两个部分:前一部分是页号,后一部分为页内偏移量
如果有K位表示页内偏移量,则说明该系统中一个页面的大小是2^k个内存单元
如果有M位表示页号,则说明该系统中,一个进程最多允许由2^M个页面
7.基本地址变换机构
基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址
通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M
进程未执行时,页表的起始地址和页表长度放在进程控制块(PCB)中,当进程被调度时,操作系统内核会把他们放到页表寄存器中
注意:页面大小是2的整数幂
8.具有快表的地址变换机构
快表(TLB),是一种访问速度比内存块很多的高速缓存,用来存放最近访问的页表项的副本,与之对应,内存中的页表称为慢表
引入快表之后的地址变换过程:
- CPU给出逻辑地址,由某个硬件算的页号、页内偏移量,将页号与快表中的所有页号进行比较
- 如果找到匹配的页号,说明要访问的页表项在快表中有副本,则直接取出该页对应的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表命中,则访问某个逻辑地址仅需一次访存即可
- 如果没有找到,则需要访问内存中的页表,找到对应页表项,得到页面面存放的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元,因此,若快表未命中,则访问某个逻辑地址需要量词访存
根据局部性原理,快表的命中率有90%以上
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据很可能再次被访问
空间局部性:一旦程序访问了某个存储单元,不久后,其附近的存储单元很有可能被访问
9.两级页表
页号查询的方法:K号页表对应的页表项存放位置=页表始址+k*4
要在所有的页表项都连续存放的基础上才能用这种方法找到页表项,导致连续的存储空间占用很大
根据局部性原理:大部分页表没必要常驻内存
所以,将页表拆分成多个部分,形成二级页表
同时,逻辑地址结构分为:一级页号、二级页号、页内偏移量
如何实现地址变换:
- 按照地址结构将逻辑地址拆分成三部分
- 从PCB中读出页目录表始址,根据一级页号查页目录表,找到下一级页表在内存中的存放位置
- 根据二级页表,找到最终访问的内存块号
- 结合页内偏移量得到物理地址
注意:
- 若两级页表不够,可以分更多级
- 若采用多级页表机制,则各级页表的大小不能超过一个页面
- N级页表访问一个逻辑地址需要N+1次访存
10.基本分段存储管理
进程的地址空间:按照自身的逻辑关系划分为若干个段,每个段都有一个段名,每段从0开始编址
内存分配规则:以段为单位进行分配,每个段在内存中占据连续空间。但各段之间可以不相邻
分段系统的逻辑地址结构由段号(段名)和段内地址(段内偏移量)所组成
程序分多个段,各段离散地装入内存,为了保证程序能正常运行,就必须能从物理内存中找到各个逻辑段的存放位置。为此,需为每个进程建立一张段映射表,简称"段表"
分段与分页的地址转换的最大区别是分段中每段的长度是不同的,所以查询逻辑地址时要考虑段内偏移量和段的地址进行比较
页是信息的物理单位。分页仅仅是系统管理上的需要,是系统行为,对用户是不可见的
段是信息的逻辑单位。对用户是可见的
页的大小固定由系统决定。段的长度不定,决定于用户编写的程序
分页的用户进程地址空间是一维的,程序员只需给出一个记忆符即可表示一个地址
分段的用户进程地址空间是二维的,程序员在标识一个地址时,既要给出段名,也要给出段内地址
分段相比于分页更容易实现信息的共享和保护
不能被修改的代码称为纯代码或可重入代码(不属于临界资源),这样的代码是可以共享的,可修改的代码是不能共享的
分段访问一个逻辑地址需要2次访存
与分页系统类似,分段系统也可以引入快表机构
11.段页式管理方式
将进程按逻辑模块分段,再将各段分页,再将内存空间大小相同的内存块/页框/页帧/物理块,进程前将个页面分别将各页面装入内存块中
段页式管理的逻辑地址结构:段号+页号+页内偏移量
每个段对应一个段表项,每个段表由段号、页表长度、页表存放块号(页表起始地址)组成。每个段表项长度相等,段号是隐含的
每个页面对应一个页表项,每个页表项由页号、页面存放的内存块号组组成。每个页表项长度相等,页号是隐含的
如何实现逻辑地址变换:
若快表命中,则访问一个逻辑地址仅需一次访存,若未命中,则需三次
12.虚拟内存的概念
传统存储管理方式的缺点:作业必须一次性全部装入内存后才能开始运行,导致大作业无法运行。当大量作业要求运行时,由于内存无法容纳所有作业,因此只有少量作业能运行,导致程序并发度下降。一旦作业被装入内存,就会一致驻留在内存中
虚拟内存的定义和特征:基于局部性原理,在程序装入时,可以将程序中很快会用到的部分装入内存,暂时用不到的部分留在外存。
在程序执行的过程中,当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,然后继续执行程序。
当内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存
有以上操作,就可以让用户觉得自己有一个比实际内存大得多的内存,这就是虚拟内存
虚拟内存有以下三个特征:
- 多次性:作业被分成多次调入内存
- 对换型:允许在作业运行过程中,将作业换入、换出
- 虚拟性:从逻辑上扩充了内存的容量
虚拟内存技术,允许一个多页多次调入内存,因此,虚拟内存的实现需要建立在离散分配的内存管理方式上
13.请求分页管理方式
请求分页与基本分页的主要区别:当所访问的信息不在内存时,由操作系统负责将所需信息从外存调入内存,当内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存
请求分页的页表的页号由内存块号、状态位(是否已调入)、访问字段(可记录最近被访问过几次,或记录上次访问的时间)、修改位(页面调入内存后是否被修改过)、外存地址(页面在外存中的存放位置)组成
当要访问的页面不在内存时,会产生一个缺页中断,然后由操作系统的缺页中断处理程序处理中断。此时缺页的进程阻塞,放入阻塞队列中
如果内存中有空闲块,则分配一个空闲块,若没有,则由页面置换算法选择一个页面淘汰,若该页面在内存期间被修改过,则要将其写会外存。未修改过的页面不用写回外存
缺页中断是内中断
请求分页的地址变换:
14.页面置换算法
①最佳置换算法(OPT):每次选择淘汰的页面是以后永不使用,或者在最长时间内不再内访问的页面,这样可以保证最低的缺页率
最佳置换算法的前提是知道之后要用的页面,所以是不可能实现的算法
②先进先出算法(FIFO):每次淘汰的页面是最早进入内存的页面
Belady异常:当为进程分配的物理块数增大时,缺页次数不减反增的异常现象
只有FIFO算法会产生Belady异常
③最近最久未使用置换算法(LRU):淘汰最近最久未使用的页面
实现方法:赋予每个页面对应的页表项中,用访问字段记录该页面自上次被访问以来所经历的时间t
该算法实现难
④时钟置换算法(CLOCK):
简单的时钟置换算法:为每个页面设置一个访问位,再将内存中的页面都通过链接指针链接成一个循环队列。被访问的页面的访问位为1。当需要淘汰页面时,则扫描所有页面,扫描过的页面的访问位变为0,找到一个访问位为0的页面淘汰
复杂的时钟置换算法:用(访问位,修改位)的形式表示各页面状态
15.页面分配策略
驻留集:指请求分页存储管理中给进程分配的物理块的集合
在采用了虚拟存储技术的系统中,驻留集大小一般小于进程的总大小
固定分配:操作系统为每个进程分配一组固定数目的物理块
可变分配:先为每个进程分配一定数目的物理块,在进程运行期间,可根据情况增加或减少
局部置换:发生缺页时只能选进程自己的物理块进行置换
全局置换:可以将操作系统保留的空闲物理块分配给缺页进程,也可以将别的进程持有的物理块置换到外存,再分配给缺页进程
固定分配局部置换:系统为每个进程分配一定数量的物理块,在整个运行期间都不改变。若进程在运行中发生缺页,则只能从该进程在内存中的页面中选出一页换出,然后在调入需要的页面
可变分配全局置换:刚开始会为每个进程分配一定的物理块。操作系统会保持一个空闲物理块队列。当进程发生缺页时,从队列中抽一块分配给该进程,当队列没有空闲物理块时,则选一个未锁定的页面换出外存,再将该物理块分配给缺页的进程
可变分配局部置换:刚开始会为每个进程分配一定的物理块。当某进程发生缺页时,只允许从该进程自己的物理块中选出一个进行换出外存,如果进程频繁地缺页,系统会为该进程多分配几个物理块,反之减少
- 预调页策略:一次调入相邻的页面
- 请求调页策略:进程在运行期间发现缺页时才将所缺页面调入内存
从何处调入页面:
- 系统拥有足够多的对换区空间:页面的调入、调出是在内存与外存的对换区之间
- 系统没有足够多的对换区空间:凡是不会被修改的数据都直接从文件区调入。对于可能被修改的部分,换出时需写回磁盘对换区,下次再从对换区调入
- UNIX方式:运行之前将相关的数据全部放在文件区。若被使用过的页面需要换出,则写回对换区,下次需要时从对换区调入
抖动现象:刚刚换出的页面马上又要换入内存,换入的马上又要换出
工作集:指在某段时间间隔内,进程实际访问页面的集合
工作集大小可能小于窗口尺寸,驻留集的大小不能小于工作集大小