文章目录
- 2.4_4 死锁的检测和解除
- (一)死锁的检测
- (二)死锁的解除
- 总结
2.4_4 死锁的检测和解除
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
1.死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁。
2.死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来。
(一)死锁的检测
为了能对系统是否已发生了死锁进行检测,必须:
1.用某种数据结构来保存资源的请求和分配信息;
2.提供一种算法,利用上述信息来检测系统是否已进入死锁状态。
注:如果学习过数据结构中的“图”,则可以尝试着具体定义一下这个数据结构。
如果系统中剩余的可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利地执行下去。
例如上图中的进程P1,它申请了1个R2资源,此外,R2资源此时分配了1个给P2进程。所以,P1进程对于R2资源的请求是可以被满足的,不会被阻塞,可以顺利执行下去。
但是,对于P2进程请求R1来说,由于此时R1资源已经分配出去了2个给P1、1个给P2,那么P2对于R1资源再次的请求1个,就无法被满足。
如果这个进程执行结束了把资源归还系统,就可能使某些正在等待资源的进程被激活,并顺利地执行下去。
刚才说了,P1对于R2资源的请求是可以顺利执行的。那么等到P1执行完毕,就会归还它所使用的资源。
注:某个进程在进行请求资源、使用完毕、归还资源之后,该进程所对应的“请求边”、“分配边”就可以从图中删去,如下图所示。
刚刚我们说了,P2对于R1资源的请求是无法满足、阻塞的。然而,当此时P1归还系统资源后,R1资源的数量又足够满足P2了,因此P2就会被唤醒,并正常执行。
同理,等P2执行完之后,它也会归还所有的资源。所以,我们也可以把P2相连的边全部删去,如下图所示。
如果按上述过程分析,最终能消除所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于能找到一个安全序列)。
其本质其实和上一小节银行家算法的过程是一致的。我们经过比对,发现P1能够满足,于是把P1加入安全序列,让P1执行,执行完毕归还资源。归还资源后,我们再次经过比对,发现P2能够满足,于是把P2加入安全序列,让P2执行……
如果最终不能消除所有边,那么此时就是发生了死锁。
最终还连着边的那些进程就是处于死锁状态的进程。
例子:
如图。此时,可以顺利执行的,只有P3进程。当P3执行完毕之后,归还资源。
此时,可以发现,P1想要申请R2资源,但无法满足,因此P1会被阻塞;P2想要申请R1资源,但无法满足,因此P2也会被阻塞。
我们无法消除这些边,系统发生了死锁。
检测死锁的算法:
1.在资源分配图中,找出既不阻塞又不是孤点的进程Pi。消去它所有的请求边和分配边,使之成为孤立的结点。在下图中,P1是满足条件的进程结点,于是将P1的所有边消去。
“不阻塞”的意思是,这个进程申请的资源数量足够满足它的需求,比如像P1进程就是不阻塞的进程,而P2进程就是阻塞的进程。
“孤点”的意思是,这个图中,没有任何边与这个结点相连,则这个结点就是孤点。下图中,P1、P2此时都不是孤点。
因此,此时满足“既不阻塞、又不是孤点”的进程,就是P1进程。
2.进程Pi所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。在下图中,P2就满足这样的条件。同理,依旧按照“1”中的处理逻辑对其进行简化。
按照第1步中的逻辑,进行同样的操作。在下图中,“既不阻塞、又不是孤点”的进程就是P2,我们消去它所有的请求边和分配边即可。
最终,若能消去图中所有的边,则称该图是可完全简化的。
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁。
至此,我们已经解决了第一步问题——我们已经可以有办法检测出“系统是否发生了死锁”。
接下来,我们就可以想办法——“怎么解除死锁”。
(二)死锁的解除
一旦检测出死锁的发生,就应该立即解除死锁。
注意:系统中有死锁的发生,并不代表着系统中所有的进程都是死锁状态。我们在用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程。
解除死锁的主要方法:
1.资源剥夺法
挂起(即暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。
注意:既然“挂起某些死锁进程”,那么我们要挂起的进程就不能是非死锁进程。如下图,此时P1、P2处于死锁,而P3并不是死锁。因此我们就不能挂起P3,而只能挂起P1或者P2。
2.撤销进程法(或称终止进程法)
强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓是功亏一篑,以后还得从头再来。
3.进程回退法
让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。
如上图中,对于P1进程,我们可以让它回退到“P1只持有1个R1资源”的时候。回退到此,便能够保证P2进程顺利执行下去,从而解决死锁问题。
思考:如何决定“对谁动手”
即,无论使用上述三种方法中的哪一种,总之,我们要对哪个死锁进程下手?或者说,让哪个进程做出牺牲?——剥夺它的资源 / 终止它 / 回退它。
可以从以下这些角度来做出考虑。
1.进程优先级。
优先级低的,我们可以对它下手。
2.已执行多长时间。
执行时间越长,说明对它下手,所付出的代价可能会更大。所以我们可以选择“已执行时间”更短的进程。
3.还要多久能完成。
对于“马上就能完成了”的资源,我们可以保证它的继续运行,转而去牺牲别的进程。
4.进程已经使用了多少资源。
如果一个进程已经拥有了很多资源的话,那么我们把它剥夺,就会释放出很多资源,从而让原本死锁的局面最大程度地得到缓解。因此,我们可以对“此时拥有资源最多”的进程下手。
5.进程是交互式的还是批处理式的。
“交互式”就意味着这个进程当前是正在与用户进行交互的。如果对交互式进程下手,把它干掉的话,那么用户体验就会变差。
而对于批处理式的进程,它只是计算机自身在进行一系列的处理,而用户对它的反馈并不那么在意。所以我们可以优先对“批处理进程”下手。