参考资料:小林coding、阿秀
缺页中断
- 在 CPU 里访问一条 Load M 指令,然后 CPU 会去找 M 所对应的页表项。
- 如果该页表项的状态位是「有效的」,那 CPU 就可以直接去访问物理内存了,如果状态位是「无效的」,则 CPU 则会发送缺页中断请求。
- 操作系统收到了缺页中断,则会执行缺页中断处理函数,先会查找该页面在磁盘中的页面的位置。
- 找到磁盘中对应的页面后,需要把该页面换入到物理内存中,但是在换入前,需要在物理内存中找空闲页,如果找到空闲页,就把页面换入到物理内存中。找不到空闲页的话,就说明此时内存已满了,这时候,就需要「页面置换算法」选择一个物理页,如果该物理页有被修改过(脏页),则把它换出到磁盘,然后把该被置换出去的页表项的状态改成「无效的」,最后把正在访问的页面装入到这个物理页中。
- 页面从磁盘换入到物理内存完成后,则把页表项中的状态位修改为「有效的」。
- 最后,CPU 重新执行导致缺页异常的指令。
页面置换算法的功能是,当出现缺页异常,需调入新页面而内存已满时,选择被置换的物理页面,也就是选择一个物理页面换出到磁盘,然后把需要访问的页面换入到物理页。算法目标则是,尽可能减少页面的换入换出的次数。
一、最佳页面置换算法OPT
每次选择淘汰的页面将是以后永不使用,或者在最长时间内不再被访问的页面,这样可以保证最低的缺页率。在实际系统中无法实现,因为程序访问页面时是动态的,我们是无法预知每个页面在「下一次」访问前的等待时间。
二、先进先出页面置换算法FIFO
每次选择淘汰的页是最早进入内存(内存驻留时间最长)的页面。把调入内存的页面根据调入的先后顺序排成⼀个队列,需要换出页面时选择队头页面队列的最⼤长度取决于系统为进程分配了多少个内存块。
Belady异常
当为进程分配的物理块数增大时,缺页次数不减反增的异常现象称为Belady异常。
只有FIFO算法会产⽣Belady异常,⽽LRU和OPT算法永远不会出现Belady异常。FIFO算法虽然实现简单,但是该算法与进程实际运⾏时的规律不适应,性能差,因为早调入的页往往是经常被访问的页,这些页在FIFO算法下被反复调入和调出,出现Belady现象。
三、最近最久未使用置换算法LRU
发生缺页时,选择最长时间没有被访问的页面进行置换。这种算法近似最优置换算法,最优置换算法是通过「未来」的使用情况来推测要淘汰的页面,而 LRU 则是通过「历史」的使用情况来推测要淘汰的页面。
虽然 LRU 在理论上是可以实现的,但代价很高。为了完全实现 LRU,需要在内存中维护一个所有页面的链表,最近最多使用的页面在表头,最近最少使用的页面在表尾。在每次访问内存时都必须要更新「整个链表」。在链表中找到一个页面,删除它,然后把它移动到表头是一个非常费时的操作。所以,LRU 虽然看上去不错,但是由于开销比较大,实际应用中比较少使用。
四、时钟页面置换算法CLOCK
时钟置换算法是⼀种性能和开销均衡的算法,又称为CLOCK算法,或最近未用算法(NRU,Not Recently Used) 。把所有的页面都保存在一个类似钟面的「环形链表」中,一个表针指向最老的页面。当发生缺页中断时,算法首先检查表针指向的页面:
- 如果它的访问位是 0 就淘汰该页面,并把新的页面插入这个位置,然后把表针前移一个位置;
- 如果访问位是 1 就清除访问位,并把表针前移一个位置,重复这个过程直到找到了一个访问位为 0 的页面为止;
五、最不常用页面置换算法LFU
当发生缺页中断时,选择「访问次数」最少的那个页面,并将其淘汰。对每个页面设置一个「访问计数器」,每当一个页面被访问时,该页面的访问计数器就累加 1。在发生缺页中断时,淘汰计数器值最小的那个页面。
在操作系统中实现过程中,增加一个计数器硬件成本比较高,并且对这个计数器查找哪个页面访问次数最小,查找链表本身,如果链表长度很大,是非常耗时的,效率不高。并且LFU 算法只考虑了频率问题,没考虑时间的问题,比如有些页面在过去时间里访问的频率很高,但是现在已经没有访问了,而当前频繁访问的页面由于没有这些页面访问的次数高,在发生缺页中断时,就会可能会误伤当前刚开始频繁访问,但访问次数还不高的页面。
六、对比
算法名称 | 算法规则 | 优点 | 缺点 |
---|---|---|---|
OPT | 优先淘汰最长时间内不会被访问的页面 | 缺页率最小,性能最好 | 无法实现 |
FIFO | 优先淘汰最先进入内存的页面 | 实现简单 | 性能差,会有Belady异常 |
LRU | 优先淘汰最近最久没访问的页面 | 性能很好 | 需要硬件支持,算法开销大 |
CLOCK | 循环扫描各页面,淘汰访问位为0的页面 | 实现简单,算法开销小 | \ |
LFU | 优先淘汰访问次数最少的页面 | 实现简单 | 算法开销大,效率低 |