从硬件角度看Linux的内存管理

news2025/1/11 2:50:27

1. 分页机制

分段机制的地址映射颗粒度太大,以整个进程地址空间为单位的分配方式导致内存利用率不高。

分页机制把这个分配机制的单位继续细化为固定大小的页(Page),进程的虚拟地址空间也按照页来分割,这样常用的数据和代码就可以以页为单位驻留在内存中。而那些不常用的页可以交换到磁盘,从而节省物理内存,这比分段机制要高效很多。  

进程以页为单位的虚拟内存通过CPU的硬件单元映射到物理内存中,物理内存也是以页为单位来管理,这些物理页称为物理页面(Physical Page)或者页帧(Page Frame)。进程虚拟地址空间的页,我们称为虚拟页(Virtual Page)。操作系统为了管理这些帧需要按照物理地址顺序给每个页编号,叫作页帧号(Page Frame Number, PFN)。

分页机制的实现离不开硬件的实现,在CPU内部专门有一个硬件单元来负责这个虚拟页面到物理页面的转换,它就是一个称为内存管理单元(Memory Mangement Unit, MMU)的硬件单元。ARM处理器的内存管理单元包括TLB(translation lookaside buffer)和页表遍历单元(Table Walk Unit)两个部件。

  • TLB是一块高速缓存(Cache),用于缓存页表转换的结果,从而减少内存访问的时间。

一个完整的页表翻译和查找的过程叫作页表查询(Translation Table Walk),页表查询的过程由硬件自动完成,但是页表的维护需要软件来完成。页表查询是一个相对耗时的事情,理想的状态是TLB里面缓存有页表转换的相关信息。当TLB未命中时,才会去查询页表,并且开始读入页表的内容。ARM内存管理架构如下所示:

2. 页表

ARM32的虚拟地址VA[31:0]可以分成两部分:一部分是虚拟页面内的偏移量,以4KB页为例,VA[11:0]是虚拟页面内的偏移量;另一部分用来确定属于哪个页,我们称其为虚拟页帧号(Virtual Page Frame Number, VPN)。对于物理地址,也是类似的,PA[11:0]表示物理页帧的偏移量,剩余部分表示物理页帧号(Physical Frame Number, PFN) 。MMU的工作内容就是把VPN转换成PFN。处理器通常使用一张表来存储VPN到PFN的映射关系,这个表称为页表(Page Table, PT(进程都有自己独立的页表))。页表中每一个表项称为页表项(Page Table Entry, PTE)。 若将整张页表存放在寄存器中,则会占用很多硬件资源, 因此通常的做法是把页表放在主内存里,通过页表基地址寄存器(Translation Table Base Register, TTBR)来指向这种页表的起始地址。页表查询过程如图所示。处理器发出的地址是虚拟地址,通过MMU来查询页表,处理器得到了物理地址,最后把物理地址发送给内存控制器,从而访问物理页面。

3. 虚拟地址到物理地址的转换

下图展示了ARM32二级页表的查询过程,以4KB页为例,VA[31:20]用作一级页表的索引值,共有12位,最多可以索引4096个页表项;VA[19:12]用作二级页表的索引值,共有8位,最多可以索引256个页表项。当操作系统复制一个新进程时,首先会创建一级页表,分配16KB页面。本场景中,一级页表有4096个页表项,每个页表项占4字节,因此一级页表大小是16KB。当操作系统准备让该进程执行时,设置一级页表在物理内存中的起始地址到页表基地址寄存器中。进程执行过程中需要访问物理内存,因为一级页表的页表项是空的,这会触发缺页异常。在缺页异常里分配一个二级页表,并且把二级页表的起始地址填充到一级页表的相应页表项中。接着,分配一个物理页面,并把这个物理页面的帧号填充到二级页表的对应页表项中,从而完成页表的填充。随着进程的执行,它需要访问越来越多的物理内存,操作系统会逐步地把页表填充和建立起来。

当TLB未命中(Miss)时,处理器查询页表的过程如下图所示:

  • 处理器根据页表基地址控制寄存器TTBCR和虚拟地址来判断使用哪个页表基地址寄存器,是TTBR0和TTBR1。页表基地址寄存器中存放着一级页表的基地址。
  • 处理器根据虚拟地址的bit[31:20]作为索引值,在一级页表中找到页表项。一级页表一共有4096个页表项。
  • 一级页表的页表项中存放有二级页表的物理基地址。处理器将虚拟地址的bir[19:12]作为索引值,在二级页表中找到相应的页表项。二级页表有256个页表项。
  • 二级页表的页表项里面存放有4KB页的物理基地址,因此处理器就完成了页表的查询和翻译工作。

Note:

一级页表相当于把一本书缩小成几页的目录,通过目录来查询书的内容。但是有个问题,如果书非常厚,目录页非常多,那自然而然可以继续分,把一级目录当成一本教材,再建立一个目录,二级页表由此诞生,就是把页表当成教程,再建立页表。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1896475.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

赛灵思的乘法器IP核的blocking mode

一、文档中的解释 我以为乘法器使用blocking mode的输入buffer很大,结果如下图,FFT的buffer就buffer了一个时钟周期,接下来就是只能用一个fifo,35个时钟周期之后,再把值给到乘法器了,然后把乘法器可以改回到…

FPC生产工艺全流程详解

FPC生产制作繁琐而且难度较大,与普通PCB比较,FPC单位面积电路的造价高很多,但是,由于FPC优异的柔性、轻薄和可靠性等特性,给众多领域的设备和产品提供了更广泛的实现空间和新的设计方案,比如沉金板在电子、…

windows server2016搭建AD域服务器

文章目录 一、背景二、搭建AD域服务器步骤三、生成可供java程序使用的keystore文件四、导出某用户的keytab文件本人其他相关文章链接 一、背景 亲测可用,之前搜索了很多博客,啥样的都有,就是不介绍报错以及配置用处,根本不懂照抄那些配置是干…

【在大模型RAG系统中应用知识图谱】

【引子】 关于大模型及其应用方面的文章层出不穷,聚焦于自己面对的问题,有针对性的阅读会有很多的启发,本文源自Whyhow.ai 上的一些文字和示例。对于在大模型应用过程中如何使用知识图谱比较有参考价值,特汇总分享给大家。 在基于…

命令行运行git reflog(reference log)报错的解决办法

文章目录 1. 检查 Git 是否已安装2. 检查 PATH 环境变量3. 重新安装 Git 在Git中, reflog的英文全称是 “ reference log”。意思是 引用日志(参考日志)。它记录了本地仓库中HEAD和分支引用所指向的提交的变更历史。这包括了你所有的提交&…

推荐算法学习笔记2.1:基于深度学习的推荐算法-基于共线矩阵的深度推荐算法-AutoRec模型

AutoRec模型 前置知识:推荐算法学习笔记1.1:传统推荐算法-协同过滤算法 AutoRec模型通过引入自编码器结构,将共线矩阵中的用户向量(基于用户的U-AutoRec)或物品向量(基于物品的I-AutoRec)嵌入到低维空间后还…

Java的数据类型(复习版)

思维导图 一.字面常量 什么是常量?在我的理解看来常量就是在一个程序运行期间,保持不变的量就是常量。 例如: System.out.println(100);System.out.println(a);System.out.println(3.114);这些都可以称为常量。 字面常量的分类:…

喜报 | 怿星携高性价比国产方案亮相IAEIS峰会并荣获“优秀创新产品奖”

近日,由深圳市汽车电子行业协会主办的主题为:“布局全球产业链,促进智能网联汽车产业高质量发展”IAEIS 2024第十三届国际汽车电子产业峰会”暨“2023年度汽车电子科学技术奖”颁奖典礼在深圳隆重举行。 怿星科技携高性价比的「车载网络通信 …

知识库系统平台管理与优化

在之前做的关于FAQ知识库问答系统中,总结了相关踩坑内容,梳理如下,供大家参考。系统平台的管理与优化对于企业来说至关重要,它不仅关乎数据处理的效率,还直接影响到用户体验和业务成果。本文将从系统平台管理方式、系统…

【pytorch16】MLP反向传播

链式法则回顾 多输出感知机的推导公式回顾 只与w相关的输出节点和输入节点有关 多层多输入感知机 扩展为多层感知机的话,意味着还有一些层(理解为隐藏层σ函数),暂且设置为 x j x_{j} xj​层 对于 x j x_{j} xj​层如果把前面的…

【CT】LeetCode手撕—4. 寻找两个正序数组的中位数

目录 题目1- 思路2- 实现⭐4. 寻找两个正序数组的中位数——题解思路 3- ACM 实现 题目 原题连接:4. 寻找两个正序数组的中位数 1- 思路 思路 将寻找中位数 ——> 寻找两个合并数组的第 K 大 (K代表中位数) 实现 ① 遍历两个数组 &am…

天润融通分析AI技术助力客户服务,实现满意度三倍增长

如今,客户体验越来越成为影响客户决策的核心要素。 对于企业来讲,客户在不同触点的每一次互动体验,都成为塑造品牌声誉的“Aha时刻”。但同时,随着社会的发展的加速,客户的需求也在日新月异,给企业带来挑战…

【Linux】静态库的制作和使用详解

💐 🌸 🌷 🍀 🌹 🌻 🌺 🍁 🍃 🍂 🌿 🍄🍝 🍛 🍤 📃个人主页 :阿然成长日记 …

超融合服务器挂载硬盘--linux系统

项目中需要增加服务器的硬盘容量,通过超融合挂载了硬盘后,还需要添加到指定的路径下,这里记录一下操作步骤。 一:通过管理界面挂载硬盘 这一步都是界面操作,登录超融合控制云台后,找到对应的服务器&#…

python自动化办公之BeautifulSoup爬取并解析html文本

用到的库:BeautifulSoup 实现效果:爬取网站内容,拿到html文本并解析html文本 代码: 先爬取 # 先导入requests包 import requests urlhttps://www.baidu.com responserequests.get(url) # 做1个断言,如果执行成功&a…

视频号矩阵源码:构建短视频生态的基石

在数字化时代,视频内容已成为连接品牌与消费者的重要桥梁。视频号矩阵源码,作为短视频营销自动化的创新引擎,正在帮助内容创作者和营销团队以前所未有的效率和智能,管理和扩展他们的视频内容。本文将深入探讨视频号矩阵源码的核心…

解答 | http和https的区别,谁更好用

TTP(超文本传输协议)和HTTPS(安全超文本传输协议)的主要区别在于安全性和数据传输的方式。 一、区别 1、协议安全性: HTTP:使用明文形式传输数据,不提供数据加密功能,数据在传输过…

LeetCode-刷题记录-滑动窗口合集(本篇blog会持续更新哦~)

一、滑动窗口概述 滑动窗口(Sliding Window)是一种用于解决数组(或字符串)中子数组(或子串)问题的有效算法。 Sliding Window核心思想: 滑动窗口技术的基本思想是维护一个窗口(一般…

汇川H5U小型PLC不用写程序测试EC总线电机

目录 新建工程添加EtherCAT组态添加运动控制轴仿真测试 新建工程 新建一个H5U工程,不使用临时工程 系列选择H5U即可 添加EtherCAT组态 这里在EC总线中添加了一个汇川660的伺服 驱动参数使用默认 添加运动控制轴 新建一个轴Axis_0 将新建的轴和EC组态的660驱动…

springboot中国女篮资讯平台-计算机毕业设计源码12641

目录 1 绪论 1.1 研究背景 1.2 研究现状 1.3论文结构与章节安排 2平台分析 2.1 系统可行性分析 2.1.1硬件可行性分析 2.1.2软件可行性分析 2.1.3经济可行性 2.1.4 操作可行性 2.2系统功能分析 2.3 系统用例分析 2.4本章小结 3平台总体设计 3.1 系统架构设计 3.2…