从 Linux 逻辑地址 线性地址 物理地址 内存管理设计,感受Linux kernel 设计的精妙

news2024/11/24 21:01:11

1,机器解析的思路

发现网络上大量的教程,多是以讹传讹地讲解 Linux 内存管理;

都是在讲:

逻辑地址  ->  线性地址  ->  物理地址

如果谙熟 Linux 制定的GPT和编译原理或对二进制分析比较熟练的话,会发现线性地址的值,因为段选择子指向的段描述符中的基地址(内核数据段、代码段和用户数据段、代码段)设置为0x00000000,因此在不同进程之间会比较接近 ,或者说是类似的一套,即Linux 进程中的 逻辑地址就是线性地址。

线性地址 = 段基地址 + 逻辑地址偏移 = 0x00000000 + 逻辑地址偏移 = 逻辑地址

但,基于此,不同的进程,却能解析出完全不同的物理地址,这个转换关系是怎么发生的。

上面这个过程确实是程序运行时地址的翻译顺序;

但是,程序之所以按照这个顺序来解析地址,是因为前期有人类中的一些大脑袋巧妙地按照相反到方向

物理地址  ->  线性地址  ->   逻辑地址

设计了这个内存管理系统;

2,人类设计mm的思路


在x86架构中,页表(Page Table)和页目录(Page Directory)是用于虚拟内存管理的重要数据结构。x86架构使用两级页表结构,包括页目录、页表和物理页框。

页目录(Page Directory)是一个包含1024个32位项的数组,每个项指向一个页表。页表(Page Table)是一个包含1024个32位项的数组,每个项指向一个物理页框。

x86架构中的虚拟地址被分为三部分:10位页目录索引、10位页表索引和12位页内偏移。通过这三部分可以定位到物理内存中的具体位置。

页表和页目录的规划方法通常包括以下步骤:

1. 页表初始化:

        在操作系统启动时,会初始化页表和页目录,建立虚拟地址到物理地址的映射关系。

2. 页表项填充:

        将页表和页目录中的项填充为合适的值,包括物理页框的地址和权限信息。

3. 页表更新:

        在进程切换或内存分配时,需要更新页表和页目录中的项,以反映新的虚拟地址到物理地址的映射关系。

4. TLB缓存:

        为了加速地址转换过程,x86架构使用TLB(Translation Lookaside Buffer)缓存页表项,减少内存访问次数。

 上图是前向推理地址,笼统地解释x86保护模式下,逻辑地址如何转换成物理地址;

下图是后向反推,这里为了理想化地解释页目录与页表和页框的关系,页框被认为是真实的物理内存,连续的4k一个构成一个页框;

实际上进程的页表与页框的关系,并不是这么工整金字塔式的层级关系,而是由操作系统帮助进程分配和填充的,按照Linux kernel 中的内存管理模块的规则。

事实上,从  逻辑地址 ->  线性地址,是很简单的,基本上就是段选择子帮助挑选出来的全局描述符表项(GDT)中的段基地址,加上偏移,就等于,等于,等于,就是线性地址。

这个很丝滑,很简单;

然后,线性地址 ->  物理地址 也很丝滑:

线性地址  =  页目录索引    |     页表索引     |      页框内偏移

这很容易查找和计算处具体的物理地址;

但是,当将这两种丝滑放在一起是,马上容易懵掉。为什么两个阶段都这么丝滑,以至于无法理解。线性地址这个桥梁很神奇,得到线性地址的过程,与解析线性地址的含义,是两个不相交的世界。  这是问题的核心。

在这两个世界中打穿虫洞的方法,是 Linux 对CR3 寄存器的使用。

这个秘密值两万元以上的课程费,都不一定能听清楚  ^ ^

3, CR3 寄存器与进程的页目录

3.1 页目录

当 Linux 系统启动一个新的程序时,操作系统会为该程序创建一个新的页目录,这是为了实现每个进程的地址空间隔离和独立性。这个过程是虚拟内存管理的一部分,确保每个进程拥有自己的虚拟地址空间,从而提高系统的安全性和稳定性。

3.1.1创建新的页目录的步骤:

1. 分配页目录:

  • 操作系统为新进程分配一个新的页目录。这个页目录是一个包含多个页目录项(PDEs)的表,每个页目录项指向一个页表。

2. 初始化页目录:

  • 新的页目录会被初始化,其中一些条目会被设置为指向操作系统的共享页表,如那些包含共享库(如 C 标准库等)的页表。
  • 其他页目录项会被设置为指向新分配的页表,这些页表用于存储进程特有的数据,如代码段、数据段和堆栈。

3. 映射虚拟地址到物理地址:

  • 操作系统将程序的代码和数据加载到内存中,并在页表中创建相应的映射,将虚拟地址映射到物理内存地址。
  • 这包括设置适当的访问权限,例如,代码段可能被设置为只读和可执行,而数据段可能被设置为可读写。

4. 切换到新的页目录:

  • 在进程开始执行前,CPU 的页目录基址寄存器(CR3)会被更新为指向新进程的页目录的物理地址。
  • 这确保了当新进程开始执行时,CPU 的内存访问将根据新进程的页目录进行解析。

3.2 每个进程创建新的页目录的目的

  • 隔离性:每个进程拥有独立的页目录和页表,确保了进程间的内存隔离,一个进程不能直接访问或修改另一个进程的内存空间。
  • 安全性:通过为每个进程设置不同的内存访问权限,操作系统可以防止不当的内存访问,如阻止进程执行非代码区域的内存。
  • 稳定性:内存隔离减少了进程间相互影响的可能性,从而提高了系统的整体稳定性。

这种基于页目录和页表的内存管理机制是现代操作系统支持复杂多任务环境的基础,允许系统同时运行多个程序,而每个程序都在其自己保护的内存空间内运行。

3.2 CR3 与页目录

在 x86 架构中,CR3 寄存器(也称为页目录基址寄存器 PDBR)在将线性地址转换为物理地址的过程中起着至关重要的作用。
CR3 寄存器存储着当前使用的页目录的物理地址,这是虚拟内存管理中的一个关键组件。
CR3 寄存器的作用:
1. 存储页目录的物理地址
CR3 寄存器包含当前活动的页目录的物理内存地址。这个页目录包含了多个页目录项(PDEs),每个页目录项指向一个页表。
2. 启动地址转换
当处理器需要将线性地址(虚拟地址)转换为物理地址时,它首先访问 CR3 寄存器以获取页目录的位置。
处理器使用线性地址的高位部分(通常是最高的几位)来索引页目录,找到对应的页目录项,该项指向具体的页表。
接着,处理器使用线性地址的中间部分来索引该页表,找到对应的页表项(PTE),该项包含最终的物理页面地址。
最后,线性地址的低位部分(页内偏移)被添加到页面地址中,形成完整的物理地址。
3. 上下文切换时的角色
在进行进程切换时,操作系统会更新 CR3 寄存器以指向新进程的页目录的物理地址。这确保了每个进程都使用其自己的地址空间,从而实现内存隔离和保护。
更新 CR3 寄存器会导致处理器的页表缓存(TLB, Translation Lookaside Buffer)被刷新,以确保地址转换不会使用旧的、属于前一个进程的映射。

CR3 寄存器是实现 x86 架构中基于分页的虚拟内存管理的核心。
它不仅指示当前页目录的物理位置,还在进程上下文切换中发挥着重要作用,确保每个进程的内存空间得到正确管理和保护。

4, 结论分析:双重模板

由于页目录这个与进程一 一绑定的结构体,使得不同进程的线性地址的计算,都可以是简单地表示为 段基址 +  偏移,使得不同进程中的逻辑地址得到非常相似的 线性地址,但是在解析线性地址时,由于CR3所指向的页目录的不同,使得第三次丝滑地从相似的线性地址,推导出迥异的物理地址。

因此,不同进程之内线性地址的简单一致性,与得到具体物理地址的迥异复杂性,跟页目录的巧妙使用密不可分。

CR3

Linus 的这个设计中,叠加了双重模板编程思想:

<1.> 不同进程,只需要更换 CR3 这一个参数的值即可实现地址保护;

<2.> 不同 arch 的 CPU 只需要拿出一个寄存器来扮演 x86 中的 CR3, 即复用 Linux kernel中 相同的 MM 代码逻辑。

5,复盘整个过程

盯着这个图,思考上述过程,感受线性地址到物理地址过程中,页目录与CR3,这个三个丝滑的过程中所作用:

6,Linux 弱化了x86 架构中 gptr 的目的

Linus 处于对 Linux 通用性的考虑,鉴于 risc CPU 的 MM 都比较简单,risc 的体系结构中基本没有分段的思想体现,所以Linux kernel的MM思维中故意弱化了 x86 的 GPTR 寄存器的作用。主要发挥页目录 和 MMU 的功能,在物理内存分页的思想上,来实现进程空间的保护功能。

叹为观止

值100亿美元

致敬 《有机会赚100亿却只想写代码,Linux之父的传奇前半生》

综上所述,这个MM难理解也是正常的,确实是多个方面都巧夺天工

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1828766.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[AIGC] Python的Range函数

Python的range()函数是一个内置函数&#xff0c;常常用于编程中生成数列。这个函数可以生成一个整数序列&#xff0c;这个序列通常用在循环中。 文章目录 基本用法详细用法注意事项 基本用法 range()函数的基本形式为 range(stop) —— 这将生成一个从0开始&#xff0c;到stop…

js 用正则表达式 匹配自定义字符之间的字符串数据,如:( )、[ ]、{ }、< >、【】等括号之间的字符串数据

要使用正则表达式匹配尖括号()之间的数据&#xff0c;可以使用以下代码示例&#xff1a; 在JavaScript中&#xff0c;你可以使用正则表达式来匹配括号()之间的数据。以下是一个简单的例子&#xff0c;它展示了如何使用正则表达式来获取两对括号之间的文本。 // 示例字符串 con…

5.3.1_2 二叉树的层次遍历

&#x1f44b; Hi, I’m Beast Cheng&#x1f440; I’m interested in photography, hiking, landscape…&#x1f331; I’m currently learning python, javascript, kotlin…&#x1f4eb; How to reach me --> 458290771qq.com 喜欢《数据结构》部分笔记的小伙伴可以订…

17个关键方法指南,保护您的web站点安全!

了解如何让您的web应用程序或网站安全&#xff0c;对于网站所有者来说至关重要。以下是一些关键步骤&#xff0c;可以帮助您保护网站免受攻击和数据泄露。 1.使用公钥加密技术 当数据以明文形式传输时&#xff0c;它容易受到中间人 &#xff08;MitM&#xff09; 攻击。这意味…

System-Verilog 实现DE2-115流水灯

文章目录 一、 SystemVerilog1. SystemVerilog简介2. 基本语法和特性 二、实验过程hello.v文件引脚分配 三、实验效果参考 一、 SystemVerilog 1. SystemVerilog简介 SystemVerilog是一种高级的硬件描述语言&#xff08;HDL&#xff09;&#xff0c;它不仅继承了Verilog语言的…

SpringBoot实现的大文件上传

前言 大文件分片上传和断点续传是为了解决在网络传输过程中可能遇到的问题&#xff0c;以提高文件传输的效率和稳定性。 首先&#xff0c;大文件分片上传是将大文件分割成较小的片段进行上传。这样做的好处是可以减少单个文件的传输时间&#xff0c;因为较小的文件片段更容易快…

vcomp140.dll丢失原因与vcomp140.dll,无法继续执行代码的修复办法详解

vcomp140.dll 是一个动态链接库&#xff08;Dynamic Link Library&#xff0c;DLL&#xff09;文件&#xff0c;它在 Windows 操作系统中扮演着关键角色。该文件通常位于系统的标准目录 C:\Windows\System32 下&#xff0c;由微软公司开发并随特定版本的 Windows 或相关软件包一…

kubeadm快速部署K8S

目录 一、kubeadm安装K8S 1.1 环境准备 1.2 初始化配置 1.3 所有节点安装docker 1.3.1 安装依赖环境和docker 1.3.2 定义docker 配置文件 1.3.3 重启并开机自启docker 1.3.4 查看docker 是否配置成功 1.4 master、node01 、node02安装kubeadm&#xff0c;kubelet和kub…

CSS 实现个人资料卡

CSS 实现个人资料卡 效果展示 CSS 知识点 CSS 综合知识运用 页面整体布局 <div class"card"><div class"imgBox"><img src"./bg.jpg" /></div><div class"content"><div class"details&quo…

PCB设计简介

PCB电路板各层的含义 A. Signal And Plane Layers(S) 1. Signal Layers(信号层): 信号层主要用于布置电路板上的导线。Altium Designer提供了32个信号层&#xff0c;包括Top layer(顶层)&#xff0c;Bottom layer(底层)和32个内电层。 包括&#xff1a;Top layer(顶层),Bott…

PAT B1026. 程序运行时间

题目描述 要获得一个C语言程序的运行时间,常用的方法是调用头文件time.h,其中提供了clock(&#xff09;函数,可以捕捉从程序开始运行到clock()被调用时所耗费的时间。这个时间单位是clock tick,即“时钟打点”。同时还有一个常数CLK_TCK——给出了机器时钟每秒所走的时钟打点数…

Harbor镜像中心搭建

文章目录 Harbor镜像中心搭建前置条件下载Harbor创建CA证书配置Harbor开始启动地址映射访问配置本地登录配置外部虚拟机访问 Harbor镜像中心搭建 Harbor是一个镜像中心&#xff0c;我们所熟知的DockerHub就是一个镜像中心&#xff0c;我们可以把我们打包的镜像放在镜像中心中供…

Proteus 新建工程

Proteus 新建工程 新建简单工程 首先在File工具栏中点击New Project&#xff0c;弹出新建工程向导程序(New Proteus Wizard) 填写工程名称与存储路径&#xff0c;选择New Proteus并点击Next进行下一步设置 我们不需要生成PCB文件&#xff0c;一路默认&#xff0c;点击Next即…

基于springboot实现火锅店管理系统项目【项目源码+论文说明】

基于springboot实现火锅店管理系统演示 摘要 传统办法管理信息首先需要花费的时间比较多&#xff0c;其次数据出错率比较高&#xff0c;而且对错误的数据进行更改也比较困难&#xff0c;最后&#xff0c;检索数据费事费力。因此&#xff0c;在计算机上安装火锅店管理系统软件来…

篮球杯小白+强者

2. 宣读数字【算法赛】 思维题&#xff0c;注意到完全平方数的约数是奇数个&#xff0c;其余都是偶数个。 #include <bits/stdc.h>using namespace std;#define LL long long#define pb push_back#define x first#define y second #define int long long #define endl \n…

[240615] X-CMD 发布 v0.3.11,增加对 elvish 的支持

目录 X-CMD 发布 v0.3.11&#xff0c;增加对 elvish 的支持&#xff0c;并优化对 nushell&#xff0c;fish&#xff0c;xonsh&#xff0c;tcsh 的支持✨ co 模块 - copilot✨ elv 模块✨ hub X-CMD 发布 v0.3.11&#xff0c;增加对 elvish 的支持&#xff0c;并优化对 nushell&…

2024抖音电影奇遇夜沪上落幕,短视频宣发助力电影佳作被看见

6月14日&#xff0c;由抖音、央视电影频道联合举办的2024抖音电影奇妙夜在上海落幕。该活动以“在电影里遇见”为主题&#xff0c;邀请40个电影剧组、120多位影人嘉宾、30位抖音创作者共话光影。张艺谋、陈思诚、刘伟强、黄渤、吴镇宇、马丽、邓超、任贤齐、张家辉、倪妮、刘昊…

2078.两栋颜色不同且距离最远的房子

街上有 n 栋房子整齐地排成一列&#xff0c;每栋房子都粉刷上了漂亮的颜色。给你一个下标从 0 开始且长度为 n 的整数数组 colors &#xff0c;其中 colors[i] 表示第 i 栋房子的颜色。 返回 两栋 颜色 不同 房子之间的 最大 距离。 第 i 栋房子和第 j 栋房子之间的距离是 a…

Keil5新建工程详细讲解

一. 新建文件夹并拷贝库文件 新建project文件夹后建立4个子文件夹&#xff1a;startup&#xff0c;device&#xff0c;drivers&#xff0c;main 二. 新建mdk工程 1. 打开MDK软件&#xff0c;再点击Project->New uVision Project…新建一个工程&#xff0c;在弹出的对话框内…

MySQL日常问题-行列互换

问题 行列互换 场景1 行转换列 1、表结构和数据 /*Navicat Premium Data TransferSource Server : 本地Source Server Type : MySQLSource Server Version : 80027Source Host : localhost:3306Source Schema : schoolTarget Server Type :…