Linux: 进程地址空间究竟是什么?进程地址空间存在意义何在?

news2025/1/9 1:50:10

Linux: 进程地址空间究竟是什么?

  • 一、内存究竟是什么?分为哪些?
  • 二、内存是真实物理空间?
  • 三、进程地址空间(虚拟地址)
    • 3.1 为何同一个变量地址相同,保存的数据却不同?
  • 四、为什么需要地址地址空间和页表的存在?
    • 4.1 真实内存无序便有序
    • 4.2 进行内存安全检查
    • 4.3 进程管理和内存管理藕接
  • 五、其他细节问题
    • 5.1 操作系统如何获取进程页表相关信息
    • 5.2 操作系统如何确定内存中是否分配空间、是否存在内容?

一、内存究竟是什么?分为哪些?

 在C/C++中,我们常将内存分为:代码区、常量区、全局区(静态区)、堆、栈等等。相关内存区域划分如下:(X86, 32位平台)
在这里插入图片描述
如何验证C/C++中各区域的相对位置呢?

 我们可以在每个区域中选择一个地址来验证C/C++中各区域的相对位置!!具体如下:

【源代码】:

 #include <stdio.h>
 #include <stdlib.h>
 #include <unistd.h>
 
 int un_global_val;
 int Init_global_val = 100;
 int main(int argc, char *argv[], char * env[])
 {
 	printf("code addr: %p\n", main); //代码区
 	
     const char *str = "hello Linux";//字符常量区
     printf("read only char add: %p\n", str);
     printf("Init global value add: %p\n", &Init_global_val);//全局初始区
     printf("uninit global value add: %p\n", &un_global_val);//全局未初始区
 
     char* heap1 = (char*)malloc(100);
     char* heap2 = (char*)malloc(100);
     char* heap3 = (char*)malloc(100);
     char* heap4 = (char*)malloc(100);
     
     //堆及地址增长方向
     printf("heap1 add: %p\n", heap1);
     printf("heap2 add: %p\n", heap2);
     printf("heap3 add: %p\n", heap3);
     printf("heap4 add: %p\n", heap4);
     //堆及地址增长方向
     printf("stack1 add: %p\n", &heap1);                                                                                                                
     printf("stack2 add: %p\n", &heap2);
     printf("stack3 add: %p\n", &heap3);
     printf("stack4 add: %p\n", &heap4);
     
     int i = 0;//命令行参数
     for(; argv[i]; i++)
     {
         printf("argv[%d]: %p\n",i, argv[i]);
     }
     
     i = 0;//环境变量
     for(; i < 2; i++)
     {
         printf("env[%d]: %p\n",i, env[i]);
     }
     return 0;
 }

【运行结果】:
在这里插入图片描述

二、内存是真实物理空间?

 在C/C++中,我们经常提及上述内存。但程序员口中的内存是真实物理空间吗?

 下面我们在来看看这样一段代码:用fork创建一个子进程,并打印父进程和子进程对于的pid、ppid、全局变量值、全局变量地址。当子进程执行2次后,子进程修改全局变量。

【源代码】:

#include <stdio.h>    
#include <stdlib.h>    
#include <unistd.h>    
    
int global_val = 100;    
int main()    
{    
    pid_t id = fork();    
    if(id == 0)    
    {    
       //child    
       int cnt = 3;                                                                                                                                      
       while(1)    
       {    
           printf("child Pid:%d Ppid:%d g_val:%d &g_val:%p\n", getpid(), getppid(), global_val, &global_val);    
           if(--cnt == 0)    
           {    
               global_val = 200;    
               printf("child change g_val 100 -> 200\n");    
           }    
           sleep(1);    
       }    
    }    
    else if(id > 0)    
    {    
        //pather          
       while(1)    
       {    
           printf("father Pid:%d Ppid:%d g_val:%d &g_val:%p\n", getpid(), getppid(), global_val, &global_val);    
           sleep(1);    
       }    
    }    
    return 0; 
}

【运行结果】:
在这里插入图片描述

  • 我们发现fork()创建的子进程对全局变量进行修改后,毋庸置疑父进程和子进程的值不同。但奇怪的是,父/子进程中,全局变量的地址竟然是一样的,未发生改变!!
  • 一块地址空间的值是唯一的。但上述现象中出现同一块变量却存在不同的值,说明父子进程中显示的地址不是真实的物理地址。在LInux中,我们将这种地址称之为虚拟地址。
  • 在C/C++中,我们看到的地址都是虚拟地址(进程地址空间)。真实地址都是由操作系统进行控制分配的,用户一概不知道!!

三、进程地址空间(虚拟地址)

3.1 为何同一个变量地址相同,保存的数据却不同?

 原因在于在Linux中,操作系统会为每一个进程维护一个PCB、进程地址空间(也被称为虚拟地址空间)和页表。其中页表通过映射,将虚拟地址和真实物理地址进行藕接。操作系统可以通过页表,找到虚拟地址所对应的真实物理地址,进而找到相应的数据!!

 当fork()创建子进程时,操作系统以父进程为模板将大部分属性拷贝给子进程,而页表就是其中之一。在数据未发生任何改变之前,父进程和子进程中页表的映射关系是相同的,指向同一块物理地址。但当父进程或子进程试图对数据进行修改时,为了保证父进程和子进程之间的独立性,操作系统会为该进程申请创建新的空间,然后将页表中的映射关系进行修改,指向新申请的物理空间。换而言之,数据不修改时指向同一块物理地址;数据修改后,各自私有一份!
 但在此过程中,操作系统仅仅是将页表中的映射关系进行修改。我们所看到的地址(虚拟地址)和变量并未发生改变。这也就意味着当父进程和子进程运行时,父进程和子进程的PCB、进程地址空间、和页表都是相互独立的,各自私有一份。尽管虚拟地址相同,但页表中的映射关系已经发生改变,此时我们获取虚拟地址对应的数据时,操作系统通过页表映射到不同的物理地址,从而获取到不同的值!
(Linux中,进程PCB中存在一个struct mm_struct的结构体指向虚拟地址空间)

【具体如下】:(以栈上定义的变量gal为例)

  1. 创建子进程时,未发生数据修改。此时操作系统会以父进程为模板将大部分数据拷贝给子进程,并且共用代码。其中父进程页表中的数据直接拷贝给子进程页表。此时子进程中的虚拟地址通过页表的映射关系,和父进程指向同一块物理空间!

在这里插入图片描述

  1. 当子进程中的数据发生修改时,为了保证父进程和子进程的独立性,操作系统会为子进程的真实物理空间重新开辟一块空间,用于存储修改后的值。之后将子进程的页表中的映射关系进行调整,指向新空间。

在这里插入图片描述

四、为什么需要地址地址空间和页表的存在?

为什么不直接指向真实物理地址,而是通过进程地址空间和页表来间接寻址呢?其真实原因主要有以下几点:

4.1 真实内存无序便有序

 在真实物理空间中,数据从磁盘加载到物理空间。但数据加载到什么位置呢?

 其实数据可以加载到物理空间的任意位置。由于进程地址空间和页表的存在,进程不需要关系这个问题。操作系统会将该进程的数据通过页表映射起来,让进程以统一的方式看待内存。通过地址空间和页表将乱序的内存数据变为有序,分门别类的规划好!!同时当进程中的数据出现阻塞挂起等情况是,操作系统仅需修改页表中的映射相关属性即可,大大减少操作系统的内存和进程的管理成本!!!

4.2 进行内存安全检查

 在页表中,还存在访问权限的字段。具体如下:
在这里插入图片描述
 在该字段中,保存着当前数据时仅度、可读可写等权限。如果页表保存也数据的访问权限时r(比如代码区的数据),当用户对该数据试图进行修改时,页表中的访问权限会拦截禁止该行为。从而实现对进程访问内存的安全检查!!

【示例】:
下面有这样一段代码:

#include <stdio.h>

int main()
{
	char* str = "hello Linux\n";
	*str  = "fef";
	return 0;
}

 这段代码显然是无法成功运行的。原因在于char* str = "hello Linux\n"中,str是字符常量,操作系统将页表中str的相应访问权限字段设置为只读。当用户*str = "fef";试图对str中的数据进行修改时,操作系统识别到该数据不可被修改,直接被操作系统拦截。

4.3 进程管理和内存管理藕接

 在进程被调度过程中,为代码和数据开辟内存、加载数据到内存,修改建立页表和物理地址的映射关系等等操作属于内存管理的范畴;而进程执行代码、进程被调度属于进程管理的范畴。
 在整个过程中,内存管理不知道进程管理究竟在做什么、而进程管理同样不关心底层数据加载、内存分配的问题。由于进程地址空间和页表的存在,操作系统会将各自的需求传递给对方。从而实现进程管理和内存管理之间的接藕!!

五、其他细节问题

5.1 操作系统如何获取进程页表相关信息

 在Linux中,进程的PCB保存了一个struct mm_struct结构体指针指向进程虚拟空间。但页表呢?
 其实当CPU调度进程时,CPU上存在一个名为CR3寄存器。该寄存器保存了当前调度进程页表的地址。当进程调度结束时,操作系统会将CR3寄存器中的内存保存到进程PCB的上下文中。

5.2 操作系统如何确定内存中是否分配空间、是否存在内容?

 在系统中,存在这样几种情况。

  1. 各位在打游戏时,有些游戏非常大,多则上百G(比如原神)。但在32为平台下,内存只有4GB。内存显然不足,当我们发现游戏还是可以正常运行的。原因在于操作系统并不是一次性将所有数据全部加载到内存中,而是在进程执行过程中,临时将所需要的数据加载到内存。
  2. 当操作系统中进程处于阻塞状态时,恰好此时操作系统内存资源严重不足。此时操作系统会将阻塞进程转化为挂起状态。将阻塞进程的相关数据置换到磁盘的Swap分区。当该进程被调度时,在重新加载到内存。这一点毛病没有。但问题在于操作系统如何知道内存中是否为这些数据分配空间、分配的空间中是否有内容呢?

原因在于:在进程页表中,存在一个字段(用0、1的方式)用于判断操作系统是否为该代码或数据分配内存空间、分配的空间中是否存在内容。(比如10表示以分配空间但没有内容,操作系统在识别到该信息后会先将相关数据加载到指定区域,在向后执行!!)
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1559281.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ssm012医院住院管理系统+vue

医院住院管理关系 摘 要 随着时代的发展&#xff0c;医疗设备愈来愈完善&#xff0c;医院也变成人们生活中必不可少的场所。如今&#xff0c;已经2021年了&#xff0c;虽然医院的数量和设备愈加完善&#xff0c;但是老龄人口也越来越多。在如此大的人口压力下&#xff0c;医院…

3.31总结

这两天对于java知识的学习又收获了一些新的东西&#xff0c;如内部类、抽象类、接口、权限修饰符、代码块、final. final final多用于方法、类、变量的修饰 方法&#xff1a;表示该方法是最终方法&#xff0c;不能被重写 类&#xff1a;表明该类是最终类&#xff0c;不能被…

latex伪代码一些记录

参考一 参考二 参考三 使用minipage 最终调整好的效果&#xff1a; $ \begin{document} \begin{center} \begin{minipage}{15.92cm} \renewcommand{\thealgorithm}{1} \begin{CJK}{GBK}{song} \begin{algorithm}[H]\caption{ \text{算法1&#xff1a;xxx}}\begin{algorith…

Linux 基础IO [缓冲区文件系统]

&#x1f493;博主CSDN主页:麻辣韭菜&#x1f493;   ⏩专栏分类&#xff1a;Linux知识分享⏪   &#x1f69a;代码仓库:Linux代码练习&#x1f69a;   &#x1f339;关注我&#x1faf5;带你学习更多Linux知识   &#x1f51d; 目录 前言 一.Linux下一切皆文件 二.缓冲…

调试技巧安全预编译头文件(C++基础)

调试 调试可以选择条件调试和操作调试&#xff1a; 条件调试来选择条件进入断点设置&#xff0c;操作调试来使达到断点条件后完成某些操作&#xff08;一般是output窗口输出&#xff09;。 在这里就只输出了小于6的条件。 安全 降低崩溃、内存泄露、非法访问等问题。 应该转…

vue基础教程(5)——构建项目级登录页

同学们可以私信我加入学习群&#xff01; 正文开始 前言一、创建首页二、登录页代码讲解三、对应的vue知识点&#xff1a;四、附件-各文件代码总结 前言 前面我们已经把vue自带的页面删除&#xff0c;也搭建了最简单的router路由&#xff0c;下面就可以真正开发我们自己的项目…

蓝桥杯-python-常用库归纳

目录 日期和时间 datetime模块 date日期类&#xff0c;time时间类&#xff0c;datetime日期时间类 定义date&#xff08;年&#xff0c;月&#xff0c;日&#xff09; data之间的减法 定义时间&#xff08;时&#xff0c;分&#xff0c;秒&#xff09; 定义datetime&#xf…

文献学习-23-MRM:用于遗传学医学图像预训练的掩码关系建模

MRM: Masked Relation Modeling for Medical Image Pre-Training with Genetics Authors: Qiushi Yang, Wuyang Li, Baopu Li, Yixuan Yuan Source: ICCV 2023 Abstract: 关于自动多模态医疗诊断的 ODERN 深度学习技术依赖于大量的专家注释&#xff0c;这既耗时又令人望而却…

DeepL Pro3.1 下载地址及安装教程

DeepL Pro是DeepL公司推出的专业翻译服务。DeepL是一家专注于机器翻译和自然语言处理技术的公司&#xff0c;其翻译引擎被认为在质量和准确性方面表现优秀.DeepL Pro提供了一系列高级功能和服务&#xff0c;以满足专业用户的翻译需求。其中包括&#xff1a; 高质量翻译&#xf…

Python 常用内置库 time库、random库、turtle库

文章目录 一、time库二、random库三、turtle库1. 绘制正方形2. 使用海龟对象绘制六边形3. 绘制多个起点相同大小不同起点的五角星4. 绘制多个图形和添加文字 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、time库 time是最基础的时间处理库&#…

系统慢查询的思考

系统慢查询的思考 在一个系统中发现慢查询的功能或很卡的现象。你是怎么思考的&#xff1f;从哪几个方面去思考&#xff1f;会用什么工具&#xff1f; 一个系统使用了几年后都可能会出现这样的问题。原因可能有以下几点。 数据量的增加。系统中平时的使用中数据量是有一个累…

HTML块级元素和内联元素(头部和布局)

目录 1.HTML块级和内联标签&#xff1a; 1.块级元素&#xff1a; 2.内联元素: 3.元素嵌套&#xff1a; 4.元素转换&#xff1a; 示例如下: 2.内联框架&#xff1a; 前言&#xff1a; 示例如下: 3.布局&#xff1a; 4.头部标签&#xff1a; 前言&#xff1a; 说明&…

GT收发器PHY层设计(3)PHY层设计

文章目录 前言一、设计框图二、PHY层基本传输协议三、PHY_TX模块3.1、模块接口3.2、组帧状态机描述3.3、数据大小端问题3.4、字节对齐 四、PHY_RX模块4.1、模块接口4.2、大小端转换4.3、起始位4.4、结束位4.5、axis数据流恢复 五、LFSR伪随机码六、链路空闲时期处理 前言 上一…

windows平台虚拟机安装

windows平台虚拟机安装 1. 安装VMwareWorkstationPro 1.1 软件下载 官网下载 官网 百度网盘下载 版本 VMwareWorkstationPro16 链接&#xff1a;https://pan.baidu.com/s/1LidMxoM9e4a4CANixyRoyg?pwd1157 提取码&#xff1a;1157 1.2 软件安装 软件安装注意事项 软件…

类的新功能

类的新功能 默认成员函数 在C11之前&#xff0c;一个类中有如下六个默认成员函数&#xff1a; 构造函数。拷贝构造函数赋值重载析构函数取地址重载函数const取地址函数 其中前四个默认成员函数最重要&#xff0c;后面两个默认成员函数一般不会用到&#xff0c;这里默认成员…

Js之运算符与表达式

运算符&#xff1a;也叫操作符&#xff0c;是一种符号。通过运算符可以对一个或多个值进行运算&#xff0c;并获取运算结果。 表达式&#xff1a;由数字、运算符、变量的组合&#xff08;组成的式子&#xff09;。 表达式最终都会有一个运算结果&#xff0c;我们将这个结果称…

从输入url到页面展示的过程

唠唠叨&#xff1a;我不想误人子弟&#xff0c;我这篇算是搬运工&#xff0c;加上自己的理解做点总结&#xff0c;所以还请大家科学上网去看这篇&#xff1a;https://aws.amazon.com/cn/blogs/mobile/what-happens-when-you-type-a-url-into-your-browser/ 是这六个步骤&#…

springboot论坛管理系统

论坛管理系统 摘要&#xff1a; 在社会快速发展的影响下&#xff0c;论坛管理系统继续发展&#xff0c;使论坛管理系统的管理和运营比过去十年更加信息化。依照这一现实为基础&#xff0c;设计一个快捷而又方便的网上论坛管理系统是一项十分重要并且有价值的事情。对于传统的论…

如何提升公众号搜索量?分享内部运营的5步优化技术!

最近一直有自媒体同行朋友在写关于公众号的内容&#xff0c;很多都说公众号现在没得玩了。其实&#xff0c;在运营自媒体上面&#xff0c;思维不通&#xff0c;技术不到位&#xff0c;哪个平台都不适合你玩。 想要在自媒体上面运营变现&#xff0c;一定不要先点击广告变现&…

【Linux】详解文件系统以及周边知识

一、磁盘的基本知识 磁盘中可以被划分成一个一个的环&#xff0c;每个环都是一个磁道。每个磁道又可以被均分成一个一个的扇区&#xff0c;扇区是磁盘IO的基本单位&#xff08;想要修改扇区中的一个比特位就必须把该扇区的全部比特位都加载到内存中&#xff09;。磁盘中的盘面&…