【Linux】进程地址空间(初步了解)

news2024/10/4 23:56:11

文章目录

  • 1. 奇怪的现象
  • 2. 虚拟地址空间
  • 3. 关于页表
  • 4. 为什么要有虚拟地址

在这里插入图片描述

1. 奇怪的现象

我们先看一个现象:
在这里插入图片描述
为什么父子进程从“同一块地址中”读取到的值不一样呢?

因为这个地址不是物理内存的地址 ,如果是物理内存的地址是绝对不可能出现该现象的!

在Linux地址下,这种地址叫做虚拟地址(线性地址)
我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理。

相信大家在未学习Linux之前一定看过下图中C/C++中程序内存区间划分图,但是它根本不是一个程序的内存布局,它应该叫做进程地址空间布局,它不属于语言的范畴,属于系统范畴。
在这里插入图片描述

2. 虚拟地址空间

对操作系统而言,物理空间是有限的,为了避免进程之间“不合理的”使用,OS会给每个进程都画一张进程地址空间布局的“大饼”,它让每个进程都自以为自己可以使用大小为空间布局中所示的空间(上图右图所示),在进程申请空间的时候,OS再确定空间是否足够,是否分配给进程。

OS对于所画的“饼”也要进行管理,这个“饼”就是进程虚拟地址空间,本质上是一种内核数据结构的对象(mm_struct)(类似于PCB)。

所以当我们创建一个进程的时候,会有一个task_struct对应的数据结构,为了不让该进程直接访问物理内存,因此在二者之间,OS设计了一种数据结构mm_struct(当前进程的地址空间,即饼)。每个进程都随时随地携带被画的“饼”,每次它访问物理内存时,都要通过饼进行访问。
在这里插入图片描述

对于虚拟地址空间中的划分,是如何做的呢?

  • 因为虚拟地址空间对应的是一个数据结构,所以就可以在其内部设置各个区域的开始和结束位置即可,下图为Linux内核源代码
    在这里插入图片描述

尽管有了虚拟地址空间区域划分后,但是进程的代码和数据也是需要占据物理内存的,每一个数据都要占据物理地址,那如何从划分的区域找出对应的物理地址呢?

在操作系统内部,会构建一个叫做页表的东西。
在这里插入图片描述

所以,一个进程所能看到的所有的地址,全部都会经过页表的映射,映射到特定的物理内存中;然后让用户使用虚拟地址,去访问对应的物理地址。
在这里插入图片描述

所以,虚拟地址空间+页表 = 虚拟内存的管理方案

在创建子进程时,子进程会以父进程为模板,构建自己的PCB、虚拟地址空间、页表。所以父子进程指向同样的物理内存。
在这里插入图片描述

在父子不修改指向的同一块地址时,数据其实是共享的。
在一个进程修改数据时,由于进程具有独立性,会先发生写时拷贝,页表中虚拟地址的内容不变,只对要修改的数据重新申请一个新的物理地址,同时修改页表中物理地址的内容即可。
在这里插入图片描述
这也就能解释最开始时我们所看到的奇怪现象了。仅仅是它们的虚拟地址相同,物理地址不同罢了
在这里插入图片描述

所以我们可以更新一下进程的定义了,进程 = 内核数据结构(task_struct、mm_struct、页表)+ 自己的代码和数据。

所以为什么进程具有独立性呢?

  • 因为它们的PCB、虚拟地址空间、页表都是各自一份;对于代码和数据采用写时拷贝的机制各自私有一份。
  • 由于它的内核数据结构各自一份,代码和数据也是独立的,所以进程也就是独立的。

因此,进程与虚拟地址空间mm_struct是强绑定的。那么虚拟地址空间中的已初始化、未初始化、字符常量区也就会随着进程一直存在,直到进程结束,虚拟地址空间被释放。

那么全局变量的虚拟地址也就一直被大家看到,所以我们所定义的全局变量具有全局性。

3. 关于页表

页表中除了虚拟地址和物理地址的映射以外,还有很多的标记位,例如:

  1. 权限标记位rwx

用于标记当前虚拟地址所映射的物理地址是否具有rwx权限。

  • 当具有w权限时,你就可以对物理地址上的内容进行写入;
  • 当没有w权限,如果对物理地址进行写入,操作系统就可能将进程杀掉。
    • 对常量字符串进行修改,程序崩掉就是该原因。char *str = “hello”; *str = ‘C’;
    • 运行崩溃,编译不报错,因为这是操作系统运行时才能发现的问题。所以编译器为了检查该类问题,引入了const关键字
  1. isexists

用于标记虚拟地址所对应的物理地址是否在内存中存在(目标数据是否在内存中)。为什么存在这个标记位呢?

  • 当磁盘中的代码量过大,超出内存的大小,无法一次性全部加载到内存中;而且代码中已经跑过的代码没有必要继续在存放在内存中,所以代码不是一下子全部加载到内存中,而是分批加载到内存中。
  • 那么该标记位的作用就是:目标数据是否加载到内存中,通过该标记位就可以知道
    • 如果已经加载到内存中了,直接按照虚拟与物理的映射进行访问;
    • 如果未加载到内存中,操作系统会帮我们加载。
  • 有了该标记位,就可以支持分批加载 、挂起等操作。

4. 为什么要有虚拟地址

  1. 虚拟地址空间+页表,可保护内存
  • 检查所访问的地址是否正确
    • 例如野指针,野指针对应的虚拟地址在页表中根本不存在,也就没有映射关系或者映射关系权限不对,操作系统直接拦住,不允许你访问物理内存。
  • 虚拟地址允许操作系统实施更精细的权限控制,通过设置不同的虚拟地址空间,操作系统可以控制哪些部分是只读、可写、可执行的,进一步提高了系统的安全性。
  1. 进程管理与内存管理解耦合
  • 进程管理

    • 虚拟地址为每个进程提供了一个独立的地址空间,使得每个进程都认为它是在独占的内存空间中运行,这个空间在逻辑上是连续的,但实际上是由操作系统进行分段和分页管理的。
    • 进程管理模块只需要关注进程的创建、调度和终止等操作,而无需关心物理内存的实际布局和大小,而是通过一个统一的虚拟地址来访问内存。
  • 内存管理

    • 内存管理模块则负责内存资源的分配、回收和优化等操作,可以根据系统的实际内存情况和需求进行独立管理。

简而言之,进程要被创建,和内存没关系。进程只需要将PCB、地址空间、页表构建好,进程中申请的各种空间,全部在虚拟地址中设置完毕,来骗过进程,等进程后续真正使用的时候,物理内存才真正被申请,以提高物理内存的使用率,虚拟和物理地址二者具有滞后性,各自独立。

如果没有虚拟地址,在对进程进行管理时,还需要考虑内存管理的问题。此时进程若申请内存,就会立马给它,所以还要考虑内存管理的问题(内存分配、回收和置换等复杂操作。)

  1. 让进程以统一的视角看待物理内存

由于有了页表做映射,所以代码和数据在物理内存中可以任意存放,即代码和数据可以加载到物理内存的任意地方。

尽管你在物理内存中是无序的,但我进程看虚拟地址永远是有序的,是一个无序变有序的过程。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2188938.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++【类和对象】(友元、内部类与匿名对象)

文章目录 1.友元2.内部类3.匿名对象结语 1.友元 友元提供了⼀种突破类访问限定符封装的方式,友元分为:友元函数和友元类,在函数声明或者类声明的前面加friend,并且把友元声明放到⼀个类的里面。外部友元函数可访问类的私有和保护…

【安全科普】从“微信文件助手隐私泄漏”看社交平台网络安全

随着互联网技术的飞速发展,社交平台已经成为了人们日常生活中不可或缺的一部分。人们通过社交平台与亲朋好友保持联系,分享生活点滴,获取资讯信息。然而,与此同时,社交平台上的网络安全风险也日益凸显。近期&#xff0…

简单的a+b-C语言

1.问题: 输入两个整数a和b,计算ab的和。 2.解答: scanf()函数是通用终端格式化输入函数,它从标准输入设备(键盘) 读取输入的信息。可以读入任何固有类型的数据并自动把数值变换成适当的机内格式。 scanf()函数返回值分为3种&…

分布式学习02-CAP理论

文章目录 CAP三指标一致性可用性分区容错性 CAP不可能三角P存在的必要性CP理论AP理论 CAP理论对分布式系统的特性做了高度抽象,将其抽象为一致性、可用性、分区容错性。 并对特征间的冲突做了总结:CAP不可能三角。 CAP三指标 一致性(Consis…

【NIO基础】基于 NIO 中的组件实现对文件的操作(文件编程),FileChannel 详解

目录 1、FileChannel (1)获取 FileChannel (2)读取文件 (3)写入文件 (4)关闭通道 (5)当前位置与文件大小 (6)强制写入磁盘 2、两个 FileChannel 之间的数据传输 (1)使用 transferTo()…

HTML的修饰(CSS) -- 第三课

文章目录 前言一、CSS是什么?二、使用方式1. 基本语法2. 引入方式1.行内式2.内嵌式3. 链入式 3. 选择器1. 标签选择器2.类选择器3. id选择器4. 通配符选择器 4. css属性1. 文本样式属性2. 文本外观属性 5. 元素类型及其转换1. 元素的类型2. 元素的转换 6.css高级特性…

isinstance()学习

aa {} if isinstance(aa,dict):print("是")aa 2 if isinstance(aa,dict):print("是")aa 2 if isinstance(aa,int):print("是")aa [] if isinstance(aa,list):print("list")aa [1,2,3] if isinstance(aa,list):print("list"…

模拟算法(4)_外观数列

个人主页:C忠实粉丝 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 C忠实粉丝 原创 模拟算法(4)_外观数列 收录于专栏【经典算法练习】 本专栏旨在分享学习算法的一点学习笔记,欢迎大家在评论区交流讨论💌 目录 1. 题目链…

选择排序:直接选择排序、堆排序

目录 直接选择排序 1.选择排序的基本思想 2.直接选择排序的基本思想 3.直接插入排序的代码思路步骤 4.直接选择排序代码 5.直接选择排序的特性总结 堆排序 一、排升序,建大堆 1.利用向上调整函数建大堆 1.1.建立大堆的思路 1.2.以下是具体步骤&#xff1a…

Android Framework AMS(01)AMS启动及相关初始化1-4

该系列文章总纲链接:专题总纲目录 Android Framework 总纲 本章关键点总结 & 说明: 说明:本章节主要涉及systemserver启动AMS及初始化AMS相关操作。同时由于该部分内容分析过多,因此拆成2个章节,本章节是第一章节&…

Solidity 存储和内存管理:深入理解与高效优化

在 Solidity 中,存储和内存管理是编写高效智能合约的关键组成部分。合约执行的每一步操作都可能涉及到数据的存储和读取,而这些操作对 gas 的消耗有很大影响。因此,理解 Solidity 的存储模型以及如何优化数据的管理对于合约的安全性、性能和成…

pytorch之梯度累加

1.什么是梯度? 梯度可以理解为一个多变量函数的变化率,它告诉我们在某一点上,函数的输出如何随输入的变化而变化。更直观地说,梯度指示了最优化方向。 在机器学习中的作用:在训练模型时,我们的目标是最小…

day2网络编程项目的框架

基于终端的 UDP云聊天系统 开发环境 Linux 系统GCCUDPmakefilesqlite3 功能描述 通过 UDP 网络使服务器与客户端进行通信吗,从而实现云聊天。 Sqlite数据库 用户在加入聊天室前,需要先进行用户登录或注册操作,并将注册的用户信息&#xf…

P4、P4D、HelixSwarm 各种技术问题咨询

多年大型项目P4仓库运维经验,为你解决各种部署以及标准工业化流程问题。 Perforce 官网SDPHelixCore GuideHelixSwarm GuideHelixSwarm Download

SpringBoot基础(三):Logback日志

SpringBoot基础系列文章 SpringBoot基础(一):快速入门 SpringBoot基础(二):配置文件详解 SpringBoot基础(三):Logback日志 目录 一、日志依赖二、日志格式1、记录日志2、默认输出格式3、springboot默认日志配置 三、日志级别1、基础设置2、…

家长们,你们认为孩子沉迷游戏严重还是沉迷Linux严重呢

matrix禁食 ​ 计算机技术与软件专业技术资格证持证人 ​ 关注 谢邀 Hieronymus no-sh 218 人赞同了该回答 十年前,你还能得到一个自己能控制的计算机系统,现在,窗口期早走过了。普通人不懂软件,但因该懂人心啊,人心一…

使用Apifox创建接口文档,部署第一个简单的基于Vue+Axios的前端项目

前言 在当今软件开发的过程中,接口文档的创建至关重要,它不仅能够帮助开发人员更好地理解系统架构,还能确保前后端开发的有效协同。Apifox作为一款集API文档管理、接口调试、Mock数据模拟为一体的工具,能够大幅度提高开发效率。在…

武汉自闭症儿童寄宿学校:开启学习与成长的新篇章

武汉与广州的自闭症教育之光:星贝育园开启学习与成长新篇章 在自闭症儿童教育的广阔领域,寄宿学校以其独特的教育模式和全方位的关怀,为这些特殊孩子提供了学习、成长与融入社会的宝贵机会。虽然本文标题提及了武汉自闭症儿童寄宿学校&#…

【HTML+CSS】仿电子美学打造响应式留言板

创建一个响应式的留言板 在这篇文章中,我们将学习如何创建一个简单而美观的留言板,它将包括基本的样式和动画效果,以及响应式设计,确保在不同设备上都能良好显示。 HTML 结构 首先,我们创建基本的HTML结构。留言板由…

8646 基数排序

### 思路 基数排序是一种非比较型排序算法,通过逐位(从最低位到最高位)对数字进行排序。每次分配和收集后输出当前排序结果。 ### 伪代码 1. 读取输入的待排序关键字个数n。 2. 读取n个待排序关键字并存储在数组中。 3. 对数组进行基数排序&…