【进程地址空间】进程的独立性 | 虚拟地址物理地址 | 页表 | 写时拷贝

news2024/12/24 9:11:44

目录

前言

基本概念

进程的独立性

虚拟地址&物理地址

进程地址空间

页表(虚拟地址☞物理地址)

写时拷贝 

基本理解 

地址空间

写时拷贝(浅拷贝)

数据独立性的保证☞写时拷贝

写时拷贝的优点

图解分析


前言

我们在讲C语言的时候,给大家画过这样的空间布局图。但是我们并不理解,只是知道。这个空间布局图并不是语言层面上的,而是系统层面上的。

前面学习了两张表,命令行参数表和环境变量表。这里我们又出现新的问题?☞请看代码

  • 在 cnt < 5 之前,父子进程输出出来的变量值和地址是一模一样的,因为子进程按照父进程为模版(子共享父的代码和数据),父子并没有对变量进行进行任何修改。是对代码是只读。
  • 在cnt == 5 之后,父子进程,输出地址是一致的,但是变量内容不一样!

得出以下结论:

  • 变量内容不一样,所以父子进程输出的变量绝对不是同一个变量。
  • 但地址值是一样的,说明,该地址绝对不是物理地址!
  • 在Linux地址下,这种地址叫做 虚拟地址。
  • 我们在用C/C++语言所看到的地址,全部都是虚拟地址!
  • 物理地址,用户一概看不到,由OS统一管理。
  • OS必须负责将 虚拟地址 转化成 物理地址 。
  • 虚拟地址 从可执行程序加载到内存中得到,也就是从二进制的可执行程序得到。

所以之前说‘程序的地址空间’是不准确的,准确的应该说成 进程地址空间 ,那该如何理解呢?☞下面

注❗:关于进程的地址空间会讲解3~4次,信号和多线程都会再次深入理解,这里只是入门

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int g_val = 100;//数据--全局变量
int main()
{
        printf("father is running,pid:%d,ppid:%d\n",getpid(),getppid());//只有父进程对数据只读
        pid_t id = fork();
        if (id < 0)
        {
                perror("fork");
                return 0;
        }
        else if (id == 0)//子进程
        {
            int cnt = 0;
            while(1)
            {
                //child
                printf("I am child process,pid:%d,ppid:%d,g_val:%d,&g_val:%p\n",getpid(),getppid(),g_val,&g_val);
                sleep(1);
                cnt++;
                if(cnt == 5)//修改
                {
                    g_val = 300;
                    printf("I am child process,change g_val:%d->%d\n",100,300);
                }
             }
        }
        else
        { //father
             while(1)//只读
             {
                printf("I am parent process,pid:%d,ppid:%d,g_val:%d,&g_val:%p\n",getpid(),getppid(),g_val,&g_val);
                sleep(1);
             }
        }
        return 0;
}

基本概念

  • 进程的独立性:PCB+代码+数据(只读;写入-写时拷贝)
  • 虚拟地址&物理地址
  • 进程的地址空间
  • 页表:虚拟地址&物理地址的映射关系
  • 写时拷贝

进程的独立性

前面学习了进程具有独立性,对数据的处理具有独立性。但不是指父子进程就是老死不相往来的关系了,父子进程在数据的管理上面仍然具有交叉。在正常运行的情况下,一个进程的退出也不会影响另外一个进程。

  • 进程 = 内核数据结构(task_struct) + 代码 + 数据
  • 每个进程都有一份PCB,所以进程在内核数据结构的管理上是独立的。
  • 在只读的前提下,子进程会共享父进程的代码和数据。
  • 对于代码来说,代码是只读的,所以父子进程共享一份代码即可。
  • 对于数据来说,数据具有既可读又可写的属性,若只读,也只共享一份。但若一方要写入,则就会发生写时拷贝。所以,在数据上就可以体现进程的独立性。
  • 父进程的代码和数据能被子进程继承,包括命令行参数和环境变量表等。大部分数据字段都是无需修改的,只读即可。存在小部分的数据会被修改时,发生写时拷贝。
  • 数据:无论是全局变量还是局部变量都是一样的

❓什么写时拷贝呢☞下面

❓当程序被编译成二进制之后,程序的变量和函数名还存在吗

回答:当然不存在。变量名和函数名 被编译之后变成二进制文件之后,被全部替换成地址了。语言层面上来说,变量名和函数名是为了方便写代码。

虚拟地址&物理地址

以上文例子来看,无论是父进程还是子进程,&g_val是一样的,但是g_val却不一样。同一块内存空间的数值不可能存在两个值,所以可以确定的是&g_val的地址不是物理地址,那这是什么地址呢❓虚拟地址

进程地址空间

  • OS把程序的代码和数据从磁盘加载到物理内存当中。
  • 同时OS会为每一个进程创建一个PCB。
  • 同时OS也会为每一个进程创建一个进程地址空间。

进程地址空间

  • OS会把进程的代码和数据归列好放入地址空间的各个区域,供进程使用。
  • 进程的地址空间被划分为很多个区域:代码区/数据区/堆/栈等等。
  • 空间布局图是在OS内部,叫进程地址空间。是系统层面上的,和语言没有关系。
  • 进程的PCB是有一个链接属性是指向这个进程地址空间的。
  • 地址空间有32位和64位的,空间范围大小不一样的☞后序讲解。下面统一按照32位的来表示,从高到低总共有4G的进程空间范围。
  • LinuxOS中习惯低地址在下,高地址在上。(与平时画的相反)
  • 进程地址空间的地址是虚拟地址。是线性的,连续的。
  • 注意进程的PCB和代码/数据和程序地址空间都在物理内存中。
  • 访问数据/代码的时候,数据和代码都不在进程地址空间,而是存在于物理空间中。

结合上面的示例g_val,我们可知整个地址空间,我们打印的g_val的地址&g_val(即变量的地址)实际上就是该进程地址空间对应的地址,也就是虚拟地址。

页表(虚拟地址☞物理地址)

进程访问初始化的数据是怎样访问的呢❓

  • 找到进程地址空间中线性的该数据的虚拟地址
  • 根据虚拟地址在页表中查找到隐射关系
  • 根据隐射关系在物理内存中找到物理地址,即找到该数据
  • 关于页表,我们这里先当作一个整体,后面再细讲。

页表

  • 功能:将地址空间中的虚拟地址和物理内存中的物理地址之间建立隐射关系
  • 使用虚拟地址访问
  1. OS拿到虚拟地址
  2. 去页表查询
  3. 找到物理地址
  4. 找到物理地址所指向的物理内存空间,从而访问到数据

写时拷贝 

在上面我们遗留下一个问题:❓一个变量不可能同时存在多个内容。❗重点在数据

  • 进程访问代码/数据的时候用的都是虚拟地址间接访问物理内存中的数据和代码;不直接物理地址访问物理内存。(原因存在3点☞后面讲)
  • 子进程在被创建出来的时候,它的代码/数据初始化都是共享父进程的,PCB中的属性也和父进程差不多,除了pid,ppid之外等。
  • 程序的代码是只读的,所以父子进程共享一份即可
  • 程序的数据大部分也是不会写入,若要写入,子进程的数据就需要发生写时拷贝,然后初始化和父进程一样的。

概念:写时拷贝是浅拷贝解决浅拷贝析构冲突的一种解决方案,写时拷贝也叫延时拷贝,几个对象共用一块空间,当执行读操作时不会有影响,当你需要进行写操作改变一个对象的内容时,空间的值不能被修改,会互相影响,那么就需要单独开辟一块空间将对象拷贝过去然后改,不改变就不需要开辟。

优先:写时浅拷贝与深拷贝比较优点,占用空间少(相同内容不开辟新空间),复制效率高。


浅拷贝:有一块内存空间,有一个指针指向这块内存空间,进行拷贝的时候,并不会把数据拷贝一份,而是把数据/代码的地址拷贝一份

基本理解 

地址空间

OS会为每一个进程创建一个PCB和虚拟地址空间和独立的页表。

  • 如果有很多的进程,就有PCB,很多地址空间。
  • PCB需要管理,地址空间也需要管理。先组织,再描述。
  • 进程的地址空间本质上是一个内核数据结构-结构体
  • 地址空间的本质就是内核中的一个结构体对象。

父子进程
  • 父进程有自己的PCB(内部属性)和进程地址空间(内部属性)
  • 在创建时,只读阶段:子进程和父进程一样,全部照搬。
  • 子进程会把父进程的很多内核数据结构全拷贝一份,初始化基本一样。(除了个别的pid / ppid / 指针字段不考虑)

浅拷贝:有一块内存空间,有一个指针指向这块内存空间,进行拷贝的时候,并不会把数据拷贝一份,而是把数据/代码的地址拷贝一份

写时拷贝(浅拷贝)

在上面我们遗留下一个问题:❓一个变量不可能同时存在多个内容。

  • 创建子进程之后,子进程照搬父进程(只读层面)
  • 若这是我们子进程要写入:修改g_val的值
  • 发生写时拷贝
  • 再去修改写时拷贝后的子进程的g_val的值。
  • 可以做到直接把物理内存原本的g_val修改,但是子进程对数据写入修改,直接会影响到了父进程的g_val,直接影响父进程的运行)

原因:父子进程的g_val的存在物理内存中的物理地址不一样,但是他们的虚拟地址是一样的,所以打印出来的地址是一样的,但是变量内容不一样。这是因为相同的虚拟地址在各自的页表中存在不同的隐射关系,所指向的物理内存的物理地址不同,导致的变量的值不同。

数据独立性的保证☞写时拷贝

独立性:多进程运行,需要独享各种资源,多进程运行期间互不干扰。

进程在运行时保持独立性。OS在设计进程的独立性时候是怎样保证的❓以下操作都由OS自主完成。

  1. 当子进程对变量修改写入时
  2. OS发现子进程修改的变量不仅仅是子进程在使用,有其他的进程共享使用
  3. OS就暂停子进程的写入操作
  4. OS在物理内存空间重新开辟一段新的空间(含物理地址)(这个空间仅仅合适容纳这个要写入的数据的大小,不是全部数据拷贝一份❌)
  5. OS把以前和父进程共享的数据拷贝到新开辟的空间
  6. OS再把新的物理地址和旧的虚拟地址重新形成新的隐射关系
  7. OS于是让子进程继续写入操作

总:打印出来的是地址是虚拟地址(子进程从父进程继承下来的),各自都有自己独立的地址空间/页表/PCB,属性几乎一样。刚开始的值,地址都一样。一旦发生写入操作,OS底层就会发生写时拷贝(完成在物理内存独立分开的效果)

写时拷贝的优点

  • 如果父子进程不写入,数据默认是被父子共享的。(只读)
  • 如果一旦写入,就要发生写时拷贝。

为什么要这样做呢❓为什么不把父进程的数据全部拷贝一份给子进程随便使用呢❓

  • 进程具有独立性(数据独立) 
  • 因为在父进程当中有很多数据,父子进程不一样会修改,数据几乎不会改动。(命令行参数,环境变量等等)占用的空间却很大。如果全部拷贝一份,浪费空间。
  • 写时拷贝时是浅拷贝,不浪费空间,按需申请。

有人说写时拷贝很慢❓

  • 其实不然,如果按照每次创建子进程就拷贝一份全部的代码和数据。数据却又只修改少部分这种策略,是又慢又浪费空间时间。
  • 如果按需申请,相较于全拷贝,是节省空间和拷贝的次数(拷贝的时间)
  • 通过调整拷贝的时间顺序,达到有效的节省空间的目的。

图解分析

🙂感谢大家的阅读,若有错误和不足,欢迎指正。下篇深入理解进程的地址空间☞

  • 如何理解地址空间
  • 为什么要有地址空间
  • 如何进一步理解页表和写时拷贝
  • 如何理解虚拟地址

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1602345.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL-多表查询:多表查询分类、SQL99语法实现多表查询、UNION的使用、7种SQL JOINS的实现、SQL99语法新特性、多表查询SQL练习

多表查询 1. 一个案例引发的多表连接1.1 案例说明1.2 笛卡尔积&#xff08;或交叉连接&#xff09;的理解1.3 案例分析与问题解决 2. 多表查询分类讲解分类1&#xff1a;等值连接 vs 非等值连接等值连接非等值连接 分类2&#xff1a;自连接 vs 非自连接分类3&#xff1a;内连接…

JavaSE图书管理系统实战

代码仓库地址&#xff1a;Java图书管理系统 1.前言 该项目将JavaSE的封装继承多态三大特性&#xff0c;使用了大量面向对象的操作&#xff0c;有利于巩固理解 &#xff08;1&#xff09;实现效果 2.实现步骤 第一步先把框架搭建起来&#xff0c;即创建出人&#xff1a;管理员和…

九、OOP面向对象程序设计(四)

1、this、super、static和final关键字的使用 (1)this关键字的使用 当成员变量和局部变量重名时,在方法中使用this时,表示的是该方法所在类中的成员变量。 把当前对象当作参数传递时,可以用this。 有时候,我们会用到一些内部类和匿名类,如事件处理。当在匿名类中用thi…

第20天:信息打点-红蓝队自动化项目资产侦察企查产权武器库部署网络空间

第二十天 一、工具项目-红蓝队&自动化部署 自动化-武器库部署-F8x 项目地址&#xff1a;https://github.com/ffffffff0x/f8x 介绍&#xff1a;一款红/蓝队环境自动化部署工具,支持多种场景,渗透,开发,代理环境,服务可选项等.下载&#xff1a;wget -O f8x https://f8x.io…

从入门到精通C++之类和对象(续)

目录 初始化列表构造函数&#xff1f;拷贝构造&#xff1f;浅谈explicit关键字友元 内部类static成员总结 初始化列表 引入初始化列表&#xff1a;简化代码&#xff0c;提高效率 在编程中&#xff0c;初始化列表是一种用于在创建对象时初始化成员变量的快捷方式。通过初始化列…

神仙级Python入门教程(超级详细),从零基础入门到精通!!

关于Python学习指南 学好 Python 不论是就业还是做副业赚钱都不错&#xff0c;但要学会 Python 还是要有一个学习规划。最后给大家分享一份全套的 Python 学习资料&#xff0c;给那些想学习 Python 的小伙伴们一点帮助&#xff01; 包括&#xff1a;Python激活码安装包、Pyth…

RAG原理详解

什么是RAG 检索增强生成&#xff08;Retrieval Augmented Generation&#xff0c;简称RAG&#xff09;为大型语言模型&#xff08;LLMs&#xff09;提供了从某些数据源检索到的信息&#xff0c;以此作为生成答案的基础。简而言之&#xff0c;RAG是搜索LLM提示的结合&#xff0…

新标准日本语 课后练习

自学错误可能较多&#xff0c;听力题不需要听力的就没听录音 第二十課 スミスさんはピアノを弾くことができます 練習&#xff11;&#xff0d;&#xff11; &#xff11;張さんは日本の歌を歌うことができます 张先生会唱日本歌 &#xff12;小野さんは自転車に乗ることがで…

Doris Manager 24.0 版本正式发布!

Cluster Manager for Apache Doris&#xff08;简称 Doris Manager&#xff09;是 SelectDB 推出的管理运维 Apache Doris 集群的工具。用户可以轻松通过该工具部署和接管集群&#xff0c;实时查看集群的运行状态和详情&#xff0c;快捷地对集群进行扩缩容、升级及重启操作。同…

App Inventor 2 计时器组件,时间相关的用法都在这里

1、计时器在界面设计中的哪里&#xff1f; 2、计时器怎么启动&#xff1f; 默认计时器是自动启用的&#xff0c;也可程序控制它的属性“启用计时”和“不启用计时”。 3、怎么确定计时器执行没&#xff1f; 定一个数字全局变量&#xff0c;计时方法里面自增&#xff0c;然后输…

2024 CVPR AIGC集合

完全外行&#xff0c;不建议参考 一、3D重建 PointAvatar: Deformable Point-based Head Avatars from Videos 对原始颜色进行解纠缠&#xff0c;得到固有反射和相关阴影。 基于可变形点云对表情、颜色、位置等信息进行建模。 总结&#xff1a;可以看作是对局部像素的分解与扩…

gcc原理和使用

gcc gcc是什么 GCC&#xff0c;全称 GNU Compiler Collection&#xff08;GNU 编译器套件&#xff09;&#xff0c;是一套功能强大的编程语言编译器&#xff0c;由自由软件基金会&#xff08;Free Software Foundation, FSF&#xff09;作为GNU项目的一部分开发和维护。它最初…

【文献分享】机器学习 + 分子动力学 + 第一性原理 + 电导率 + 微观结构

​【文献分享】机器学习 分子动力学 第一性原理 电导率 微观结构 分享一篇关于机器学习 分子动力学 第一性原理 电导率 微观结构的文章。 感谢论文的原作者&#xff01; 关键词&#xff1a; 1. Machine learning force field 2. Molecular dynamics 3. Solid state …

刷题日记——质因数的个数

题目 分析&#xff08;从质数的判断角度出发&#xff09;&#xff08;递归&#xff09; 判断n是否是质数需要&#xff1a; 遍历&#xff0c;i从2开始到sqrt(n)&#xff0c;每次判断n是否能整除i&#xff0c;若能则不是质数&#xff0c;若不能则是 思路&#xff1a; 先判断n…

你也许不知道的 Confluence 快捷操作

Confluence 是一种企业知识管理和协作平台&#xff0c;用于创建、共享和组织团队的文档、知识和想法。它支持团队成员进行实时协作、评论和编辑文档&#xff0c;提供了强大的搜索功能&#xff0c;方便用户快速找到需要的信息。 Confluence 快捷键解析&#xff0c;标注了对应的…

SpringBoot多数据源(二)

SpringBoot多数据源AbstractRoutingDataSource&#xff08;二&#xff09; 1.多数据源配置2.多数据源调用流程3.实现 1.多数据源配置 spring-jdbc模块提供AbstractRoutingDataSource,其内部可以包含了多个DataSource&#xff0c; 然后在运行时来动态的访问数据库 2.多数据源…

新型大数据架构之湖仓一体(Lakehouse)架构特性说明——Lakehouse 架构(一)

文章目录 为什么需要新的数据架构&#xff1f;湖仓一体&#xff08;Lakehouse&#xff09;——新的大数据架构模式同时具备数仓与数据湖的优点湖仓一体架构存储层计算层 湖仓一体特性单一存储拥有数据仓库的查询性能存算分离开放式架构支持各种数据源类型支持各种使用方式架构简…

1.总结串口的发送和接收功能使用到的函数2.总结DMA的作用,和DMA+空闲中断的使用方式3.使用PWM+ADC光敏电阻完成光控灯的实验

1.总结串口的发送和接收功能使用到的函数 串口发送函数&#xff1a;HAL_StatusTypeDef HAL_UART_Transmit(UART_HandleTypeDef *huart, const uint8_t *pData, uint16_t Size, uint32_t Timeout) UART_HandleTypeDef *huart&#xff1a;指定要使用的串口 const uint8_t *pData&…

数智时代的AI人才粮仓模型解读白皮书(2024版)

来源&#xff1a;极客邦 自 2023 年上半年起&#xff0c;ChatGPT 等大模型技术蓬勃发展&#xff0c;AI 技术不断突破边界&#xff0c;展现 出惊人的潜力和发展速度。从早期的逻辑推理、专家系统&#xff0c;到如今的深度学习、神经网络&#xff0c; AI 技术显著缩小了科学与实…

宝宝洗衣机买几公斤?四款精心挑选实用婴儿洗衣机推荐

家里有孩子的&#xff0c;条件允许的话&#xff0c;婴儿洗衣机还是非常有必要买的。由于宝宝的年纪还小&#xff0c;使得宝宝的皮肤比较娇嫩&#xff0c;与成人衣物分开洗护&#xff0c;可以为宝宝带来更加健康的生长环境&#xff0c;并且可以避免与大人衣物混洗所带来的细菌的…