Linux中的fork与进程地址空间

news2025/1/15 7:27:40

目录

前言

一、进程地址空间

二、fork的值返回

三、高清图链接

总结


前言

        在博主的《进程状态解析》一文中,在讨论进程创建时,提到了一个系统调用接口fork,它在使用过程中表现出对于父子进程不一致的返回结果,而且似乎还具有多次返回的特点,那么本文就来详细解释一下其中的缘由。博文中涉及到的图片如若不清可点击链接查找高清图《博主码云》


一、进程地址空间

        在正式开始讲述之前我们先看一个有意思的现象(博主使用的centos7系统+shell,关于这个问题博主想说的是为了照应系统给我们实现的接口,不同的操作系统可能会有不同的方式,来实现这一目的,如果你对操作系统与硬件接口与我们使用的接口模糊不清的话可以看看博主写的这篇文章《浅谈冯诺依曼体系与Linux操作系统》),在windows平台上和Linux平台上同时执行以下码:

#include <stdio.h>
#include <stdlib.h>

 int global_init_val = 1;
 int global_uninit_val;
 int main()
 {

			 char* p1 = (char*)malloc(10);
			 char* p2 = (char*)malloc(10);
			 char* p3 = (char*)malloc(10);
			 static int static_uninit_val;
			 static int static_init_val = 2;
			 printf("i am stack!!     my address:%p %p %p\n", &p1, &p2, &p3);
			 printf("i am heap!!      my address:%p %p %p\n", p1, p2, p3);
			 printf("i am global!!    my address:%p %p   \n", &global_init_val, &global_uninit_val);
			 printf("i am function!!  my address:%p      \n", main);
			 printf("i am static!!    my address:%p %p   \n", &static_init_val, &static_uninit_val);
			 return 0;
}
图1.1        运行结果

        接下来的叙述将围绕这两张图展开。首先,我们可以看到在Linux平台下,两次运行结果是相同的,但是反观windows平台,两次运行结果得到的变量地址是不同的。这就是平台实现之间的差异,虽然他们都成功完成了对应的功能,但还是可以反映出处理的逻辑是不同的,但是就我们理解,Windows更符合我们的预期,Linux的处理反而让我们疑惑,我们都知道程序运行需要加载的内存,而内存又是随机存储的,所以两次打印数据分布地址是相同的,我们不妨大胆假设,程序显示的地址并非真正的物理内存,而是一种虚拟地址空间!!!!

那么到底是怎么实现的呢?这就要提到Linux处理的一种方式——进程地址空间。

        在进程开始执行的时候,Linux操作系统会同时为进程申请一块名为进程地址空间(就是一块空间)的空间,这个空间储存的是进程数据的虚拟地址(虚拟地址就是可以通过一定映射关系映射到实际唯一物理内存地址的地址,关于其意义稍后解释),操作系统会将虚拟地址表与物理内存地址表建立映射关系,以达到定址访问的效果。

也许你现在听的晕头转向——啥是映射关系?映射关系是如何建立的??

        我们先来解释映射关系,实际上我们常常使用的数组就是一种经典的映射关系。你应该知道,我们可以通过下标的形式来访问数组中的元素,这就是一种朴素的映射关系,就像我们知道如果我们使用下标0就可以访问数组中的第一个元素,使用下标1就可以访问数组中的第二元素一样。这就是一种映射关系(注意:映射关系应该是一 一对应的逻辑,不应该存在多对一、一对多的情况)。

图1.2        数组的映射关系

        所以我们的操作系统是如何将虚拟地址映射为物理内存地址的呢?

参照数组映射关系,操作系统也对虚拟地址和物理内存进行了映射:

图1.3        映射关系与管理解耦

在计算机解读映射关系的时候会将页表读取到CPU中的MMU(内存管理单元)中,而后CPU读取正文代码进程程序的执行。 

这里的管理虚拟地址与物理内存的映射表被称作“页表”,关于页表是什么不是本文的重点,这个内容将在其他文章中进行讲解。那么说了这么多,我们需要考虑一下为什么Linux要这样进行设计。

1.首先因为操作系统使用的虚拟的地址+页表的映射方式,这意味着有心之人是无法通过虚拟的地址对核心数据进行破坏。

2.其次因为进程地址空间是一块连续的空间,这意味着对于数据管理要比非连续空间的轻松的多。

3. 最重要的是,操作系统只需要管理进程地址空间就可以对进程管理,可以无需考虑内存管理的影响——将进程管理与内存管理进行解耦。

二、fork的值返回

        上文解释了这样一个非常重要的点,就是在进程使用的并非是真实的物理内存地址,而是使用的是一种虚拟地址。那么现在我们看一个这样的示例:

图2.1        测试代码与结果

         从上图中我们不难发现,在子进程与父进程中的id变量是同一个。我们知道这样一个事实,进程与进程之间是相互独立运行的,对于父子进程更是如此,虽然父子进程共享fork之后的代码,与数据(需要注意的是页表数据也会被共享)。(页表是随着进程的创建而创建,这里指的共享指的是数据共享,而非页表共享)

但是我们也要考虑:

        当一个进程对变量进行改变时,为了不影响其父子进程,被修改的变量就必须与其父子进程不同的一份变量——这样的行为叫做“进程的写时拷贝”,当父子进程中共享数据改变时,改变数据的进程需要额外申请一块空间来存储改变的数据。具体的关系可参考图2.2

图2.2        写时拷贝数据关系图

        顺带一提为什么即使要更改还是要将原数据拷贝进新开辟的空间中,我们要知道数据不一定是内置类型,他可能是复杂的自定义类型数据,对于这样的数据,有可能我们只是修改自定义类型数据中的一部分,所以还是要将其他没有更改的数据进行拷贝的。

         好了,现在让我们把目光放回到fork本身并在靠近一点观察它,我们知道fork也是一个有返回值的函数,那么在该函数进行返回值之前就一定已经将子进程开辟好并进行管理了,那我们之前说的父子进程共享fork之后的数据实际上可以进行一下更正——父子进程共享子进程完成创建并组织后的数据,所以父子进程也共享返回语句,因为父子进程各自进行一次返回,所以fork才会看起来返回了两次,有两个返回值。那返回值语句都被共享了,那么id变量呢?诚然其也被共享!但父子进程的fork返回对id变量进行了更改,进而引发了我们刚刚说的写时拷贝,由于我们所能看见的是虚拟地址,所以才会出现地址相同内容不同的错觉。

那么我们将父子进程套入到我们说的写时拷贝是什么样子的呢?

图2.3        fork返回值的写时拷贝问题

        到这我们解释清楚了为什么fork会呈现不同的返回值,一个变量为什么会有多个值的原因。

三、高清图链接

本文涉及到了一些不太清晰的图片想要获取这些图片点击博主码云即可获取【点我】


总结

本文解释了有关fork的一些特殊现象并解释了一些有关进程空间的概念。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1668708.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动手学机器学习15 实战kaggle比赛

动手学机器学习15 实战kaggle比赛 1. 实战kaggle比赛&#xff1a;预测房价代码结果 2. 课程竞赛&#xff1a;加州2020年房价预测3. QA4. 用到的代码1. hashlib.sha1()2. sha1.update(data)3. train_data.iloc4. fillna(0)5. pd.get_dummies(&#xff09;6. nn.MSELoss()7. torc…

医疗行业面临的网络安全挑战及应对策略

网络攻击已经成为各行各业日益严重的威胁&#xff0c;但医疗行业尤其容易受到影响。2023年&#xff0c;医疗领域的黑客事件占数据泄露的79.7%。 医疗领域 虽然患者、医疗服务提供者和决策者都对保护医疗信息有所关注&#xff0c;但关键的弱点在于提供电子健康记录&#xff08;…

何为小波变换?

一、数学基础 小波 变换脱胎于傅里叶变换&#xff0c;但是有着傅里叶变换的优点。 1.1 点乘&#xff08;内积&#xff09; a 6; b 8; 点乘的作用&#xff1a;衡量两个事物的相似度&#xff08;Similarity&#xff09; 夹角变小&#xff0c;点乘结果变大&#xff0c;结果越…

Vscode----远程服务器改名

问题描述 一开始Autodl服务器机子很多,但是我使用vscode的时候他们的名字都一样,导致每次要打开机子是都需要重新输入ssh和密码 解决方法 修改vscode端服务器的名字即可解决 打开远程设置,选择你的ssh配置文件 将Host改为你想要的名字,保存刷新即可 点击访问博客查看更多…

全国药品价格目录数据库-药品价格查询

药品定价是一个复杂且多维的问题&#xff0c;它涉及到医疗保健系统、政府政策、市场需求、研发成本以及药品效果等多个因素。随着中国医疗改革的不断深入&#xff0c;药品定价机制也在逐步调整和完善。本文将详细探讨我国药品定价机制&#xff0c;包括其发展历程、定价方法、影…

【顺序程序设计-谭浩强适配】(适合专升本、考研)

无偿分享学习资料&#xff0c;需要的小伙伴评论区或私信dd。。。 无偿分享学习资料&#xff0c;需要的小伙伴评论区或私信dd。。。 无偿分享学习资料&#xff0c;需要的小伙伴评论区或私信dd。。。 完整资料如下&#xff1a;纯干货、纯干货、纯干货&#xff01;&#xff01;…

其他的 框架安全:Apache Solr 远程代码漏洞.(CVE-2019-0193)

什么是 Apache Solr Apache Solr是一个开源的搜索服务&#xff0c;便用Java语言开发&#xff0c;主要基于 HTTP 和ApacheLucene 实现的。Sor是一个高性能&#xff0c;采用Java5开发&#xff0c;基于Lucene的全文搜索服务器。 目录&#xff1a; 什么是 Apache Solr 生成的漏…

在统计上城乡是如何划分的

城乡二元结构&#xff0c;是长期以来我国经济社会发展的显著特点之一&#xff0c;党和政府高度重视统筹城乡发展&#xff0c;缩小城乡差距。为了对城乡发展予以准确反映和动态监测&#xff0c;提高在统计上划分城乡工作的一致性&#xff0c;国家统计局开展了统一的统计用区划代…

Redis 的 SDS 和 C 中字符串相比有什么优势?

C 语言使用了一个长度为 N1 的字符数组来表示长度为 N 的字符串&#xff0c;并且字符数组最后一个元素总是 \0&#xff0c;这种简单的字符串表示方式 不符合 Redis 对字符串在安全性、效率以及功能方面的要求。 C语言的字符串可能有什么问题&#xff1f; 这样简单的数据结构可…

vs2019 cpp20 规范的线程头文件 <thread> 注释并探讨两个问题

&#xff08;1&#xff09;学习线程&#xff0c;与学习其它容器一样&#xff0c;要多读 STL 库的源码。很多知识就显然而然的明白了。也不用死记硬背一些结论。上面上传了一份注释了一下的 源码。主要是补充泛型推导与函数调用链。基于注释后的源码探讨几个知识点。 STL 库的多…

LeetCode100题总结

LeetCode100题总结 前言LeetCode100题总结题型梳理双指针11. 盛最多水的容器234.回文链表75.颜色分类206.反转链表142.环形链表215.三数之和 滑动窗口3. 无重复字符的最长子串209. 长度最小的子数组438. 找到字符串中所有字母异位词 广搜102. 二叉树的层序遍历200. 岛屿数量617…

Mysql 8.0.33 迁移至 Postgresql 16.2

小伙伴们&#xff0c;你们好&#xff0c;我是老寇&#xff0c;我又回来&#xff0c;几个月不见&#xff0c;甚是想念啊&#xff01;&#xff01;&#xff01;&#xff01; 这不&#xff0c;云平台需要改造&#xff0c;将Mysql替换成Postgresql&#xff0c;话说回来&#xff0c…

中国速度!滑湿人自己的MFC第一课!

前言&#xff1a; 这&#xff01;是一个&#xff01;新的专栏&#xff01; 因为&#xff01;面向对象的程序设计&#xff01;已经&#xff01;学的差不多了&#xff01; 我谭哥那本大厚书&#xff01;也快&#xff01;学完了&#xff01; 于是&#xff01;sgq&#xff01;为…

利用爬虫解决数据采集难题

文章目录 安装为什么选择 BeautifulSoup 和 requests&#xff1f;安装 BeautifulSoup 和 requests解决安装问题 示例总结 在现代信息时代&#xff0c;数据是企业决策和发展的关键。然而&#xff0c;许多有用的数据分散在网络上&#xff0c;且以各种格式和结构存在&#xff0c;因…

二.基础篇: 面向对象进阶

1. 基础篇语法篇&#xff1a;一.基础篇&#xff1a;基础语法-CSDN博客 面向对象进阶 本章主要学习内容&#xff1a; static继承包&#xff0c;final&#xff0c;权限修饰符&#xff0c;代码块抽象类接口多态内部类 1. static static翻译过来就是静态的意思static表示静态&am…

wordpress增加谷歌分析

wordpress增加谷歌分析 为了更好的浏览体验&#xff0c;欢迎光顾勤奋的凯尔森同学个人博客 http://www.huerpu.cc:7000 一、创建谷歌分析账号与媒体应用 谷歌分析地址&#xff1a;https://analytics.google.com/analytics 创建一个账号&#xff0c;如果你没有的话。 在该账…

基于51单片机的遥控开关仿真

基于51单片机的遥控开关设计 &#xff08;仿真&#xff0b;程序&#xff0b;设计报告&#xff09; 功能介绍 具体功能&#xff1a; 本课题研究的是一款遥控开关&#xff0c;采用51单片机进行发射电路与接收电路的设计&#xff0c;发射电路由单片机最小系统及四个按键构成&am…

鸿蒙应用开发DevEco Studio工程目录模块介绍

面向开发者&#xff0c;HarmonyOS 推出了 DevEco Studio 和 Dev Device Tool 两款开发工具&#xff0c;前者目前迭代至 3.1 版本&#xff08;对外开放版本&#xff09;&#xff0c;用于开发 HarmonyOS 应用&#xff1b;后者用于开发智能设备 应用的工程主体结构如上图 在这里我…

Python网络爬虫原理及实践(2)

2.4.1.2. HTML源码分析 Web端站点和M端站点返回结果都是HTML格式&#xff0c;部分站点为了提升页面渲染速度&#xff0c;或者为了增加代码分析难度&#xff0c;通过动态JavaScrip执行等方式&#xff0c;动态生成HTML页面&#xff0c;网络爬虫缺少JS执行和渲染过程&#xff0c;…

【计算机网络篇】数据链路层(9)使用集线器的共享式以太网

文章目录 &#x1f6f8;使用同轴电缆的共享总线以太网 &#x1f386;使用集线器的共享式以太网&#x1f95a;集线器的特点 &#x1f354;10BASE-T星型以太网 &#x1f6f8;使用同轴电缆的共享总线以太网 若总线上的某个机械连接点接触不良或断开&#xff0c;则整个网络通信就不…