深入Linux系列之进程地址空间

news2025/2/9 7:06:27

深入Linux系列之进程地址空间

1.引入

那么在之前的学习中,我们知道我们创建一个子进程的话,我们可以在代码层面调用fork函数来创建我们的子进程,那么fork函数的返回值根据我们当前所处进程的上下文是返回不同的值,它在父进程中返回子进程的PID,在子进程中则会返回0,那么我们可以利用返回值然后定义一个变量来接收这个返回值,然后通过if else逻辑达到让我们的父子进程有着不同的执行流的目的,那么想必刚才所说的过程对于你来说已经十分熟悉,对于fork函数如何使用也已经轻车熟路,但是在刚才的过程中,我们唯独会有一个疑问,也就是我们定义的一个变量来接收这个返回值,同一个变量在不同的进程中竟然会出现两个不同的值,那么这就和我们的理解有点冲突,因为一个变量当前赋值且没被修改的情况下不可能具有两个不同的值,就像一个人只能拥有一种性别一样。
在这里插入图片描述

那么我们之前的文章也详细介绍过我们的fork,但是对于这个情况,当时并没有提及,那么我们现在来思考一下为什么会出现这样的现象,那么我们知道我们进程是具有独立性,那么要做到独立性也就意味着我们父子进程的数据不能做到共享,为此做到该数据独立性,那么我们的fork函数会采取写时拷贝的机制,那么我们如果子进程读取我们父进程的数据,那么此时子进程会与父进程共享一个物理内存页面,但是如果我们子进程要对数据进行写入操作的话,那么这时则会触发写时拷贝机制,那么我们操作系统会为其要写入的数据专门拷贝得到一个副本,然后在这个副本中做写入,从而做到独立性,所以根据我们之前对fork函数的学习以及认识,有了这个写时拷贝机制,我们认为此时我们父子进程关于接收这个返回值的变量,那么它一定是有两份副本,一份是父进程,一份是子进程,所以也就解释了它为什么能够具备有两个值。

​ 那么接下来可以用c语言写一段简单的代码来实验,验证我们刚才的推理的成立,代码逻辑也很简单,那么在代码中定义一个int类型全局变量g_val,然后用fork返回值让父子进程有着不同的执行流,然后我们让子进程对g_val进行修改,然后接着父子进程分别打印这个全局变量的值以及对应的地址,如果打印的结果是子进程中的全局变量的值是修改后的结果,并且对应的地址与父进程不同,那么就能够验证我们之前的结论。
在这里插入图片描述
在这里插入图片描述

那么我们根据结果发现,值确实不同,但是地址是相同的,那么值不同证明父子进程确实对于g_val有各自对应的副本,所以子进程的值与父进程的不同,那么能够验证我们刚才所说的结论,那么既然g_val在父子进程中有着各自对应的一份副本,那么地址不可能是相同的,那么既然是相同的,那么只能说明一个原因,那就是这个地址不是实际的物理内存地址,那么这个地址究竟是什么呢,那么这就和本文的主题进程地址空间有关了,那么这个地址就是虚拟地址。

2.进程地址空间

那么在我们之前对于进程的理解上有得添加一个新的内容,也就是进程地址空间。

我们知道我们进程的内核数据是被加载到我们的内存中的,而当我们的进程被调度到CPU当中运行的话,那么我们CPU得从我们内存中获取我们进程的各种内核数据,我们知道我们CPU以及内存以及外部的io设备都是一个独立的工作单元,那么它们要协同工作的话,就得用“线”来连接,那么数据通过该线在各个工作单元中流通,那么其中这里的线我们可以分为数据线与地址线。

那么同理我们的CPU与我们的内存也有数据线以及地址线连接,那么顾名思义,地址线就是用来专门传输地址内容,而数据线是用来传输数据内容的,那么以32为机器为例,那么我们的CPU与我们的内存的地址线有32根,那么每一根地址线根据其高低电频的电信号分别用来表示二进制的0和1,那么我们的CPU就能根据各个地址线的高低电频信号组合得到一个二进制序列,而这个二进制序列就是我们的地址,那么内存的寻址器获取到地址后,会到内存的对应位置得到CPU要获取的数据,然后通过数据线传给CPU当中的寄存器,那么这32根地址线每一根线只能表示两种不同的信息,要么是0或者1,所以我们这32根地址线总共就能表示出2的32次方个不同的地址,那么它的范围是从0000 0000到FFFF FFFF。
在这里插入图片描述

那么我们知道我们这32根地址线只能表示0000 0000到FFFF FFFF范围上的所有地址,那么我们这0000 0000到FFFF FFFF范围上连续的地址便是我们的进程的地址空间,也就意味着,我们进程的各种数据,那么他们的地址只能在这个范围上,不能超出这个范围,因为我们CPU的32根地址线只能表示这么多,那么我们操作系统为了管理这个进程地址空间,采取的方式是我们最熟悉的先描述,再组织,那么它在我们进程所对应的task_struct结构体中,定义了一个指向mm_struct结构体。

而没错这个mm_struct结构体就是用来描述我们的进程地址空间,那么它里面会有两个字段来表示这个进程地址空间的起始位置与结束位置,那么通过这个mm_struct结构体就能在抽象建模出我们的进程地址空间。

而进程地址空间的设计还不至于此,那么我们进程地址空间还专门进行了内存的布局,将其分为了代码段以及数据段,然后再数据段中的不同范围还分为了常量区,堆区,栈区等,那么这些名词在我们的语言的学习上想必都听闻过。

那么至于为什么对我们的进程地址空间进行内存布局,那么我们可以拿生活中的一个例子来理解,就假设你是一个读者,要去图书馆借阅书籍,那么如果我们的图书馆的各种类型的数据是随意摆放,各种类型的书籍都在同一个书架上,那么我们读者要寻找到目标书籍的时间开销是很大的,但是如果图书馆将这些数据按照类型分不同楼层,按首字母分不同书架,那么我们查找以及图书馆管理起来就很方便。

根据这个例子我们便知道要为进程地址空间布局的一个重要原因,那么便是对于数据的查找以及内存管理,那么具体实现则是我们的mm_struct结构体在包含其他各个数据段的结构体指针,那么对应该数据段的结构体就包含起始位置以及结束位置的两个字段或者直接包含各个数据段的起始以及结束的字段,那么通过我们的mm_struct结构体,我们就对内存有着统一的布局和视角来看待。
在这里插入图片描述

而在我们进程地址空间上的各个地址,这些地址也就是所谓的虚拟地址,所谓虚拟,也就是说它并不是我们该数据真实在物理内存当中的地址,那么之所以我们不给我们的数据直接分配物理地址,原因也很简单,那么就是安全,那么如果我们用户直接接触到了物理地址,那么我们可以对数据的篡改以及覆盖的行为是不受阻拦的,那么这个虚拟地址就像是一个屏障,将其与物理地址隔开,那么我们对物理内存的任何操作意味着都要受到约束或者阻拦,这维护了数据以及系统的安全。

那么既然我们只能看到虚拟地址,那么我们内存器要获取数据那么肯定得是要我们的真实的物理地址,那么必然得需要将我们的虚拟地址转换为我们的物理地址,那么就有了我们页表的存在。

那么页表是一个数据结构,那么它建立了虚拟地址到物理地址的一个映射,并且还为每个数据设置了是否具有读写权限的字段信息,那么我们可以通过页表将虚拟地址转化为物理地址。所以在我们创建进程的时候,我们进程的内核数据被加载到内存中,同时我们还会为进程创建对应的task_struct结构体,那么其中就包括了进程地址空间的创建以及页表的创建,那么也就意味着我们每一个进程都有自己的进程地址空间也就是对应的mm_struct结构体和页表,但是我们要注意的是,我们不同的进程的进程地址空间都是相同的,也就意味着我们每一个进程的mm_struct结构体的各个字段都是相同的,那么这也很好理解,因为我们让各个进程都以统一的逻辑来看待内存,但是看不到物理内存,那么我们每个进程对应的进程地址空间都是全部的从0000 0000到FFFF FFFF的4GB的空间,但是对于页表不同进程肯定是不一样的,因为虚拟到物理对应的映射各个进程是不同的,那么在我们创建我们的进程的同时,我们会初始化页表的部分数据的映射,那么之所以是部分,而不是全部数据,则是由于有以下原因:

我们知道我们操作系统会为了缓解进内存的压力会对某些进程采取挂起的手段,也就是将他的内核数据先放回到外部设备比如磁盘当中,那么此时它的内核数据都没加载到内存中,那么自然无法完成对应的映射。

其次,我们知道整个进程地址空间的大小是4GB,那么我们在不同的计算机的构造下,有可能会出现实际物理内存比虚拟内存小的情况,比如有的物理内存是2GB,那么就会导致有的数据没有加载到物理内存,所以无法完成所有数据的映射的初始化。

那么对于有些不在物理内存无法完成初始化的数据,那么页表会专门会有一个字段来标记它是否在物理内存,如果不在,那么则会被标记为缺页,那么对于缺页中断的数据的话,那么我们到时候进程被调度的时候,操作系统一定会为缺页中断的数据重新生成对应的映射。
在这里插入图片描述

所以有了虚拟地址的概念,那么我们对之前的我们语言层面上无法解释的东西,那么我们现在就能够找到源头了,比如我们知道我们c语言我们为什么不能修改字符常量,那么是因为常量区的数据的权限会在页表中标记为只读权限,如果我们要对访问字符常量并且执行写操作,那么它就会对我们该操作进行阻拦。


重新认识fork系统调用

那么有了虚拟地址空间这个概念,那么我们再来重新理解一下我们的fork函数创建子进程的一个原理,那么我们调用fork函数,那么我们会拷贝父进程的task_struct结构体,其中就包括进程地址空间以及页表,这也就是为什么说我们子进程与我们父进程是共享一份物理内存页面的,调用fork函数后,我们操作系统会将父进程的页表中的数据段的内容的权限全部改成只能读不能写,那么如果我们子进程要对数据段的内容进行写入的话,由于权限只读,从而就会触发写时拷贝机制,那么操作系统会在物理内存重新为该数据开辟一份空间,然后接着修改我们子进程所对应的物理内存地址,而虚拟内存地址则不需要修改,从而做到父子进程的数据的独立,有了虚拟地址的概念,便解决了我们开头所说的那个问题。


有了页表这个概念之后,那么我们CPU要读取我们进程在内存中的数据,那么CPU的MMU(内存管理单元)那么它会获取到该进程的页表,然后将我们进程的各种数据的虚拟地址转换成物理地址,然后通过地址线传递给我们的内存的寻址器去获取目标数据然后再传到我们的CPU的寄存器当中

3.结语

那么本篇文章介绍了我们进程地址空间的概念,那么我们知道进程地址空间的出现的意义第一是能让用户以及操作系统能够以统一的视角与布局看待我们的内存,因为我们实际上各个数据在物理内存中的位置是离散的乱许的,但是在进程空间的视角下,逻辑上认为他们是有序排列,比如栈区以及堆区在高地址处,那么这样的内存布局的好处还方便于我们对于数据的查询以及管理。

那么第二是我们的虚拟进程地址空间以及页表的存在,建立一道用户与物理内存的屏障,那么用户不能通过代码直接访问到物理内存,不让用户的各个行为不会受到阻拦,那么可能会出现数据的修改以及越界访问等等问题。

第三是我们虚拟地址以及页表的出现,那么让我们的进程管理以及内存管理相互分离开,那么进程管理我们操作系统就管理我们task_struct结构体所对应的各个数据结构,而内存管理,则是管理我们的页表结构即可,实现了进程管理与内存管理的解耦

那么这就是本篇文章对于进程地址空间的全部内容,那么希望能够让你有所收获,那么我会持续更新,那么下一篇文章我将会解析我们进程的终止与等待,那么希望你能够多多关注,多多支持!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2295134.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AWK系统学习指南:从文本处理到数据分析的终极武器 介绍

目录 一、AWK核心设计哲学解析 1.1 记录与字段的原子模型 1.2 模式-动作范式 二、AWK编程语言深度解析 2.1 控制结构 说明: 2.2 关联数组 代码说明: 示例输入和输出: 注意事项: 2.3 内置函数库 三、高级应用技巧 3.1…

250207-MacOS修改Ollama模型下载及运行的路径

在 macOS 上,Ollama 默认将模型存储在 ~/.ollama/models 目录。如果您希望更改模型的存储路径,可以通过设置环境变量 OLLAMA_MODELS 来实现。具体步骤如下: 选择新的模型存储目录:首先,确定您希望存储模型的目标目录路…

半导体行业跨网文件交换系统

在当今这个数字化转型的时代,半导体行业作为技术密集型产业,正面临着前所未有的信息安全挑战。随着企业内外网隔离措施的加强,如何实现既安全又高效的跨网文件交换,成为了众多半导体企业的一大难题。 特别是在研发和生产过程中产生…

使用GD32F470的硬件SPI读写W25Q64

代码简单改下引脚定义便可以使用! 使用的单片机具体型号:GD32F470ZGT6 简单介绍下W25Q64: /* W25Q64 性能参数 */ /* 容量:8MByte 64Mbit */ /* 有128个块,每个块有64KByte */ /* 每个块有16个扇区,每个…

02为什么 OD门和 OC门输出必须加上拉电阻?

为什么 OD(开漏)门和 OC(开集)门输出必须加上拉电阻? 1、首先一点,知道OD是说的MOS管,OC是说的三极管,二者的区别与联系大家应该都懂。 2、以OC门举例,芯片的OC门内部结…

AI方案调研与实践 (不定期补充)

目录 说明 1. AI云主机准备 1.1 Ollama配置 设置模型保存路径 配置模型驻留内存时间 查看GPU状况命令: nvidia-smi 2. Deepseek 2.1 安装与使用 3. LobeChat配置 参考 说明 调研并实例化各种AI方案,探索训练/使用方式的最佳实践。 1. AI云主机准备 可以去一…

人工智能大模型之模型蒸馏与知识蒸馏

一、背景介绍 随着人工智能技术的不断发展,大模型在各个领域的应用也越来越广泛。模型蒸馏(Model Distillation)和知识蒸馏(Knowledge Distillation)是两种非常重要的模型压缩技术,它们可以帮助我们将大型…

[手机Linux] onepluse6T 系统重新分区

一,刷入TWRP 1. 电脑下载 Fastboot 工具(解压备用)和对应机型 TWRP(.img 后缀文件,将其放入前面解压的文件夹里) 或者直接这里下载:TWRP 2. 将手机关机,长按音量上和下键 开机键 进入 fastbo…

k8s部署elasticsearch

前置环境:已部署k8s集群,ip地址为 192.168.10.1~192.168.10.5,总共5台机器。 1. 创建provisioner制备器(如果已存在,则不需要) 制备器的具体部署方式,参考我之前的文章:k8s部署rab…

本地部署DeepSeek

下载Docker Docker Desktop: The #1 Containerization Tool for Developers | Docker 下载安装ollama Download Ollama on macOS 下载完成后解压运行 终端输入 Ollama --version 输出对应版本号即为下载成功 如果没有弹出上述图片,浏览器输入http://localhos…

21.[前端开发]Day21-HTML5新增内容-CSS函数-BFC-媒体查询

王者荣耀-网页缩小的问题处理 为什么会产生这个问题?怎么去解决 可以给body设置最小宽度 1 HTML5新增元素 HTML5语义化元素 HTML5其他新增元素 2 Video、Audio元素 HTML5新增元素 - video video支持的视频格式 video的兼容性写法 HTML5新增元素 - audio audio…

nbmade-boot调用deepseek的api过程与显示

希望大家一起能参与我的新开源项目nbmade-boot: 宁波智能制造低代码实训平台 下面简单介绍调用最近大红的AI :deepseek的api过程与显示,包括前后端代码与效果图 一、后端代码 1、几个基础的java类 DeepSeekRequest .java package com.nbcio.demo.do…

Linux:安装 node 及 nvm node 版本管理工具(ubuntu )

目录 方法一:手动下载安装文件安装方法二:curl安装 方法一:手动下载安装文件安装 git clone 远程镜像 git clone https://gitee.com/mirrors/nvm安装 nvm bash install.sh刷新配置,使配置在终端生效 // 方法 1 source /root/.…

【多线程-第三天-NSOperation和GCD的区别 Objective-C语言】

一、我们来看NSOperation和GCD的区别 1.我们来对比一下,NSOperation和GCD, 那这个代码,我们都写过了, 我们来看一下它们的特点啊,首先来看GCD, 1)GCD是C语言的框架,是iOS4.0之后推出的,并且它的特点是,针对多核做了优化,可以充分利用CPU的多核,OK,这是GCD, 2…

【医院运营统计专题】2.运营统计:医院管理的“智慧大脑”

医院成本核算、绩效管理、运营统计、内部控制、管理会计专题索引 引言 在当今医疗行业快速发展的背景下,医院运营管理的科学性和有效性成为了决定医院竞争力和可持续发展能力的关键因素。运营统计作为医院管理的重要工具,通过对医院各类数据的收集、整理、分析和解读,为医…

Ollama 部署 DeepSeek-R1 及Open-WebUI

Ollama 部署 DeepSeek-R1 及Open-WebUI 文章目录 Ollama 部署 DeepSeek-R1 及Open-WebUI〇、说明为什么使用本方案 一、 安装Ollama1、主要特点:2、安装3、验证 二、Ollama 部署 DeepSeek1、部署2、模型选用3、Ollama 常用命令4、Ollama模型默认存储路径 安装open-w…

Vite 打包原理

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

【大模型】Ubuntu下安装ollama,DeepSseek-R1:32b的本地部署和运行

1 ollama 的安装与设置 ollama官网链接:https://ollama.com/ 在左上角的【Models】中展示了ollama支持的模型在正中间的【Download】中课可以下载支持平台中的安装包。   其安装和模型路径配置操作流程如下: ollama的安装 这里选择命令安装curl -fsSL …

蓝桥杯---力扣题库第38题目解析

文章目录 1.题目重述2.外观数列举例说明3.思路分析(双指针模拟)4.代码说明 1.题目重述 外观数列实际上就是给你一串数字,我们需要对于这个数据进行一个简单的描述罢了; 2.外观数列举例说明 外观数列都是从1开始的,也…

oCam:免费且强大的录屏软件

今天给大家推荐一个非常好的录屏软件。几乎可以满足你日常工作的需求。而且软件完全免费,没有任何的广告。 oCam:免费且强大的录屏软件 oCam是一款功能强大的免费录屏软件,支持屏幕录制、游戏录制和音频录制等多种模式,能够满足不…