作者:@小萌新
专栏:@Linux
作者简介:大二学生 希望能和大家一起进步!
本篇博客简介:简单介绍下进程地址空间
程序地址空间
- 程序地址空间
- 语言中的程序地址空间
- 矛盾
- 系统中的程序地址空间
- 为什么要有进程地址空间
- 思维导图总结
程序地址空间
语言中的程序地址空间
我们在c语言中的学习中 我们是这样子描述内存空间的
内存包括栈区 堆区 静态区
栈区是向低地址增长的
堆区是向高地址增长的
其中静态区又分为三部分 分别是初始化数据 未初始化数据 数据段和代码段
我们可以通过下面的代码来验证上面的这张图
我们发现运行的结果和我们的结论是吻合的
矛盾
我们首先写出下面的一段代码
这段代码的意思是让子进程执行五次 分别打印子进程的pid myval和地址
让父进程一直执行 分别打印父进程的pid myval和地址
效果是这样子的 我们可以发现父子进程打印出来的val一样 地址也一样
但是如果我们在中途修改子进程的val数据呢? 会发生什么情况
如果按照我们之前语言中的内存理解 我们可以推断出父进程的val值也会被改变 因为它们指向的都是同一块地址 那么事实到底是不是这样子呢?
我们可以试验一下
对于原先的代码做出如下修改
运行结果如下
我们惊奇的发现 一个地址里面的值竟然有两种形态
这很显然不符合我们的常识
一个物理地址中对应的值只能有一个 所以说这里的地址肯定不是真正的物理地址 那么它是什么呢?
系统中的程序地址空间
实际上我们在语言层面上打出来的地址都不是真实的物理地址 而是由操作系统分配的虚拟地址
所以说尽管我们看上去父子进程的虚拟地址是一样的 但是它们实际的物理地址却是不一样的 这也就造成的上面那种一个地址中会出现两个值的情况
实际转化效果如图
我们前面的博客说过 贯穿操作系统的一句话叫做 先描述 再组织
我们语言阶段所说的内存实际上是虚拟内存地址而到了系统的学习中
我们给与了它一个新的名字 叫做进程地址空间
它是操作系统对于开辟空间的描述 实际上它就是一个结构体 叫做mm_struct
进程地址空间就类似于一把尺子 尺子的刻度由0x00000000到0xffffffff 尺子按照刻度被划分为各个区域 例如代码区、堆区、栈区等
而在结构体mm_struct当中 便记录了各个边界刻度 例如代码区的开始刻度与结束刻度 如下图所示
再这个结构体中 每一个刻度都代表着一个虚拟地址 这些虚拟地址通过页表 和物理地址建立联系
而由于这些地址是线性增长的 所以说我们也可以将虚拟地址叫做线性地址
从上面的图我们可以知道
操作系统在创建进程的时候会创建PCB和程序地址空间
在进程运行的时候程序地址空间会经过页表映射到真实的物理内存中开辟新的空间
我们前面的博客说过 父子进程是共享代码和大部分数据的
这也就是为什么一开始的时候我们查看代码时父子进程的val数据地址一样的原因
但是当我们要修改子进程的数据的时候 就会发生 缺页中断 由于要保持进程的独立性 所以这里会用到一种叫做写时拷贝的技术
将父进程的数据拷贝一份到真实的物理内存中 修改之
但是这在虚拟内存层面是看不到的 这也就是为什么我们修改数据之后依然看到父子进程myval的地址是一致的
为什么要有进程地址空间
-
有了进程地址空间之后就不会出现系统级别的越界问题了 可以防止恶意程序修改真实的内存数据和破坏计算机
这是因为加了一个中间件之后程序就失去了访问真实物理内存的权力 而是由操作系统进行管理
-
将内存申请和使用概念划分清楚 从而让进程续写和内存管理操作进行分离
这是因为使用物理内存的权力在操作系统手上 它可以通过“欺骗”程序 让他误以为自己申请成功了真正的物理内存
操作系统可以在程序使用内存的时候再分配给程序 -
每个进程都认为自己在独占内存 这样能更好的完成进程的独立性以及合理使用内存空间
每个进程都认为自己能独占内存 所以说它们会按照操作系统给的内存分布区规划使用 更加方便管理并且进程之间解耦
我们现在对于进程创建的理解要更加加深一点
理解为 PCB + 程序 + mm_sturct + 页表