[Linux] 进程地址空间

🪐🪐🪐欢迎来到程序员餐厅💫💫💫

主厨：邪王真眼

主厨的主页：Chef‘s blog

所属专栏：青果大战linux

总有光环在陨落，总有新星在闪烁

好了，折腾了几天的直流稳压电源失败了，what can I say，果然我就是先天软件圣体，敲代码才是本职工作，现在就Linux和算法交换着学

地址空间的划分

我们在刚学指针时一定会学习地址的概念，相信不少人还记得这张图

我们学习到了了内存空间的分布，从低地址到高地址分别是

代码段：用于存储可执行代码和只读常量
已初始化数据区：存储已经初始化的全局变量
未初始化数据区：存储未初始化的全局变量
栈区：局部变量，自高地址向低地址使用内存
堆区：用于动态内存管理，自低向高使用内存
内核空间：给OS用的，存放环境变量env，命令行参数等等

我们也可以通过代码展示一下

#include<stdio.h>
#include<stdlib.h>
int gval=100;
int ungval;
int main(){
int a=10,b=10,c=10;
int *p=(int*)malloc(sizeof(int));
printf("code：%p\n",main);
printf("init gval：%p\n",&gval);
printf("uninit gval：%p\n",&ungval);
printf("heap：%p\n",p);
printf("stack1：%p\n",&a);
printf("stack2：%p\n",&b);
printf("stack2：%p\n",&c);
}

小知识：

main本身也是一个地址，&main和main是等价的，我们可以用它的地址表示代码段存储的代码地址
已初始化的全局变量的地址要比未初始化的全局变量地址低

这些东西我相信大家还是记得的，但是接下来的fork，会打破你的认知。

虚拟地址

之前在讨论fork父子进程时谈到了这个：

子进程和父进程共享一份代码，但是子进程的数据是对父进程数据的一份拷贝

即子进程会自己开辟一片空间来存放拷贝的父进程数据，于是我们来份代码验证一下

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
int main(){
    int a=10;
    pid_t p=fork();
    if(p==0)
    {
        printf("我是子进程，该数据地址是：%p\n",&a);
    }
    else
     printf("我是父进程，该数据地址是：%p\n",&a);
}

什么？？？地址是一样的！

我们知道，如果父子进程的数据地址一样，就意味着他们对该数据的修改会影响到对方，但是进程相互之间应该具备独立性，这显然是不合理的，当初设计OS的佬不可能不知道这点，于是乎，真相只有一个：此地址，非彼地址

我就不卖关子了，事实上我们之前在学c语言c++或者别的语言中，所学习的地址，那些0x123f3f3f什么的所代表的根本不是真正的计算机物理地址空间，而是虚拟地址，要想搞清楚它，必须站在操作系统的层面才可以。

在语言层面接触到的地址，都不是物理地址，而是虚拟地址

页表与fork

页表和map很像，你告诉他一个虚拟地址，他会告诉你所对应的真实物理地址在哪里。而不同的进程有不同的页表，所以我们就可以做到，父子进程虚拟地址相同，但是物理地址不同

这时我们就可以回头在思考这句话：

子进程和父进程共享一份代码，但是子进程的数据是对父进程数据的一份拷贝

怎么做到的？怎么就共享或者拷贝了？

其实就是所谓的“共享”就是在子进程创建时直接拷贝父进程的页表，父子的虚拟地址一样，指向的物理地址也一样。

对于代码，因为代码是只读的，不会被修改，所以直接拷贝页表即可，但对于数据还要加上一个写时拷贝

问题一：为什么要拷贝

当父进程修改某个数据，而子进程之后又要用该数据进行计算或判断时，就会被影响到，为了保持的进程之间的独立性，所以必须拷贝。

问题二：为什么不把数据全拷贝

原因一：假如父进程的数据有足足1个G，但是真正会被修改的只有0.1g，剩下0.9G都是只读，那我们的子进程就不需要拷贝这0.9G，拷贝了就是纯纯浪费空间

原因二：虽然子进程的代码和父进程共享，但别忘了子进程不会从头开始执行，而是从fork的下一条语句开始执行，（关于他是怎么做到的，不知道的朋友可以去看看进程状态切换）

假如父进程一共1000行代码，fork是在第500行，那么前500行代码就不会被子进程使用，这其中所包含的数据也同样不会，那这些数据也自然不用拷贝

现在我们来拿fork返回值分析，当fork进行return返回值时，子进程已经建立好了，父子进程都会分别执行该return语句，这个返回值会被写入到某个变量中，此时OS发现父子进程对数据进行了修改于是进行写时拷贝，给子进程分配了一块物理内存空间

小结

写时拷贝是指当父子进程有一方尝试修改变量时，操作系统会为修改方分配新的物理内存并拷贝数据，以确保独立性。

地址空间的管理

我们刚才也说了对于一个进程，他所使用的的内存被划分为了不同的区域，来存储不同的数据，这些做的目的是为了将同种类的数据放在一起，方便OS管理，但是这个划分功能是如何实现的呢？我们可以想想，计算机一启动就会开启几十甚至上百的进程，每一个进程都需要维护自己的各种空间区域（堆、栈、代码段等等），于是我么就会想到-“先描述，再组织”，是的，这个六字真言又出现了。根据我们学习task_struct的经验，不难猜出，每个进程都有个对应的结构体来描述他的空间使用状况，这个结构体叫做mm_struct。它里面维护的是每个区域的开始地址和结束地址，而task_struct中有个mm_struct指针，可以找到该结构体。

这个结构体对区域的维护很简单，例如我们malloc空间，那么堆区就会变大，那我们只要改一下他的start（向上增长）就可以了。

struct mm_struct {
    long code_start;
    long code_end;
    
    long init_start;
    long init_end;
    
    long uninit_start;
    long uninit_end;
    
    long heap_start;
    long heap_end;
    
    long stack_start;
    long stack_end;
    ...
}

mm_struct的初始化，我们以linux为例，在命令行输入指令readelf -S +文件名

就可以看到该可执行文件中的各个区域划分，这个结果是在编译中产生的

在我们运行程序时，那个mm_struct结构体就会读取这些属性，来初始化各个区域的起始位置

OS对页表的管理

事实上，页表不只是从虚拟地址映射到物理地址。

他还存储了很多标记位。

操作系统 (OS) 负责设置页表并定义每个页面的标志位

我们好好想想，对于一片物理内存空间，真的有所谓的只读、只写、无法访问之类的吗？

当然没有！它就是一片空间，你想放什么放什么，但事实是我们的一些操作（例如向只读文件写入）会被拒接。这绝不是内存空间本身可以做到的，事实上这就是靠标记位做到的。我们先讲两个标记位。

rwx--读写执行权限

只需要三个比特位即可存储，从虚拟地址映射到物理地址时OS会检查该标记位，看你的操作是否合法。

我们在执行指令时，如果要向一个只读文件进行写入，那么代码就会挂掉，如果对空指针、野指针进行解引用操作，代码也会挂掉，就是这么实现的。因为他们的标记位显示无法写入权限，所以OS就拒绝了你的操作。

我们现在来看这份代码，是不是就明白为什么编译器没有报错，但是发生了运行时错误呢

因为这份代码的问题是他试图修改的数据所对应的标记位是只读，无法写入的，因此当代码运行到这一步进行从虚拟地址到物理地址的访问时，MMU一检查发现你这操作不合法，所以不会进行地址映射，而会给OS打报告，OS则可能直接kill进程，而这些，自然不是编译器在编译时可以发现的错误。

isexist

表示该虚拟地址有无对应物理地址

我们知道在加载进程时，先创建的task_struct，然后再加载进代码和数据，那么加入有个代码有足足10w行，我们是需要一口气把它都加载进来吗，显然不是的，因为后面的代码即是加载进来了也要等一段时间才可以运行到，数据也是同样的道理，因此我们对于大文件是采用分批加载的，

同样的道理，对于最开始加载进来的代码和部分数据，我们之后就用不上了，那他们继续留在内存里显然就是浪费空间而已，因此对于靠前的代码和数据我们会进行换出，对于靠后的代码数据我们暂时先不加载进来。这些分批操作、换入换出的实现就是依靠isexist这个标识符，isexist是真，说明该虚拟地址有对应的物理地址，否则说明没有。

以加载大文件为例，当进程要加载进内存时，调用malloc，其实就是让mm_struct里的堆区扩大一些，容纳更多的虚拟地址供你使用，所以你当你malloc成功时，有可能只是申请到了虚拟地址，但是OS并没有给您分配物理地址，这是因为当OS认为你申请后一段时间里如果没有立刻使用这些空间，那么这些空间就等同于处于闲置状态，这是对资源的浪费，所以他就先不给你分配，此时isexist标志位就是0（表示没有），当你后面真的用到了的时候，可以通过缺页中断给你分配。