文章目录
- 一、一些疑问
- 二、程序没有加载前的地址(程序)
- 三、程序加载后的地址
- 四、动态库的地址
一、一些疑问
什么是虚拟地址?什么是物理地址?CPU读到的指令里面用的地址,是什么地址??
我们之前在使用动态库的时候,有一个选项-fPIC,它是与地址无关码。
二、程序没有加载前的地址(程序)
程序编译好之后,内部有地址的概念吗?
答案是有的!如下所示,其实在程序的内部,这些变量名都已经变成了地址了
在以前还没有虚拟地址的时候,我们的程序一开始还没有被执行的时候,它就已经会被分成各个段。
而现在这些编译时的编址已经是平坦模式[0,4GB]。即它在编址的时候已经严格按照地址空间的方式进行编译代码的。所以说在磁盘上看到的可执行程序的顺序排布和以后的进程地址空间中的规则是一样的。
所以编译器也已经考虑了操作系统了!!!
如下所示
这里的地址已经就是虚拟地址了!,也就是说可执行程序还没加载上去时候,已经是虚拟地址了,不过为了进行区分,在可执行程序还没有进行加载的时候,我们会把他叫做逻辑地址。如果是50多年前,逻辑地址和虚拟地址还是不一样的,不过现在逻辑地址,虚拟地址,线性地址等这些已经是同一个概念了,只不过逻辑地址一般是磁盘当中的可执行程序的地址
我们可以先随便写一点代码
然后编译运行以下
然后我们使用这个指令,这个指令可以直接将我们这个程序给反汇编出来
objdump -S a.out
比如下面的这一部分,左边的这一行就是每个指令的地址,每个指令都有不同的长度,有的是一个,有的是三个等等
三、程序加载后的地址
如下所示,当我们把代码和数据加载到内存的时候,当然要占据物理内存
从而天然的就有了物理地址,所以当可执行程序加载到内存的时候,就有了两套地址,一套是逻辑地址,一套是物理地址。
那么如何执行第一条指令呢?
其实在可执行程序中已经有一个entry入口地址了,那么这个entry是不是物理地址呢?其实不是,因为它是在加载之前就有了,它就是一个逻辑地址。
我们之气那也说过,一个进程是有自己的cwd工作目录和exe能找到自己的可执行程序的
当内核数据结构形成以后,我们可以将代码先加载到内存,当然也可以先不加载,我们这里先认为没有加载。它会先读取可执行程序的一些东西,将可执行程序的入口地址entry放到EIP/PC寄存器中。因为这个正好就是一个虚拟地址,所以就可以直接去正文代码中开始执行了,然后开始读取页表
然后此时我们现在的页表并没有建立映射,那么就会产生缺页中断,就会将程序加载进去,然后它也就天然具有了物理地址。最终虚拟物理地址的映射在页表中也都有了
然后就可以按照正常顺序去执行了。当我们读取到下面的那条函数调用指令的时候。
我们会发现,CPU内部读到的指令,内部可能有数据,可能也有地址,而这里的地址就是虚拟地址!,这里的虚拟地址还是需要经过页表转换成物理地址,然后继续执行。如果这虚拟地址不存在,那么直接缺页中断即可。
而此时,我们就发现了,我们的程序中,从读取到的第一个指令,到CPU的处理,再到二次继续访问它,用的全部都是虚拟地址
而这里其实就是编译器和操作系统相互协调的最重要的表现之一
四、动态库的地址
如下图所示
像这样的地址就是绝对地址
还有一种地址是相对地址,或者称作逻辑地址,比如下面的例子,有一个100米的跑道,有一颗树在40m处,那么当我们处于50m处的时候,我们可以说绝对地址是50,也可以说相对地址是10。
但是当这个树就在0处的时候,那么绝对地址就是相对地址或者逻辑地址
而在我们前面的可执行程序中,就是因为相对都是从0开始的,所以可以叫做逻辑地址,虚拟地址,相对地址这些
如下图所示,是我们前面已经提过的
现在当我们这个程序有一个printf时候,就需要调用动态库中的函数,然后它也要被加载到内存当中
现在我们的问题是:共享库大了,具体映射到哪里呢?
我们现在这个0x1122这个地址是一个线性地址,我们的程序要跳转到对应的位置,它在共享库中也必须在对应的位置,即0x1122,否则找不到。
所以它就必须得在固定地址处
但是这时候问题来了,一个进程可能要有十几个库,那么怎么能都加载到固定位置呢?
所以动态库被加载到固定地址空间中的位置是不可能的。
所以库要可以在虚拟内存中,任意位置加载!!!
所以库让自己内部函数不要采用绝对编址,只表示每个函数在库中的偏移量即可!!!
这样的话,当代码要访问库中的方法时候,那么只需要起始地址+这个偏移量即可,从而进行对应找到代码
所以我们在前面说fPIC选项的时候,它是一个与位置无关码,意思就是直接用偏移量对库函数编址
静态库为什么不谈加载?不谈与位置无关?
因为静态库是直接被拷贝到可执行程序中的。就相当于库中的方法就是我们的方法。就直接用绝对编址进行编址了