在ANSI C(标准C)的任何一种实现中,存在两个不同的环境。
- 第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
- 第2种是执行环境,它用于实际执行代码。
今天我们就讲解他们在这环境过程都做了什么。
文章目录
- 详解编译+链接
- 翻译环境
- 编译本身也分为几个阶段
- 总结
- 运行环境
详解编译+链接
翻译环境
程序的编译大概过程
在VS编译上一个项目中可能存在多个.c.h的源文件,他们都会单独经过编译器(cl.exe)生成自己的目标文件(.obj).在经过链接器(link.exe)和链接库生成 可执行程序(.exe)
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
编译本身也分为几个阶段
接下来我们就讲解编译环境如何一步一步形成我们的可执行程序的
VS是一个集成开发环境,集成很多的功能
ctrl+F5
不方便观察每个细节的功能
接下来,我使用这个vscode gcc编译器给大家演示
编译本身也分为几个阶段
(test.c) 源文件 -> 翻译环境 -> test.exe -> 可执行程序
而翻译环境分为几个两个阶段
- 编译(编译器)
而编译又划分3个阶段
- 预编译
- 编译
- 汇编
- 链接 (链接器)
合并段表
符号表的合并和重定位
那我们接下来看看预编译会发生什么事情;
- 输入gcc test.c -E (打开预编译) -o test,i (-o输出到test.i)上
此时tesri.i存放的是指向这些数据(这些数据好像我们都不认识)其实这是我们# include<stdio.h>头文件的展开> 我们划到最后看此时放的是我们自己写的代码此时我们发现预处理阶段会把我们的头文件展开
- 我们在次修改下代码
- 我们再次打开预处理gcc test.c -E (打开预编译) -o test,i (-o输出到test.i)。 我们划到最后再看下代码
我们发现#define和注释都不见了,define给代替了
所以我们预处理处理的事情是
- 头文件的包含
#include- 注释的删除
- #define 定义的符号的替换
在预处理阶段很多事情都与预处理的指令相关。
比如:
#define
#include
#pragmapack
那我们再看看编译阶段会发生什么:
- 输入gcc -S test.c 这时候我们会生成一个test.S的文件,该文件就是编译文件
我们打开test.S放的是什么
test.S 放的是汇编指令
- 编译时我们会把C语言代码转换成汇编指令
其实更细的说在这编译期间转换成汇编指令期间,还会处理
1 语法分析
2 词法分析
3 语义分析
4 符号汇总
那汇编译阶段又会发生什么:
输入gcc -c test.c 此时会生成一个(test.o)文件,目标文件
vs是生成为.obj文件
gcc是生成.o文件
- 此时我们想看test.o文件,会发现该文件无法打开
因为此时已经把汇编代码转换成二进制的指令了,并且还会形成符号表
- 链接时会 合并段表,符号表的合并和重定位
- 汇编译阶段时会形成符号表
那他们有什么关系呢 图解:
符号汇总-> 形成符号表 -> 符号表的合并和重定位 -> 可执行程序
重定符号表又有什么用呢?其实很好理解
比如把add.c文件的add函数删掉,重定符号表时还会取到下面那个Add 0x000 无效地址,真正在链接时找这个函数时就会报错。
你只是在声明这个函数,但是这个函数地址并没有真实存在
其实 合并段表,形成符号表,符号表的合并和重定位,他重新为链接期间这个跨源文件的代码进行协作时候在做铺垫
总结
- 预处理 选项 gcc -E test.c -o test.i
预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。- 编译 选项 gcc -S test.c
编译完成之后就停下来,结果保存在test.s中。- 汇编 gcc -c test.c
汇编完成之后就停下来,结果保存在test.o中。
运行环境
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序
的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。- 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回
地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程
一直保留他们的值。- 终止程序。正常终止main函数;也有可能是意外终止。