文章目录
- 前言
- 一、预处理
- 二、编译
- 三、汇编
- 四、链接
- 总结
前言
本篇文章来讲解一个.c文件生成一个可执行文件的完整过程,我们学习了那么久,只知道在编译器中按下编译运行就可以将一个.c文件运行起来了,但是我们并不了解其中的具体步骤,那么下面我将会在Linux环境下给大家演示一下具体的操作。
生成一个可执行文件一共包括下面4个步骤:
1.预处理
2.编译
3.汇编
4.链接
这里首先准备一个程序:
#include <stdio.h>
#define PI 3.14
int main(void)
{
printf("PI :%d\n", PI);
return 0;
}
一、预处理
预处理是程序编译的第一个阶段。在这个阶段,预处理器会执行一系列的预处理指令,例如宏展开、头文件包含等操作,将源代码转换为被编译器处理的形式。预处理器根据以#为前缀的指令对源代码进行处理,然后生成一个被修改过的临时文件。
在Linux下使用 gcc -E -o test1.i test1.c这个命令来生成一个预处理后的.i文件:
test.i内容:
这里大家可以看到有非常多的各种函数,而且我们的PI也被直接替换成了3.14。这就印证了我们上面说的:预处理器会进行宏展开和头文件包含的这些操作了。
二、编译
编译是程序编译的第二个阶段,也是最核心的阶段。在这个阶段,编译器会将预处理后的源代码转换为汇编语言(Assembly Language)或者直接转换为机器代码。编译器会进行语法和语义分析,生成中间表示(Intermediate Representation)以及对应的目标文件(Object File)。
在Linux下使用gcc -S -o test1.s test1.i命令生成对应的.s文件:
test1.s文件内容:
可以看到这里生成了对应的汇编语言:
.file "test1.c"
.text
.section .rodata
.LC1:
.string "PI :%d\n"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
subq $16, %rsp
movq .LC0(%rip), %rax
movq %rax, -8(%rbp)
movsd -8(%rbp), %xmm0
leaq .LC1(%rip), %rdi
movl $1, %eax
call printf@PLT
movl $0, %eax
leave
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.section .rodata
.align 8
.LC0:
.long 1374389535
.long 1074339512
.ident "GCC: (Ubuntu 7.5.0-3ubuntu1~18.04) 7.5.0"
.section .note.GNU-stack,"",@progbits
三、汇编
汇编是程序编译的第三个阶段。在这个阶段,汇编器会将上一步生成的目标文件转化为机器代码指令。它利用汇编语言来描述指令的操作和操作数,并将其转化为可以由计算机直接执行的二进制形式。
在Linux下使用gcc -c -o test1.o test1.s 命令来生成对应的.o文件:
这里可以看到生成的文件是二进制的文件,所以这里我们无法查看:
四、链接
链接是程序编译的最后一个阶段。在这个阶段,链接器将多个目标文件、库文件以及系统提供的运行时支持代码(Runtime Support Code)合并在一起,生成最终的可执行文件。链接器解决了符号引用和符号定义之间的关联问题。它会检查目标文件中的符号表,并确保所有的符号被正确引用和定义,以及解决函数和变量的地址关联。
在Linux下使用gcc -o test1 test1.c命令来生成最后的可执行文件:
总结
预处理阶段通过宏展开和头文件包含等操作修改源代码。编译阶段将源代码转换为汇编语言或机器代码。汇编阶段将汇编语言转换为机器代码指令。链接阶段将目标文件和运行时支持代码合并生成最终的可执行文件。通过这一系列的处理过程,源代码最终被转换为计算机可以执行的机器代码。