GCC 编译过程
一个 C/C++文件要经过预处理(preprocessing)、编译(compilation)、汇编(assembly)和链接(linking)
等 4 步才能变成可执行文件
(1) 预处理
C/C++源文件中,以“#”开头的命令被称为预处理命令,如包含命令“#include”、宏定义命令“#define”、
条件编译命令“#if”、“#ifdef”等。预处理就是将要包含(include)的文件插入原文件中、将宏定义展开、
根据条件编译命令选择要使用的代码,最后将这些东西输出到一个“.i”文件中等待进一步处理。
(2) 编译
编译就是把 C/C++代码(比如上述的“.i”文件)“翻译”成汇编代码,所用到的工具为 cc1(它的名字就
是 cc1,x86 有自己的 cc1 命令,ARM 板也有自己的 cc1 命令)。
(3)汇编
汇编就是将第二步输出的汇编代码翻译成符合一定格式的机器代码,在 Linux 系统上一般表现为 ELF
目标文件(OBJ 文件),用到的工具为 as。x86 有自己的 as 命令,ARM 版也有自己的 as 命令,也可能是 xxxx
as(比如 arm-linux-as)。
“反汇编”是指将机器代码转换为汇编代码,这在调试程序时常常用到。
(4)链接
链接就是将上步生成的 OBJ 文件和系统库的 OBJ 文件、库文件链接起来,最终生成了可以在特定平台
运行的可执行文件,用到的工具为 ld 或 collect2。
编译程序时,加上-v 选项就可以看到这几个步骤。比如gcc -o hello hello.c -v
常用选项
(1)-c
预处理、编译和汇编源文件,但是不作链接,编译器根据源文件生成 OBJ 文件。缺省情况下,GCC 通过 用`.o'替换源文件名的后缀`.c',`.i',`.s'等,产生 OBJ 文件名。可以使用-o 选项选择其他名字。GCC 忽 略-c 选项后面任何无法识别的输入文件。
(2)-S
编译后即停止,不进行汇编。对于每个输入的非汇编语言文件,输出结果是汇编语言文件。缺省情况下, GCC 通过用`.s'替换源文件名后缀`.c',`.i'等等,产生汇编文件名。可以使用-o 选项选择其他名字。GCC 忽略任何不需要汇编的输入文件。
(3)-E
预处理后即停止,不进行编译。预处理后的代码送往标准输出。
(4)-o file
指定输出文件为 file。无论是预处理、编译、汇编还是链接,这个选项都可以使用。如果没有使用`- o'选项,默认的输出结果是:可执行文件为`a.out';修改输入文件的名称是`source.suffix',则它的 OBJ 文件是`source.o',汇编文件是 `source.s',而预处理后的 C 源代码送往标准输出。
(5)-v
显示制作 GCC 工具自身时的配置命令;同时显示编译器驱动程序、预处理器、编译器的版本号。
警告选项(Warning Option)
这个选项基本打开了所有需要注意的警告信息,比如没有指定类型的声明、在声明之前就使用的函数、 局部变量除了声明就没再使用等
:$ gcc -Wall -c main.c
调试选项(Debugging Option)
(1)-g
以操作系统的本地格式(stabs,COFF,XCOFF,或 DWARF)产生调试信息,GDB 能够使用这些调试信息。
在大多数使用 stabs 格式的系统上,`-g'选项加入只有 GDB 才使用的额外调试信息。可以使用下面的选项
来生成额外的信息:`-gstabs+',`-gstabs',`-gxcoff+',`-gxcoff',`-gdwarf+'或`-gdwarf',具体用
法请读者参考 GCC 手册
优化选项(Optimization Option)
(1)-O 或-O1
优化:对于大函数,优化编译的过程将占用稍微多的时间和相当大的内存。不使用`-O'或`-O1'选的
目的是减少编译的开销,使编译结果能够调试、语句是独立的:如果在两条语句之间用断点中止程序,可以 对任何变量重新赋值,或者在函数体内把程序计数器指到其他语句,以及从源程序中精确地获取你所期待的 结果。
不使用`-O'或`-O1'选项时,只有声明了 register 的变量才分配使用寄存器。
使用了`-O'或`-O1'选项,编译器会试图减少目标码的大小和执行时间。如果指定了`-O'或`-O1'选项,, `-fthread-jumps'和`-fdefer-pop'选项将被打开。在有 delay slot 的机器上,`-fdelayed-branch'选项将
被打开。在即使没有帧指针 (frame pointer)也支持调试的机器上,`-fomit-frame-pointer'选项将被打 开。某些机器上还可能会打开其他选项。
(2)-O2
多优化一些。除了涉及空间和速度交换的优化选项,执行几乎所有的优化工作。例如不进行循环展开 (loop unrolling)和函数内嵌(inlining)。和`-O'或`-O1'选项比较,这个选项既增加了编译时间,也提高 了生成代码的运行效果。
(3)-O3
优化的更多。除了打开-O2 所做的一切,它还打开了-finline-functions 选项。
(4)-O0
不优化。
如果指定了多个-O 选项,不管带不带数字,生效的是最后一个选项。
在一般应用中,经常使用-O2 选项,比如对于 options 程序:
$ gcc -O2 -c -o main.o main.c
$ gcc -O2 -c -o sub.o sub.c
$ gcc -o test main.o sub.o
链接器选项(Linker Option)
(1) -o filename
指定输出目标文件名
(2)-llibrary
链接名为 library 的库文件
链接器在标准搜索目录中寻找这个库文件,库文件的真正名字是`liblibrary.a'。搜索目录除了一些系统标准目录外,还包括用户以`-L'选项指定的路径。一般说来用这个方法找到的文件是库文件──即由 OBJ文件组成的归档文件(archive file)。链接器处理归档文件的方法是:扫描归档文件,寻找某些成员,这些成员的符号目前已被引用,不过还没有被定义。但是,如果链接器找到普通的 OBJ 文件,而不是库文件,就把这个 OBJ 文件按平常方式链接进来。指定`-l'选项和指定文件名的唯一区别是,`-l’选项用`lib'和`.a'把 library 包裹起来,而且搜索一些目录
-V 输出详细过程信息
/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/collect2 --eh-frame-hdr -m elf_i386 -dynamiclinker /lib/ld-linux.so.2
-o test
/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/../../../crt1.o /usr/lib/gcc-lib/i386-redhatlinux/3.2.2/../../../crti.o
/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/crtbegin.o
-L/usr/lib/gcc-lib/i386-redhat-linux/3.2.2
-L/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/../../..
main.o
sub.o
-lgcc -lgcc_eh -lc -lgcc -lgcc_eh
/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/crtend.o
/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/../../../crtn.o
可以看见,除了 main.o、sub.o 两个文件外,还链接了启动文件 crt1.o、crti.o、crtend.o 、crtn.o,
还有一些库文件(-lgcc -lgcc_eh -lc -lgcc -lgcc_eh)。
(3)-nostartfiles
不链接系统标准启动文件,而标准库文件仍然正常使用
(4)-nostdlib
不链接系统标准启动文件和标准库文件,只把指定的文件传递给链接器。这个选项常用于编译内核、 bootloader 等程序,它们不需要启动文件、标准库文件。
(5)-static
在支持动态链接(dynamic linking)的系统上,阻止链接共享库
$ gcc -o test_static main.o sub.o –static
(6)-shared
生成一个共享 OBJ 文件,它可以和其他 OBJ 文件链接产生可执行文件。只有部分系统支持该选项。 当不想以源代码发布程序时,可以使用-shared 选项生成库文件,比如对于 options 程序,可以如下制
$ gcc -shared -o libsub.so sub.o sub2.o sub3.o
以后要使用 sub.c 中的函数 sub_fun 时,在链接程序时,指定引脚 libsub.so 即可,比如:
$ gcc -o test main.o -lsub -L /libsub.so/所在的目录/
(7)-Xlinker option
把选项 option 传递给链接器。可以用来传递系统特定的链接选项,GCC 无法识别这些选项。如果需要
传递携带参数的选项,必须使用两次`-Xlinker',一次传递选项,另一次传递其参数。例如,如果传递`- assert definitions',要成`-Xlinker -assert -Xlinker definitions',而不能写成`-Xlinker "-assert
definitions"',因为这样会把整个字符串当做一个参数传递,显然这不是链接器期待的。
(8)-Wl,option
把选项 option 传递给链接器。如果 option 中含有逗号,就在逗号处分割成多个选项。链接器通常是通
过 gcc、arm-linux-gcc 等命令间接启动的,要向它传入参数时,参数前面加上`-Wl,’。
(9)-u symbol
使链接器认为取消了 symbol 的符号定义,从而链接库模块以取得定义。可以使用多个 `-u'选项,各自 跟上不同的符号,使得链接器调入附加的库模块。
目录选项(Directory Option)
下列选项指定搜索路径,用于查找头文件,库文件,或编译器的某些成员。
(1)-Idir
在头文件的搜索路径列表中添加 dir 目录。
头文件的搜索方法为:如果以“#include < >”包含文件,则只在标准库目录开始搜索(包括使用-Idir
选项定义的目录);如果以“#include “
””包含文件,则先从用户的工作目录开始搜索,再搜索标准库
目录。
(2)-I-
任何在`-I-'前面用`-I'选项指定的搜索路径只适用于`#include "file"'这种情况;它们不能用来搜
索`#include <file>'包含的头文件。如果用`-I'选项指定的搜索路径位于`-I-'选项后面,就可以在这些路
径中搜索所有的`#include'指令(一般说来-I 选项就是这么用的)。还有,`-I-'选项能够阻止当前目录(存 放当前输入文件的地方)成为搜索`#include "file"'的第一选择。
`-I-'不影响使用系统标准目录,因此,`-I-'和`-nostdinc'是不同的选项。
(3)-Ldir
可以使用-Ldir 选项将当前目录加入搜索路径,如下则链接成功:
$ gcc -L. -o test main.o -lsub
(4)-Bprefix
这个选项指出在何处寻找可执行文件,库文件,以及编译器自己的数据文件。编译器驱动程序需要使用
某些工具,比如:`cpp',`cc1' (或 C++的`cc1plus'),`as'和`ld'。它把 prefix 当作欲执行的工具的前
缀,这个前缀可以用来指定目录,也可以用来修改工具名字。