编译之舞:C/C++ 与 GCC 的协作曲

news2024/11/19 10:23:28

文章目录

  • 一、C/C++ 编译过程的四个阶段
    • 1. 编译之舞的台前幕后
    • 2. 舞台布景的准备——预处理
    • 3. 舞者的基本训练——编译
    • 4. 编舞师的细节调整——汇编
    • 5. 合奏的和谐统一——链接
  • 二、舞姿的动作细——编译详细模式
  • 三、幕后——GCC 的各种选项(Overall Option)
    • 1. 预处理选项
    • 2. 编译选项
    • 3. 汇编选项
    • 4. 链接选项
    • 5. 其他选项

在现代计算的舞台上,编程语言如同舞者,而编译器则是那幕后默默引导的编舞师,每一次代码的编写都像是一场精心设计的舞蹈。在这个舞台上,C 语言和 GCC(GNU Compiler Collection)是一对经典的搭档。它们共同演绎了一场编译的华美舞蹈,从源代码到可执行文件的华丽蜕变。

本文将探索 C 语言与 GCC 之间的这种美妙协作,并深入了解它们是如何共同创造出那些最终运行在计算机上的程序。

一、C/C++ 编译过程的四个阶段

1. 编译之舞的台前幕后

几乎每个学编程的小伙伴,第一个代码都是输出 Hello World!(如下代码,做了一些小小的改动)。

#include <stdio.h>

int main(int agrc, char *argv[])
{
    if (argc >= 2)
        printf("Hello %s!\n", argv[1]);
    else
        printf("Hello World!\n");

    return 0;
}

将这段代码编译成可执行的文件,也只需要简简单单的一条命令:

gcc hello.c -o hello

使用 gcc 命令,配合上 -o 选项,即可生成 hello 这个可执行文件。然而整个编译过程并没有我们看到的那样简单。

一个或多个 C/C++ 文件要经过预处理(preprocessing)编译(compilation)汇编(assembly)链接(linking) 四个阶段才能变成可执行文件。

在这里插入图片描述

如上图所示,扩展名为 .c 的源代码文件,经过预处理之后可以生成扩展名为 .i 的临时文件。而 .i 文件再经过编译后,可以生成扩展名为 .s 的汇编文件。而扩展名为 .s 的汇编文件再经过汇编之后,可生成扩展名为 .o 的二进制文件。最后,这些二进制文件通过链接,合并成一个可执行文件。

接下来,我们将使用 GCC,将这段代码编译成机器能够理解的指令。

2. 舞台布景的准备——预处理

在 C/C++ 源文件中,以 # 开头的命令被称为预处理命令,如包含命令 #include、宏定义命令 #define、条件编译命令 #if#ifndef 等。预处理就是将要包含(include)的文件插入原文件中、将宏定义展开、根据条件编译命令选择要使用的代码,最后将这些东西输出到一个扩展名为 .i 的临时文件中,等待下一步处理。

以前面的 hello.c 为例,可以使用 -E 选项让 GCC 仅进行预处理,并输出结果:

gcc -E hello.c -o hello.i

vim 打开 hello.i 文件,会发现这是一个将 hello.c 的头文件完全展开的文件:

在这里插入图片描述

源代码只有 11 行,被展开后多达 803 行,不过源代码的主题内容还能在 hello.i 的结尾处看到。

3. 舞者的基本训练——编译

我们日常所说的 “编译”,其实涵盖了这个四个阶段,并不是特指这四个阶段中的 “编译”。当然,这里还是要特指一下,这里的 “编译”,就是预处理后的下一步动作。编译阶段就是把扩展名为 .i 的临时文件,“翻译” 成汇编代码,所用到的工具为 cc1(不要怀疑,这个工具的名字就是 cc1。不同架构的芯片有自己的 cc1,x86 架构有自己的 cc1 工具,ARM 架构也有自己的 cc1 工具。)。

一步骤可以通过 -S 选项实现:

gcc -S hello.i -o hello.s

同样,可以通过 vim 来打开 hello.s 文件:

在这里插入图片描述

由上图可见,此时生成的 hello.s 文件是汇编代码,描述了程序的基本操作。这些指令仍然是人类可读的,但距离计算机执行还需进一步的转换。

4. 编舞师的细节调整——汇编

汇编阶段就是将汇编代码翻译成符合一定格式的机器代码,在 Linux 系统上一般表现为 ELF 目标文件(OBJ 文件),用到的工具为 as

使用 -c 选项,GCC 会将汇编代码转换为目标代码(机器码):

gcc -c hello.s -o hello.o

此时,再用 vim 打开 hello.o 文件,就是一堆完全开不懂得东西了:

在这里插入图片描述

这里我们可以用另一个命令行工具来打开 hello.o 文件,那就是用于显示文件的内容为十六进制(hexadecimal)形式的 hexdump。输入如下命令:

hexdump -C hello.o

如下图所示,第一行就是文件的格式。整个文件包含了程序的机器指令,但尚未完成最终的链接。

在这里插入图片描述

5. 合奏的和谐统一——链接

链接阶段是编译过程的最后一步,就是将 OBJ 文件和系统库的 OBJ 文件、库文件链接起来,最终生成了可以在特定平台运行的可执行文件,用到的工具为 ldcollect2。输入如下命令,生成最终的可执行文件:

gcc hello.o -o hello

此时,一个完整的可执行文件 hello 就生成了。当然,这个可执行文件,与 gcc hello.c -o hello 生成的可执行文件,没有任何区别。

在这里插入图片描述

二、舞姿的动作细——编译详细模式

在 GCC 编译过程中,使用 -v 选项可以启用详细模式,显示编译的每个步骤和所调用的各个工具的详细信息。这对于调试和理解编译过程非常有用。具体命令如下:

gcc hello.c -o hello -v

执行这个命令会产出一堆信息,不过,我们也可以从中找到一些关键的信息,来验证我们前面提到的一些内容。

在这里插入图片描述

在这段信息最前面的就是编译器配置信息,我们把其中的主要信息摘出来:

Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/7/lto-wrapper
OFFLOAD_TARGET_NAMES=nvptx-none
OFFLOAD_TARGET_DEFAULT=1
Target: x86_64-linux-gnu
Configured with: ../src/configure -v ...... # 此处省略不重要的内容
Thread model: posix
gcc version 7.5.0 (Ubuntu 7.5.0-3ubuntu1~18.04) 

具体说明如下:

  • Using built-in specs.:表示使用内置的编译器规格。
  • COLLECT_GCC=gcc:表明主编译器是 gcc
  • Target: x86_64-linux-gnu:目标架构是 64 位的 x86 架构,运行在 GNU/Linux 系统上。
  • Configured with:显示了编译器的配置选项。
  • Thread model: posix:使用 POSIX 线程模型。
  • gcc version 7.5.0:编译器版本为 7.5.0。

接下来按前面所提的四个步骤,应该先进行预处理,不过从输出的信息可以看出,GCC 会把预处理和编译两个阶段一起做了。其中也用到了 cc1 工具:

在这里插入图片描述

提取出关键的信息(如下),这里就是用 cc1 工具,将 hello.c 文件编译成临时的 /tmp/ccEwwHut.s,这是个汇编文件。

COLLECT_GCC_OPTIONS='-o' 'hello' '-v' '-mtune=generic' '-march=x86-64'
/usr/lib/gcc/x86_64-linux-gnu/7/cc1 hello.c -o /tmp/ccEwwHut.s # 去掉了很多参数

[!NOTE]

启用 cc1 工具时使用了很多选项,这些选项对初学者来说,理解起来还是有难度的。不过,为了方便已经入行的小伙伴,这里给出一些选项的介绍,方便大家学习:

  • /usr/lib/gcc/x86_64-linux-gnu/7/cc1:调用了 cc1,这是 GCC 的前端,负责预处理、词法分析和语法分析。
  • -quiet:表示减少输出信息。
  • -imultiarch x86_64-linux-gnu:指定了目标平台。
  • -dumpbase hello.c:指定源文件名。
  • -mtune=generic:优化针对通用架构。
  • -march=x86-64:目标架构为 x86-64。
  • -fstack-protector-strong:启用强堆栈保护。
  • -Wformat:开启格式字符串警告。
  • -Wformat-security:开启格式字符串安全检查。

这还多了一步前面没提到,就是搜索路径,信息如下:

#include "..." search starts here:
#include <...> search starts here:
 /usr/lib/gcc/x86_64-linux-gnu/7/include
 /usr/local/include
 /usr/lib/gcc/x86_64-linux-gnu/7/include-fixed
 /usr/include/x86_64-linux-gnu
 /usr/include
End of search list.

其实这个步骤只是为后面的链接阶段做准备,提前找出加载的库。

到了汇编阶段,可以看到是调用 as 汇编器进行汇编,其中的 -v 选项就是详细模式,--64 表示生成 64 位的目标代码,最后生成指定输出对象文件 /tmp/cc8dsQ4D.o,这也是个临时文件。

在这里插入图片描述

最后到了链接阶段,从下图中可以看出,调用 collect2 链接器。链接器后面的参数中,除了一些相关的库之外,最关键的 /tmp/cc8dsQ4D.o 也包含在其中。从中也可以看到有 -o hello 的选项和参数,也就是最终会生成 hello 的可执行文件。

在这里插入图片描述

[!NOTE]

同样有很多选项比较难,稍微解释一下作为提升内容:

  • -plugin:使用 LTO 插件进行链接时优化。
  • -plugin-opt:传递给插件的选项。
  • -m elf_x86_64:指定 ELF 格式为 64 位。
  • -dynamic-linker /lib64/ld-linux-x86-64.so.2:指定动态链接器。
  • -pie:生成位置无关的可执行文件。
  • -z now:使某些符号立即可用。
  • -z relro:创建只读重定位段。
  • -lgcc, -lgcc_s, -lc:链接必要的库。

三、幕后——GCC 的各种选项(Overall Option)

GCC (GNU Compiler Collection) 提供了许多选项来控制编译器的行为。这些选项可以大致分为几个类别,包括预处理选项、编译选项、汇编选项和链接选项等。下面对相对重要的选项进行解释:

1. 预处理选项

  • -E:只进行预处理阶段,然后停止。输出是经过预处理的源代码。
  • -P:不输出行控制信息(例如 #line 指令)。
  • -C:保留所有注释。
  • -M:输出依赖性列表。
  • -MM:输出依赖性列表,并忽略标准头文件。

2. 编译选项

  • -c:只编译并汇编,但不链接。生成一个目标文件。
  • -S:只编译,生成汇编代码。
  • -E:只预处理,不编译。
  • -g:生成调试信息。
  • -O:设置优化等级。-O0 表示无优化,-O1-O3 分别代表不同的优化级别,-O3 是最高级别的优化。
  • -Os:优化以减小代码尺寸。
  • -Og:优化同时保持调试信息的可用性。
  • -Wall:打开所有警告。
  • -Wextra:打开额外的警告。
  • -Werror:将所有警告视为错误。
  • -pedantic:启用所有 ISO C 和 ISO C++ 标准所禁止的语言扩展。
  • -pedantic-errors:如同 -pedantic 但是将扩展视为错误。
  • -std=standard:指定要遵循的标准(如 -std=c99-std=c++11)。
  • -fPIC:生成位置无关代码(Position Independent Code),用于共享库。

3. 汇编选项

  • -Wa,option:将 option 传递给汇编器。
  • -masm=att:选择 AT&T 汇编风格。
  • -masm=intel:选择 Intel 汇编风格。

4. 链接选项

  • -Ldir:添加目录 dir 到链接器的搜索路径。
  • -lfoo:链接名为 libfoo 的库。
  • -static:产生静态链接的可执行文件。
  • -shared:生成共享库。
  • -pie:生成位置无关的可执行文件。
  • -fPIC:与 -pie 类似,用于生成位置无关代码,通常用于共享库。
  • -Wl,option:传递选项给链接器。
  • -T:指定链接器脚本。
  • -nostartfiles:不使用任何启动文件。
  • -nostdlib:不使用标准库。

5. 其他选项

  • -v:显示编译器版本信息和编译过程中的详细信息。
  • -V:显示编译器版本。
  • -Bprefix:指定前缀路径 prefix 来查找编译器相关的工具。
  • -print-file-name=filename:打印指定文件的完整路径。
  • -print-prog-name=program:打印指定程序的完整路径。
  • -print-libgcc-file-name:打印 libgcc 的路径。
  • -dumpversion:打印版本号。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1954883.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Milvus Lite, Milvus Cloud, Standalone, 与 Distributed:组件功能关系深度解析

在大数据时代,高效、灵活的向量搜索解决方案成为了许多企业和研究机构不可或缺的技术支撑。Milvus,作为一款开源的向量数据库,凭借其卓越的性能、可扩展性和易用性,在众多向量搜索引擎中脱颖而出。Milvus 提供了 Lite、Cloud、Standalone、Distributed 四种部署模式,每种模…

55. 跳跃游戏【 力扣(LeetCode) 】

一、题目描述 给你一个非负整数数组 nums &#xff0c;你最初位于数组的 第一个下标 。数组中的每个元素代表你在该位置可以跳跃的最大长度。 判断你是否能够到达最后一个下标&#xff0c;如果可以&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 二、测试用…

Python学习笔记44:游戏篇之外星人入侵(五)

前言 上一篇文章中&#xff0c;我们成功的设置好了游戏窗口的背景颜色&#xff0c;并且在窗口底部中间位置将飞船加载出来了。 今天&#xff0c;我们将通过代码让飞船移动。 移动飞船 想要移动飞船&#xff0c;先要明白飞船位置变化的本质是什么。 通过上一篇文章&#xff0…

STM32的GPIO输入输出方式设置示例

1、GPIO口做基本的输入/输出口使用时&#xff0c;输入有上拉输入、下拉输入、浮空输入&#xff08;既无上拉电阻也无下拉电阻&#xff09;3种输入方式&#xff1b;输出有开漏输出、推挽输出2种输出方式。 2、示例 &#xff08;1&#xff09;示例1&#xff1a;GPIO做输出的设置…

【机器学习】pytorch 常用函数解析

目录 一、基本函数介绍 1.1 nn.Module 类 1.2 nn.Embedding 1.3 nn.LSTM 1.4 nn.Linear 1.5 nn.CrossEntropyLoss 1.6 torch.save 1.7 torch.load 1.8 nn.functional 1.9 nn.functional.softmax 本文主要对 pytorch 中用到的函数进行介绍&#xff0c;本文会不断更新~…

【Redis进阶】主从复制

1. 主从结构引入 在分布式系统中&#xff0c;涉及到一个严重问题&#xff1a;单点问题 即如果某个服务器程序只有一个节点&#xff08;单台机器提供服务&#xff09;&#xff0c;就会出现以下两个问题&#xff1a; 可用性问题&#xff0c;如果这台机器挂了&#xff0c;意味着…

Github 2024-07-27开源项目日报 Top10

根据Github Trendings的统计,今日(2024-07-27统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量非开发语言项目2C++项目2C项目2TypeScript项目1JavaScript项目1Java项目1Python项目1C#项目1免费编程学习平台:freeCodeCamp.org 创建周期:33…

jQuery入门(一)

一、JQuery介绍 - jQuery 是一个 JavaScript 库。 - 所谓的库&#xff0c;就是一个 JS 文件&#xff0c;里面封装了很多预定义的函数&#xff0c;比如获取元素&#xff0c;执行隐藏、移动等&#xff0c;目的就 是在使用时直接调用&#xff0c;不 需要再重复定义&#xff0c;这…

iPhone 在 App Store 中推出的 PC 模拟器 UTM SE

PC 模拟器是什么&#xff1f;PC 模拟器是一种软件工具&#xff0c;它模拟不同硬件或操作系统环境&#xff0c;使得用户可以在一台 PC 上运行其他平台的应用程序或操作系统。通过 PC 模拟器&#xff0c;用户可以在 Windows 电脑上体验 Android 应用、在 Mac 电脑上运行 Windows …

Python如何获取终端尺寸?

os.get_terminal_size()&#xff0c;无差别获取当前终端长宽&#xff0c;让你为所欲为。 (笔记模板由python脚本于2024年07月27日 08:30:53创建&#xff0c;本篇笔记适合喜欢钻研的coder翻阅) 【学习的细节是欢悦的历程】 Python 官网&#xff1a;https://www.python.org/ Fre…

使用命名管道的通信程序, 加入了日志系统

文章目录 日志系统通信程序运行效果 日志系统 // log.hpp #pragma once #include <time.h> #include <iostream> #include <stdio.h> #include <string> #include <stdarg.h> #include <sys/types.h> #include <sys/stat.h> #inclu…

软设之数据库关系代数

数据库关系代数 基本概念 元祖行&#xff1a;水平方向上每一行为一条记录&#xff0c;这个记录对应1个实体。一般称为元祖&#xff0c;元祖行或者记录 属性列&#xff1a;垂直方向上每一列为一个属性&#xff0c;一般称为属性列&#xff0c;字段等。关系表达式中可以用列序号…

又要起飞,浏览器居然都可以本地 OCR 啦

前言 PaddleOCR&#xff0c;这是一个由百度开发的开源 OCR&#xff08;Optical Character Recognition&#xff0c;光学字符识别&#xff09;工具&#xff0c;它可以用于从图像中识别文本。 PaddleOCR支持多种语言的文本识别&#xff0c;并且能够处理多种场景下的图像。 现在…

【Web开发手礼】探索Web开发的魅力(十二)-Vue(2)用户动态页面

前言 主要介绍了用vue框架创建用户动态页面的具体过程&#xff0c;可以帮助学习vue框架的基本知识&#xff01;&#xff01;&#xff01;&#xff01; 用户动态页面 用户信息 用户头像 通过 Bootstrap 所提供的 .img-fluid 类让图片支持响应式布局。其原理是将 max-width: 10…

Java面试八股之Spring boot的自动配置原理

Spring boot的自动配置原理 Spring Boot 的自动配置原理是其最吸引人的特性之一&#xff0c;它大大简化了基于 Spring 框架的应用程序开发。以下是 Spring Boot 自动配置的基本原理和工作流程&#xff1a; 1. 启动类上的注解 Spring Boot 应用通常会在主类上使用 SpringBoot…

ZBrush入门使用介绍——4、笔刷选项说明

大家好&#xff0c;我是阿赵。   这次来看看ZBrush的笔刷的选项用法。 一、选择笔刷 点击笔刷&#xff0c;可以打开笔刷选择面板。 在最上面的Quick Pick&#xff0c;有最近使用过的笔刷&#xff0c;可以快速的选择。下面有很多可以选择的笔刷。但由于笔刷太多&#xff0c;…

AJAX之基础知识

目录 AJAX入门及axios使用什么是AJAX怎么用AJAX 认识URL协议域名资源路径URL查询参数 查询参数URL查询参数axios查询参数 常用请求方法axios请求配置 axios错误处理HTTP协议请求报文请求报文-错误排查响应报文HTTP响应状态码 form-serialize插件 AJAX入门及axios使用 什么是AJ…

【Python机器学习】决策树的构造——信息增益

决策树是最经常使用的数据挖掘算法。它之所以如此流行&#xff0c;一个很重要的原因就是不需要了解机器学习的知识&#xff0c;就能搞明白决策树是如何工作的。 决策树的优缺点&#xff1a; 优点&#xff1a;计算复杂度不高&#xff0c;输出结果易于理解&#xff0c;对中间值的…

RabbitMq手动ack的超简单案例+Confirm和Return机制的配置和使用

最简单的例子 先简单介绍一下这三个方法 basicAck 表示确认成功&#xff0c;使用此方法后&#xff0c;消息会被rabbitmq broker删除 basicNack 表示失败确认&#xff0c;一般在消费消息业务异常时用到此方法&#xff0c;可以将消息重新投递入队列 basicReject 拒绝消息&am…