编译与链接------《程序员的自我修养》

news2024/11/24 12:29:47

本篇整理于《程序员的自我修养》一书中编译与链接相关知识,整理的目的是为了更加深入的了解编译于链接的更多底层知识,面对程序运行时种种性能瓶颈我们束手无策。我们看到的是这些问题的现象,但是却很难看清本质,所有这些问题的本质就是软件运行背后的机理及支撑软件运行的各种平台和工具,如果能够深入了解这些机制,那么解决这些问题就能够游刃有余,收放自如了。

  • 1.首言:
  • 2.程序的翻译环境和执行环境
  • 3.翻译环境中被隐藏的部分
    • 3.1编译本身也分为几个阶段:
    • ①预编译
    • ②编译
    • ③汇编
    • ④链接
      • ④.Ⅰ重定位
      • ④.Ⅱ 符号引用---链接
      • ④.Ⅲ 理解总结:
  • 4.运行环境
  • 5.总结:

1.首言:

对于平常的应用程序开发,我们很少需要关注编译和链接过程,因为通常的开发环境
都是流行的集成开发环境(IDE), 比如Visual Studio、Delphi 等。这样的IDE一般都将编
译和链接的过程.“一步完成,通常将这种编译和链接合并到一起的过程称为构建(Build)。
即使使用命令行来编译-一个源代码文件,简单的一句“gcchello.c"命令就包含了非常复
杂的过程。
IDE和编译器提供的默认配置、编译和链接参数对于大部分的应用程序开发而言已经
足够使用了。但是在这样的开发过程中,我们往往会被这些复杂的集成工具所提供的强大
功能所迷惑,很多系统软件的运行机制与机理被掩盖,其程序的很多莫名其妙的错误让我
们无所适从,面对程序运行时种种性能瓶颈我们束手无策。我们看到的是这些问题的现象,
但是却很难看清本质,所有这些问题的本质就是软件运行背后的机理及支撑软件运行的各
种平台和工具,如果能够深入了解这些机制,那么解决这些问题就能够游刃有余,收放自
如了。

2.程序的翻译环境和执行环境

在ANSI(标准) C的任何一种实现中,存在两个不同的环境。

  1. 第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令
  2. 第2种是执行环境,它用于实际执行代码。

在这里插入图片描述

3.翻译环境中被隐藏的部分

我们通常说源文件编译链接生成可执行程序:
在这里插入图片描述

  • 1.组成一个程序的每个源文件通过编译过程分别转换成目标代码也叫目标文件(object code)。
  • 2.每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序
  • 3.链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人 的程序库,将其需要的函数也链接到程序中。

3.1编译本身也分为几个阶段:

在这里插入图片描述
而这生成可执行程序就包括了这四个步骤:预编译,编译,汇编,链接。

①预编译

预编译阶段做了什么?
首先产生一个test.i文件

首先是源代码文件hello.c和相关的头文件,如stdio.h等被预编译器cpp预编译成一-个i
文件。对于C++程序来说,它的源代码文件的扩展名可能是.cpp或.cxx,头文件的扩展名可
能是.hpp,而预编译后的文件扩展名是.i。第一步 预编译的过程相当于如下命令(-E表示只
进行预编译):

$gcc -E hello.c -o hello. i

预编译过程主要处理那些源代码文件中的以“#”开始的预编译指令

  • 将所有的“#define"删除,并且展开所有的宏定义。
  • 处理所有条件预编译指令,比如“#if”、 “#ifdef"、 “#elif" “#else"、 “#endif"。
  • 处理“#include"预编译指令,将被包含的文件插入到该预编译指令的位置。注意,这
    个过程是递归进行的,也就是说被包含的文件可能还包含其他文件。
  • 删除所有的注释“//” 和“/ /”。
  • 添加行号和文件名标识,比如#2“hello.c"2,以便于编译时编译器产生调试用的行号
  • 信息及用于编译时产生编译错误或警告时能够显示行号。 保留所有的#pragma编译器指令,因为编译器须要使用它们。

②编译

编译阶段做什么?
生成一个test.s文件
-------把C语言代码翻译成汇编代码

会进行:
语法分析
词法分析——————更详细的请看《程序员的自我修养》一书
语义分析
重要:【符号汇总】–符号就是全局变量,函数
会将这些符号记录下来。

编译过程就是把预处理完的文件进行–系列词法分析、语法分析、语义分析及优化后生
产相应的汇编代码文件,这个过程往往是我们所说的整个程序构建的核心部分,也是最复杂的部分

③汇编

汇编阶段做什么?
生成一个test.o文件—目标文件
1.把汇编代码翻译成二进制指令存放到目标文件
2.形成符号表—会将符号给个地址,形成符号表

汇编器是将汇编代码转变成机器可以执行的指令,每一个汇编语句几乎都对应-条机器
指令。所以汇编器的汇编过程相对于编译器来讲比较简单,它没有复杂的语法,也没有语义,
也不需要做指令优化,只是根据汇编指令和机器指令的对照表一-翻译就可以了 ,“汇编”
这个名字也来源于此。上面 的汇编过程我们可以调用汇编器as来完成:

$as he11o.s -0 he1l1o.o

④链接

链接通常是-一个让人比较费解的过程,为什么汇编器不直接输出可执行文件而是输出一
个目标文件呢?链接过程到底包含了什么内容?为什么要链接?

我们先看下 这个问题,我们创建3个.c文件
在这里插入图片描述

经过编译器这个个步骤以后,每个源代码终于被编译成了目标代码。但是test.o这个目标代码中有-一个问
题是:a和b的地址还没有确定。如果我们要把目标代码使用汇编器编译成真正能
够在机器_上执行的指令,那么a和b的地址应该从哪儿得到呢?如果a和b
定义在跟上面的源代码同一个编译单元里面,那么编译器可以为a和b分配空间,
确定它们的地址:那如果是定义在其他的程序模块呢?
这个看似简单的问题引出了我们一一个很大的话题:目标代码中有变量定义在其他模块,
该怎么办?事实上,定义其他模块的全局变量和函数在最终运行时的绝对地址都要在最终链
接的时候才能确定。所以现代的编译器可以将一个源代码文件编译成一个未链接的目标文
件,然后由链接器最终将这些目标文件链接起来形成可执行文件。让我们带着这个问题,走
进链接的世界。

④.Ⅰ重定位

由于在编译目标文件test.0的时候,编译器并不知道变量a,b的目标地址,所以编译器在没
法确定地址的情况下,将这条mov指令的目标地址置为0,等待链接器在将目标文件test.0与a.o和b.o
链接起来的时候再将其修正。我们假设test.o和a.o,b.o链接后,变量的地址确定下来为0x 1000,
0x1001,那么链接器将会把这个指令的目标地址部分修改成0x1000和0x1001这个地址修正的过程也被叫做
重定位(Relocation)

重定位所做的就是给程序中每个这样的绝对地址引用的位置“打补丁”,使它们指向正确的地址。

④.Ⅱ 符号引用—链接

函数访问须知道目标函数的地址,变量访问也须知道目标变量的地址,所以
这两种方式都可以归结为一种方式, 那就是模块间符号的引用。模块间依靠符号来通信类似
于拼图版,定义符号的模块多出一块区域,引用该符号的模块刚好少了那一块区域, 两者一
拼接刚好完美组合(见图2-7)。这个模块的拼接过程就:链接(Linking)。
在这里插入图片描述

简单来讲就是 在编译过程中每个模块会进行符号汇总,然后汇编过程会给每个符号定位个地址,这个地址要看该模块是否分配了,如果没有分配那就为空地址。
最后链接的目的就是将不同模块的符号的地址重定位,将符号的地址统一,使程序可以执行。

④.Ⅲ 理解总结:

编译和链接过程也并非想象中的那么复杂,它还是一个比较容易理解的概念。

比如我们在程序模块main.c中使用另外一个模块Add.c中的函数add()。我们在main.c模块中
每–处调用add的时候都必须确切知道add这个函数的地址,但是由于每个模块都是单独编
译的,在编译器编译main.c的时候它并不知道add函数的地址,所以它暂时把这些调用add
的指令的目标地址搁置,等待最后链接的时候由链接器去将这些指令的目标地址修正。如果
没有链接器,须要我们手工把每个调用add的指令进行修i正,则填入正确的add函数地址。
当Add.c模块被重新编译,add 函数的地址有可能改变时,那么我们在main.c中所有使用到
add的地址的指令将要全部重新调整。这些繁琐的工作将成为程序员的噩梦。

使用链接器,你可以直接引用其他模块的函数和全局变量而无须知道它们的地址,因为链接器在链接的时
候,会根据你所引用的符号add, 自动去相应的Add.c模块查找add的地址,然后将main.c
模块中所有引用到add的指令重新修n正,让它们的目标地址为真正的add函数的地址。这就
是静态链接的最基本的过程和作用。

总结:

在这里插入图片描述

4.运行环境

程序执行的过程:

  1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序
    的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
  2. 程序的执行便开始。接着便调用main函数。
  3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回
    地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程
    一直保留他们的值。
  4. 终止程序。正常终止main函数;也有可能是意外终止。

5.总结:

在本篇中, 我们首先回顾了从程序源代码到最终可执行文件的4个步骤:预编译、编
译、汇编、链接,分析了它们的作用及相互之间的联系,IDE集成开发工具和编译器默认的
命令通常将这些步骤合并成一一步,使得我们通常很少关注这些步骤。

我们还总结了上面这4个步骤中的主要部分,即编译步骤。介绍了编译器将C程序源代码转变成汇编代码的若干个步骤:词法分析、语法分析、语义分析、目标代码生成。

最后我们介绍了:重定位、符号、目标文件等概念

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/333784.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Allegro如何使用Vertext命令修改丝印线段的形状操作指导

Allegro如何使用Vertext命令修改丝印线段的形状操作指导 在用Allegro画丝印线段的时候,如果画了一段不是自己需要形状的线段,无需删除重画,可以用Vertext命令直接编辑 如下图 修改前 修改后 具体操作如下 选择Edit

Java笔记-JUC基础

1、什么是JUC JUC指的是java.util三个并发编程工具包 java.util.concurrentjava.util.concurrent.atomicjava.util.concurrent.locks 2、线程的几种状态 public enum State{NEW,//新建RUNNABLE,//准备就绪,等待资源BLOCKED,//阻塞WAITING,//一直等待TIMED_WAITI…

vue脚手架 element-ui spring boot 实现图片上传阿里云 并保存到数据库

一.阿里云 注册登陆就不讲了,登陆进去后如下操作 1. 进入对象存储OSS 创建一个新的Bucket 随后点击新建的bucket 2.去访问RAM 前往RAM控制台 3.去创建用户 4.创建密匙 5.随后返回RAM控制台 给用户增加权限,文件上传所需权限,需要带含有…

LeetCode——1797. 设计一个验证系统

一、题目 你需要设计一个包含验证码的验证系统。每一次验证中,用户会收到一个新的验证码,这个验证码在 currentTime 时刻之后 timeToLive 秒过期。如果验证码被更新了,那么它会在 currentTime (可能与之前的 currentTime 不同&am…

Java IO模型详解

文章目录Java IO模型详解一、I/O的定义1、计算机结构的视角2、应用程序的视角二、Java 中3种常见的 I/O 模型1、同步阻塞 I/O(BIO)2、同步非阻塞 I/O(NIO)★ I/O 多路复用模型3、异步非阻塞 I/O(AIO)Java I…

Flutter 小技巧之 3.7 更灵活的编译变量支持

今天我们聊个简单的知识点,在 Flutter 3.7 的 release-notes 里,有一个没有出现在 announcement 说明上的 change log ,可能对于 Flutter 团队来说这个功能并不是特别重要,但是对于我个人而言,这是一个十分重要的能力补…

什么是模板方法模式?

在面向对象程序设计过程中,程序员常常会遇到这种情况:设计一个系统时知道了算法所需的关键步骤,而且确定了这些步骤的执行顺序,但某些步骤的具体实现还未知,或者说某些步骤的实现与具体的环境相关。例如,去…

阿里云国际服务器ECS特性与优势

阿里云国际服务器的 ECS 作为一种安全、可靠、灵活、可扩展的云计算服务,不仅可以减少运行和维护,而且可以提高运行和维护效率,使用户关注核心业务的创新。 阿里云国际服务器ECS优势一:产品丰富 阿里云国际云服务器 ECS 可以提供…

《MySql学习》 SQL 语句的更新过程

《MySql学习》 SQL 语句的更新过程 一.SQL查询语句的执行过程 上一篇博文记录了SQL查询语句的执行过程,首先客户端通过TCP三次握手与Server层的连接器建立连接(短连接与长链接),缓存权限。然后去查询缓存(8.0后移除&…

联想服务器双品牌的思考:融合化、场景化、订阅化、绿色化,打造全栈新算力基础设施

联想集团执行副总裁兼中国区总裁刘军:智能化转型是中国企业未来十年穿越经济周期的利器,智能化生产力水平决定了企业发展的速度与高度。 联想创新性提出融合化、场景化、订阅化及绿色化的“四维算力”,致力于成为中国领先的智能IT基础设施提供…

微服务--Feign学习

Feign远程调用: RestTemplate发起远程调用的代码: 存在下面的问题 代码可读性差,编程体验不统一参数复杂URL难以维护 Feign的介绍:Feign是一个声明式的http客户端,官方地址:https://github.com/OpenFeign/…

论文文献引用规范和标准(国标GBT7714)@endnote国标样式

文章目录论文文献引用规范和标准(国标GBT7714)国标GBT7714-2015endnote stylerefs简述国标GBT7714条目的组织格式Noteword中的文献交叉引用超链接文献引用示例endNote资源和基本使用endnote或其他文献引用工具下载word中的其他引文技巧知网国标格式引文引…

谈谈Java Optional的坑

开端: 大家好,我是老白。昨天朋友提出的java8后出来的自带的对象判定方式Optional.ofNullable(),后来查询了一些资料和自己试验了一些demo资料,在这里记录分享个大家 作用:判断对象是否为空,是则重新创建一个新对象&…

ABAP 搜索帮助带出多个字段描述 更新屏幕字段

文章目录需求解析1-DYNP_GET_STEPL2-F4IF_INT_TABLE_VALUE_REQUEST3-获取返回值4-把相应字段更新到内表5-DYNP_VALUES_UPDATE代码需求 如图,当我点击责任工序的搜说帮助时, 同时会把责任人员的描述带出来. 解析 1-DYNP_GET_STEPL 这个方法就是获取当前的循环步骤 2-F4IF_I…

浏览器中的 JavaScript 执行机制

思维导图 本文为反复学习极客时间-《浏览器的工作原理与实践》-浏览器中的 JavaScript 执行机制章节中的一些思考与记录。 一些重要概念 变量提升 所谓的变量提升,是指在 JavaScript 代码执行过程中,JavaScript 引擎把变量的声明部分和函数的声明部分…

你可能还不知道的 console.log 替代品

通过使用 javascript 对象的破坏能力,您可以这样做:const{ log } console; log("hi"); log("testing");你可以将log函数更改为您想要的任何其他名称,如下所示:const{log: myLog } console; myLog("hi&qu…

vue插槽 Slots

一、插槽是什么&#xff1f; 插槽就是子组件中的提供给父组件使用的一个占位符&#xff0c;用<slot></slot> 表示, 父组件可以在这个占位符中填充任何模板代码&#xff0c;如 HTML、组件等&#xff0c;填充的内容会替换子组件的<slot></slot>标签。 简…

OpenSergo Spring Cloud Alibaba 带来的服务治理能力

作者&#xff1a;十眠、牧思 Spring Cloud 应用为何需要服务治理 随着微服务技术的发展&#xff0c;微服务(MicroServices) 的概念早已深入人心&#xff0c;越来越多的公司开始使用微服务架构来开发业务应用。 如果采用得当&#xff0c;微服务架构可以带来非常大的优势。微服…

IDEA与eclipse桌面配置基础(笔记)

在eclipse中配置jdk Window–>Preferences–>java–>installed JREs–>add–>Standard VM–>选择jdk安装路径就好了 设置字符集编码为utf-8&#xff0c;防止中文乱码 设置字符集编码为UTF-8&#xff1a;Window–>Preferences–>General–>Workspace…

第四次工业革命新十年:看跨越智能化鸿沟的联想范式

十年前&#xff0c;GE推出全球第一个工业互联网平台Predix&#xff1b;同年&#xff0c;在2013汉诺威工业博览会上&#xff0c;德国正式推出工业4.0概念。由此&#xff0c;全球开启了以工业4.0和工业互联网为核心的第四次工业革命浪潮&#xff0c;智能技术成为了第四次工业革命…