【理解ARM架构】 散列文件 | 重定位

news2024/11/28 23:41:30

🐱作者:一只大喵咪1201
🐱专栏:《理解ARM架构》
🔥格言:你只管努力,剩下的交给时间!
tu

目录

  • 🏓引出重定位
  • 🏓散列文件
  • 🏓可读可写数据段重定位
  • 🏓清除BSS段
  • 🏓代码段重定位
    • 🎯相对跳转
    • 🎯 实现代码段重定位
  • 🏓纯C函数实现重定位
  • 🏓总结

书接上文中的:

问题:为什么每个函数中都得创建一个uart1结构体局部变量,而不是创建全局变量供这些函数使用呢?

🏓引出重定位

tu
继续看这张图,为什么只有被const修饰的ConstChar变量能正常输出,其他三个变量输出的就是乱码的呢?

tu
如上图,本喵为了方便看汇编代码,将C代码只保留打印变量部分。

打印g_Char这个没有被const修饰的全局变量时,可以看到,使用汇编指令LDR r0,[pc,#80]0x20000000地址处读取值,赋给寄存器R0。

打印g_ConstChar这个被const修饰的全局变量时,可以看到,使用汇编指令MOVVS r0,#0x42,直接将B的ASCII码值赋给了寄存器R0。

都是在R0拿到数值以后才调用putchar函数来输出R0中的值,这里R0是用来传参的。

但是此时g_Char全局变量所在地址0x20000000并没有值,因为整个代码中只有读取这个地址的指令,并没有给这个地址赋值的指令,所以CPU读取g_Char地址处读取到的就是乱码。

g_ConstChar是直接拿到的立即数,这个立即数是存放在Flash中的,是在烧录的时候写入的。

加载地址和链接地址:

我们将程序写好编译链接完成以后,将其烧录到开发板中,此时程序保存在Flash中,而对应Flash中的地址被叫做加载地址

而编译器在链接时,会给变量分配一个地址,这个地址叫做链接地址,对应于RAM中的地址。

加载地址可以理解为真实物理地址,而链接地址可以理解为虚拟地址,CPU在执行代码时,使用的是虚拟地址,也就是链接地址。

图

如上图,要想程序正常运行,就需要在执行mymain函数之前,将Flash中的A复制到RAM的数据段处,让CPU能在链接地址处找到相应的值。

  • 保存在ROM上的全局变量的值,在使用前要复制到内存,这就是数据段重定位
  • 把代码移动到其他位置,这就是代码重定位。

程序运行时,应该位于它的链接地址处,因为:

  • 使用函数地址时用的是"函数的链接地址",所以代码段应该位于链接地址处
  • 去访问全局变量、静态变量时,用的是"变量的链接地址",所以数据段应该位于链接地址处

但是: 程序一开始时可能并没有位于它的"链接地址":

  • 比如对于STM32F103,程序被烧录器烧写在Flash上,这个地址称为"加载地址"
  • 比如对于IMX6ULL/STM32MP157,片内ROM根据头部信息把程序读入内存,这个地址称为“加载地址”

加载地址 != 链接地址时,就需要重定位。


谁来做重定位?

  • 程序本身:它把自己复制到链接地址去
  • 一开始,程序可能并不位于它的链接地址上,它自己都不在链接地址,为什么它可以执行重定位的操作?
    • 因为重定位的代码是使用“位置无关码”写的。
  • 什么叫位置无关码:这段代码扔在任何位置都可以运行,跟它所在的位置无关
  • 怎么写出位置无关码:
    • 跳转:使用相对跳转指令,不能使用绝对跳转指令。
      • 只能使用branch指令(比如BL mymain),不能给PC直接赋值,比如LDR pc, =mymain
    • 不要访问全局变量、静态变量。
    • 不使用字符串。

🏓散列文件

怎么做重定位和清除BSS段?

  • 核心操作:复制

复制的三要素:源、目的、长度

  • 怎么知道代码段/数据段保存在哪?(加载地址)
  • 怎么知道代码段/数据段要被复制到哪?(链接地址)
  • 怎么知道代码段/数据段的长度?

对于BSS段,怎么知道BSS段的地址范围:起始地址、长度?

这一切信息都在keil中使用散列文件(Scatter File)来描述。

顾名思义,散列就是分散排列的意思,在STM32F103这类资源紧缺的单片机芯片中:

  • 代码段保存在Flash上,直接在Flash上运行(当然也可以重定位到内存里)
  • 数据段保存在Flash上,使用前被复制到内存里

从Keil5的帮助中找到Arm® Compiler for Embedded Reference Guide.pdf文件,里面有散列文件的详细介绍,本喵这里大致讲解一下。
图
如上图,一个散列文件由一个或多个Load region(加载域)组成,加载域中含有一个或多个Execution region(可执行域),可执行域中含义一个或多个input section(输入段)。

  • 加载域描述了Flash中一块区域的位置,包括该区域中有什么内容及位置(加载地址),而且还可以控制这些内容放置在哪里(加载地址)。

  • 可执行域描述了RAM中程序运行时,该区域包含的内容(输入段),并且可以控制区域所在的位置(链接地址)。

  • 输入部分描述了可执行域中包含哪些数据类型。

这样来看,对于不同域的作用还是一头雾水,下面直接看本喵写的代码中生成的散列文件。


图
如上图所示,在当前工程文件中的Objects目录下,有一个后缀为.sct的文件,这个就是散列文件。
图
如上图就是散列文件里的内容,LR_IROM1是加载域的名称,0x08000000是加载域的加载地址,也就是Flash中代码存放的起始地址,后面是加载域的大小。

第一个可执行域:

加载域中有两个可执行域,ER_IROM1是第一个可执行域的名称,起始地址是0x08000000(链接地址),里面包含多个输入段信息,该地址和加载地址重合,所以这个可执行域不用重定位。

  • *.o :所有objects文件,就是链接之前的二进制目标文件。
  • *:所有objects文件和库,在一个散列文件中只能使用一个*。
  • .ANY:等同于*,优先级比*低;在一个散列文件的多个可执行域中可以有多个.ANY

*.o (RESET, +First)表示将所有objects文件中的RESET域放在可执行的起始(+First)位置。

图
如上图所示启动文件中的汇编代码,其中 AREA RESET规定了绿色框中的汇编代码是RESET域,所以散列文件中第一个可执行域中首先放置绿色框中的代码。

  • 板子一上电以后,就从__Vectors处的DCD开始执行代码,这部分也恰好是该可执行域中RESET域的代码。
  • 然后才会调用跳转到Rset_Handler处开始执行。

*(InRoot$$Sections)是如果我们写了main函数,编译器自己会执行的一套东西,这里本喵写的是mymain函数,为的就是避开这个东西,所以这里不用管它是什么。

.ANY (+RO)表示所有objects文件和库中的只读数据段放在这个可执行域中,挨着前面的输入段放置,和我们前面分析的一样,只读数据段并不需要重定位。

.ANY (+XO)并没有涉及到,也不用管它。

第二个可执行域:

RW_IRAM1是第二个可执行域的名称,起始地址是0x20000000(链接地址),位于RAM中,里面包含一个输入段信息,这个执行域需要进行重定位。

.ANY (+RW +ZI)表示所有objects文件和库中读写数据段BSS或者ZI段,放在这个可执行域中。

  • 可执行域的起始地址就是链接地址。

可以看到,不同数据段所处的位置是由散列文件通过可执行域中的输入段决定的,而且从散列文件中可以得到重定位需要的三要素源,目的,长度了。

🏓可读可写数据段重定位

在调用mymain函数使用数据段前,将可读可写数据段的初始值从加载地址复制到链接地址。

tu
如上图所示,定义一个复制函数mymemcpy,传入目的地址,起始地址,以及数据长度,将数据从起始地址复制到目的地址。

在启动文件的汇编代码中,在使用BL mymain之前,使用BL mymemcpy调用该函数实现数据段重定位。

我们知道,汇编代码调用C函数时,通过r0~r3寄存器来实现传参的,但是在调用时,我们怎么知道起始地址和目的地址以及长度呢?

不用去散列文件里查找具体的地址值,keil5的帮助手册中,提供了获取这几个参数的方式:

tu
如上图所示是加载地址的符号,只需要将region_name替换成我们要操作的域即可,如Load$$RW_IRAM1$$Base表示的就是RW_IRAM1可执行域的加载地址,也就是我们需要的源地址。

tu
如上图所示是获取可执行域的起始地址,同样进行部分替换即可得到目的地址(链接地址)。

tu
如上图,在启动文件的汇编代码中,声明拷贝函数,链接地址,数据个数,加载地址,然后将其赋值给R0~R2进行传参,再调用mymemcpy进行数据段的拷贝,最后再带调用mymain打印四个变量。

tu
如上图,此时g_Char也成功的打印出了值,说明此时该地址并是乱码了,而是A的ASCII码,说明我们的数据段重定位成功了。

🏓清除BSS段

tu
如上图,初始值为0的全局变量g_A和无初始值的全局变量g_B也并不是乱码了,而且空,'0'输出的结果是空,说明此时这两个变量的链接地址处也有值。

奇怪了,我们只是进行了可读可写数据段的重定位,为什么BSS段也被清零了呢?这是因为编译器进行了优化,BSS段的数据只有两个,太少了,没有必要专门去清除BSS段,直接把它两归为可读可写数据段一并处理了。

tu
如上图,将BSS段的这两个变量改成数组,此时编译器就不会优化了,可以看到,输出的数组第一个元素的值是乱码,说明BSS段地址处存放的就是乱码,需要我们进行清零操作。

tu
如上图所示是获得BSS段(ZI段)的链接地址(基地址)、长度的符号,同样需要进行部分替换。

图
如上图,定义一个mymemset清除函数,传入目的地址,要设置的值,以及长度,就将这部分数据设置成对应的值。

tu
如上图所示汇编代码,在红色框声明ZI段的起始地址以及长度,然后在蓝色框中使用R0~R2传参,给R1赋值0,再使用BL mymemset调用清除函数,将BSS段清零0。

图
如上图,此时打印出的就是空,说明BSS段存放的是0,也说明我们清除BSS段成功了。

🏓代码段重定位

tu
如上图,在默认散列文件中,代码段的load address = execution address
也就是加载地址和执行地址(链接地址)一致,所以无需重定位。

有时候,我们需要把程序复制到内存里运行,比如:

  • 想让程序执行得更快:需要把代码段复制到内存里。
  • 程序很大,保存在片外SPI Flash中,SPI Flash上的代码无法直接执行,需要复制到内存里。

这时候,需要修改散列文件,把代码段的可执行域放在内存里,那么程序运行时,就需要尽快把代码段重定位到内存。

图
如上图,对我们的散列文件进行修改:

  • 可执行域ER_IROM1
    • 加载地址为0x08000000,可执行地址为0x20000000,两者不相等。
  • 可执行域RW_IRAM1,地址只有+0
    • 加载地址:紧跟着ER_IROM1的加载地址。
    • 可执行地址:紧跟着ER_IROM1的可执行地址。

🎯相对跳转

此时散列文件已经被修改了,让代码段的链接地址不等于加载地址,我们在启动文件中先不进行代码段重定位,直接让板子去执行:

tu
如上图,这是编译后的反汇编文件,可以看到Reset_Handler的起始地址是0x20000008,说明代码段的起始地址就是这个,但是这是将散列文件中代码段可执行区域的链接地址改成0x20000000的结果。

说明Reset_Handler距离代码段起始地址的偏移量是8,那么我们将编译好的程序烧录到开发板中以后,它的加载地址是从0x08000000开始的,所以Reset_Handler的加载地址就是0x08000008

图
如上图,在程序一上电开始执行__Vectors处的第二个DCD位置,将Reset_Handler改成0x08000009,让程序从加载地址开始执行。

  • 为什么是0x08000009而不是0x08000008呢?因为最低位bit0要为1,表示从这里开始使用的是Thumb指令集。
  • 程序上电后,必须从加载地址开始执行,否则无法进行重定位等操作。
  • 所以不能直接使用Reset_Handler,因为它此时的链接地址是0x20000008

然后其他代码不变,仍然使用BL mymain调用mymain函数,将程序烧录到开饭板中:

tu
如上图,此时程序仍然可以正常运行。程序的链接地址不在散列文件中修改了吗?意味着mymain的链接地址也变了啊,此时RAM中并没有代码,为什么还能正常执行呢?

  • 能正常调用mymain的原因是使用了BL相对跳转指令。

图
如上图,代码被烧录到开发板中后位于Flash中,而此时程序又是从0x08000008处开始执行的,mymain函数距离这个位置的偏移量是固定的,所以使用BL相对跳转指令可以直接跳转到mymain函数中。

  • 相对跳转指令只看当前位置和目标位置的偏移量。

而数据段和BSS段都已经处理好了,所以程序可以正常执行,只是在Flash中执行,和我们预期在RAM中执行不符。

🎯 实现代码段重定位

tu

如上图所示,使用绝对跳转的方式去调用mymain函数,先获取mymain函数的地址到R0寄存器中,此时获取到的是链接地址,然后再使用BLX跳转到链接地址处。

  • 使用BLX中的X表示Thumb指令集。

tu
如上图,此时就不会有任何现象了,因为mymain函数的链接地址处并没有代码。

所以此时就需要实现代码段的重定位了:

IMPORT |Image$$ER_IROM1$$Base|
IMPORT |Image$$ER_IROM1$$Length|
IMPORT |Load$$ER_IROM1$$Base|

同样使用这几个符号来确定代码段的加载地址和链接地址,此时要将名字都替换成ER_IROM1,表示这是代码段,而不是数据段RW_IRAM1

图
如上图所示,在汇编代码中,声明代码段的源地址,目的地址,长度,然后使用R0~R2进行传参,然后也是调用mymemcpy,将Flash中的代码赋值到RAM中的链接地址处。

图
如上图,此时就可以正常执行了,可以输出对应的数据,说明代码段重定位成功了。

🏓纯C函数实现重定位

在汇编中实现重定位需要使用寄存器来传参目的,源,长度三要素,有没有办法只调用一个C函数就能实现呢?有的。

使用C函数实现重定位的难点在于怎么得到各个域的加载地址(源)、链接地址(目的)、长度。

在C函数中可以直接使用汇编中表示地址的符号:

  • 方法1:声明为外部变量,使用时需要使用取址符
extern int Image$$ER_IROM1$$Base;
extern int Load$$ER_IROM1$$Base;
extern int Image$$ER_IROM1$$Length;

mymemcpy(&Image$$ER_IROM1$$Base, &Image$$ER_IROM1$$Length, &Load$$ER_IROM1$$Base);
  • 方法2:声明为外部数组,使用时不需要使用取址符
extern char Image$$ER_IROM1$$Base[];
extern char Load$$ER_IROM1$$Base[];
extern int Image$$ER_IROM1$$Length;

mymemcpy(Image$$ER_IROM1$$Base, Image$$ER_IROM1$$Length, &Load$$ER_IROM1$$Base);

为什么声明了就可以用了呢?

对于int g_A这样的变量,在编译的时候会生成一个符号表,里面包含变量名和变量地址,这个变量是我们定义的。

而表示加载地址,链接地址,长度的符号,是keil5的散列文件定义的变量,所以我们在使用前使用extern声明一下,在编译的时候就会和我们自己的变量共同组成符号表:

NameAddress
g_axxxxxxxx
Image$$ER_IROM1$$Baseyyyyyyyy

由于符号表中存放的是变量名和其地址,所以我们在访问自己定义的变量int g_A时,需要&g_A拿到它的地址,然后在解引用的时候,就访问到了内存中的值。

  • 对于extern int Image$$ER_IROM1$$Base变量,要得到符号表中的地址,也是使用&Image$$ER_IROM1$$Base
  • 对于extern char Image$$ER_IROM1$$Base[]变量,要得到符号表中的地址,直接使用Image$$ER_IROM1$$Base,不需要加&
    • 因为此时mage\$\$ER_IROM1$$Base本身就表示地址。

图
如上图所示,定义系统重定位函数SystemInit,在函数体内部使用extern声明我们所需要的加载地址,链接地址以及长度等要素变量。

在使用mymemcpy等函数进行重定位时,传参extern声明的这几个变量都需要取地址&

图
如上图,也可以将这些变量声明为数组,数组名的本质就是一个地址,所以在调用mymemcpy等函数重定位时,传参时不需要取地址。

tu
如上图,在汇编函数中,声明一下系统重定位函数,然后设置好栈,因为会用到栈,再调用SystemInit进行代码段,可读可写数据段的重定位和ZI段的清0。

图
如上图,此时仍然可以正常运行,说明纯C方式的重定位成功。


既然使用到的是extern变量的地址,那么直接声明成指针类型行不行呢?

tu
如上图,直接使用extern声明为int*类型,经过本喵实验证明,在调用mymemcpy等函数时,直接传入声明的指针变量是不可以的,必须再对声明的指针取地址再传参。

因为这里使用的是这几个变量本身的值,如果声明为指针类型的话,它虽然是一个指针,但是它表示的地址数值却是我们需要的,如果直接对指针解引用访问到的并不是我们需要的这个值。

所以需要再对指针变量取地址,让其成为一个二级指针,此时解引用二级指针得到的一级指针的值才是我们需要的地址,才能直接使用。

🏓总结

平时使用CubeMX或者直接移植固件库时,并不会注意到需要重定位,而实现重定位,在keil5中主要依赖散列文件,它描述了不同可执行域的加载地址和链接地址,给重定位提供了三要素。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1254117.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Kibana部署

服务器 安装软件主机名IP地址系统版本配置KibanaElk10.3.145.14centos7.5.18042核4G软件版本:nginx-1.14.2、kibana-7.13.2-linux-x86_64.tar.gz 1. 安装配置Kibana (1)安装 [rootelk ~]# tar zxf kibana-7.13.2-linux-x86_64.tar.gz -C…

leetcode算法之链表

目录 1.两数相加2.两两交换链表中的节点3.重排链表4.合并K个升序链表5.K个一组翻转链表 1.两数相加 两数相加 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(…

针对c语言的scanf读取字符和字符串解析

在scanf函数中,格式字符串里的空格字符有特定的作用。 当你在格式字符串里放置一个空格时,scanf会尝试匹配并消耗输入中的一个或多个空白字符(包括空格、制表符或换行符)。换句话说,它会跳过任何空白字符,…

针对哈希冲突的解决方法

了解哈希表和哈希冲突是什么 哈希表:是一种实现关联数组抽象数据类型的数据结构,这种结构可以将关键码映射到给定值。简单来说哈希表(key-value)之间存在一个映射关系,是键值对的关系,一个键对应一个值。 …

蓝桥杯第四场双周赛(1~6)

1、水题 2、模拟题,写个函数即可 #define pb push_back #define x first #define y second #define int long long #define endl \n const LL maxn 4e057; const LL N 5e0510; const LL mod 1e097; const int inf 0x3f3f; const LL llinf 5e18;typedef pair…

java_基础_关键字

1.关键字的字母全部都是小写. 2.常用的代码编辑器(Notepad),针对关键字有特殊的颜色标记,非常的直观.

CleanMyMac X好不好用?有哪些优势

CleanMyMac X2024正是这一愿景和使命的体现。 作为一个团队,我们致力于采用令人过目不忘的设计来打造我们引以为豪的产品。 这是 UX/UI 设计已经成为我们核心价值的原因之一。 这也是我们不断完善它,从而为我们的用户创造最神奇体验的动力。 CleanMyMac …

基于springboot实现智慧党建系统项目【项目源码】

基于springboot实现智慧党建系统演示 Java技术 Java是由Sun公司推出的一门跨平台的面向对象的程序设计语言。因为Java 技术具有卓越的通用性、高效性、健壮的安全性和平台移植性的特点,而且Java是开源的,拥有全世界最大的开发者专业社群,所以…

Drools Rule Language 学习笔记

Drools Rule Language 1 Packages in DRL 可以有多个packages但推荐只用一个packageexample: package org.mortgages; 2 Import statements in DRL 2.1 You specify the package and data object in the format packageName.objectName, with multiple imports …

野火霸天虎 STM32F407 学习笔记(六)系统时钟详解

STM32 中级 前言 仍然是学习自野火F407网课。 启动文件详解 作用: 初始化堆栈指针 SP_initial_sp初始化 PC 指针 Reset_Handler初始化中断向量表配置系统时钟调用 C 库函数 _main 初始化用户堆栈,从而最终调用 main 函数去到 C 的世界 栈&#xff…

外观设计模式

package com.jmj.pattern.facade;public class Light {public void on(){System.out.println("打开电灯...");}public void off(){System.out.println("关闭电灯...");} }package com.jmj.pattern.facade;public class AirCondition {public void on(){S…

STM32入门学习(一):STM32 简介与软件安装

参考引用 STM32 入门教程-江科协 1. STM32 简介 1.1 STM32 套件介绍 1.2 STM32 简介 STM32 是 ST 公司基于 ARM Cortex-M 内核开发的 32 位微控制器 应用:嵌入式领域,如智能车、无人机、机器人、无线通信、物联网、工业控制、娱乐电子产品等 1.3 ARM …

国内20个大模型中文场景测评及体验

中文场景能力测评 SuperCLUE排行榜 大模型及网站 公司(大模型) 智能程度 借鉴点 体验网站 备注 1 百度文心一言 高   文心一言   2 百川智能 高   百川大模型-汇聚世界知识 创作妙笔生花-百川智能   3 商汤商量SenseChat&#xff…

徕芬不是满分:自称超越戴森,用户称多次故障,品控仍是老大难?

撰稿|行星 来源|贝多财经 “双十一”购物节落下帷幕后,各大品牌纷纷公布“战报”。其中,高速吹风机品牌徕芬(也称“徕芬科技”)销售额超4.4亿元,全系产品销量超过80万台,高速吹风机系列单品(LF03、SE)销售…

基于springboot实现实习管理系统的设计与实现项目【项目源码+论文说明】

基于sprinmgboot实现实习管理系统的设计与实现演示 摘要 随着信息化时代的到来,管理系统都趋向于智能化、系统化,实习管理也不例外,但目前国内仍都使用人工管理,市场规模越来越大,同时信息量也越来越庞大,…

智能联系人管理Python代码

在PyCharm中运行《智能联系人管理》即可进入如图1所示的系统主界面。 图1 系统主界面 具体的操作步骤如下: (1)添加联系人。在主界面中,单击“添加”按钮,将打开添加联系人窗口,在该窗口中,单…

时间序列预测 — Informer实现多变量负荷预测(PyTorch)

目录 1 实验数据集 2 如何运行自己的数据集 3 报错分析 1 实验数据集 实验数据集采用数据集4:2016年电工数学建模竞赛负荷预测数据集(下载链接),数据集包含日期、最高温度℃ 、最低温度℃、平均温度℃ 、相对湿度(平均) 、降雨…

学习笔记:如何分析财务报表

其实财务报表分析最核心的东西,是通过财务报表这个结果,由果推因,找出造成这个结果的原因。 会计是商业的语言 首先第一个问题是——会计是商业的语言,这是会计的根本。 什么叫“语言”,就是可以通过它进行交流。比如…

抖音视频怎么提取动图?手机视频转gif方法

抖音是人们休闲娱乐消遣时光必备的短视频软件,当我们想要把好玩有趣的抖音短视频转换成gif动画时,要怎么操作呢?通过使用gif动图制作(https://www.gif.cn/)网站-GIF中文网,手机自带浏览器,上传视…

手把手教你对禅道接口发起请求-基础版

本章一起来学习如何对禅道的接口发起请求。 🔴注:本章接口需要自己搭建本地禅道,部署之简单,百度一看就会。如下是官网地址,下载开源版本即可: https://www.zentao.net/ 接口文档 https://www.zentao.net/b…