1. 符号的数据结构
typedef struct elf64_sym {
Elf64_Word st_name; /* 该符号的名字在字符串表中的起始下标 */
unsigned char st_info; /* 该符号的类型以及作用域信息 */
unsigned char st_other; /* 暂未使用 */
Elf64_Half st_shndx; /* 该符号所在的 section 的下标,如 .data 节为 2 */
Elf64_Addr st_value; /* 该符号的值在该 section 中的偏移 */
Elf64_Xword st_size; /* 该符号的大小 */
} Elf64_Sym;
上一篇文章分析节头表中分析到,节头表包含一个名字为 .symbol 的条目,该条目的 sh_entsize 成员不为 0,表明该条目指向的节中的内容是一张表,该表中的每一个条目的大小为 sh_entsize 个字节,通过 sh_size 成员可知道该节的总占用大小,因此就能够得出该节中一共有多少个条目:sh_size / sh_entsize 。符号表所在的二进制格式就不再展示了,本篇文章主要讲解符号表的意义
2. Symbol 节的意义
-
符号的数据结构描述了一个符号的所有信息
- st_name 该符号的名字所在字符串表的下标
- st_info 该字段实际上由前 4 bit 与 后 4bit 共同组成,后面讲解该字段
- st_other 暂未使用,可能未来会用
- st_shndx 该符号对应节的下标,如 .data 节的下标为 2
- st_value 对于可重定位目标文件,该字段表示该符号的值在 st_shndx 这个下标的 section 中的偏移
- st_size 该符号所占用内存字节数
-
由 st_name 就能够找到该符号的名字,通过 st_info 能够直到该符号的类型以及作用域,通过 st_shndx 能够找到该符号所在的节,通过 st_value 能够找到该符号在该节区中对应的机器码 ,根据 st_size 能够确定该符号在该节区中对应的机器码的大小
-
重点分析 st_info 字段,该字段定义如下
#define ELF_ST_BIND(x) ((x) >> 4) #define ELF_ST_TYPE(x) (((unsigned int) x) & 0xf) /* bind */ #define STB_LOCAL 0 #define STB_GLOBAL 1 #define STB_WEAK 2 /* type */ #define STT_NOTYPE 0 #define STT_OBJECT 1 #define STT_FUNC 2 #define STT_SECTION 3 #define STT_FILE 4 #define STT_COMMON 5 #define STT_TLS 6
-
上述代码可以看出,st_info 的后 4 bit 表示该符号的 bind 信息,前 4 bit 表示该符号的 type 信息,由这两个信息组合成一个字段,表示该符号的类型以及该符号的作用域(不太准确)
-
对于 static 类型的成员,其 bind 信息必然是 STB_LOCAL,函数的 type 是 STT_FUNC,变量的 type 是 STT_OBJECT
-
对于本文件引用的外部符号,该符号通常是 GLOBAL 与 STT_NOTYPE,并且该符号所处于的节区的下标为特殊的 SHN_UNDEF,表明该符号是一个外部符号
-
通过 symbol 节,能够描述可重定位文件中所有符号的信息,包括该符号的作用域、强还是弱符号,以及该符号是否是外部符号
-
链接器通过该表,能够将多个可重定位文件链接成为一个可执行文件,当多个文件中定义了相同的符号时,链接器需要根据此表来做判断选择哪一个或者直接报错。
-
为了让链接器能够修改引用外部符号的位置处的机器码,还需要一个重定位表,该表必然记录了需要修改的机器码在该文件中的位置(offset)以及被引用符号所在符号表的 index,有了需要被修改的位置,有了被引用符号所在该文件符号表的 index,就能够找到被引用符号的 symbol 信息,进而扫描全局符号表,看有没有与这个 symbol 信息相匹配的
3. 可重定位表
-
经上述分析,对于一个文件引用一个外部符号时,汇编器会生成一个可重定位表,该表告诉链接器:本文件的这个位置需要被修改成正确定的值,并且该位置引用该符号的信息在符号表中的下表为 index
-
有了这些信息,链接器就能够扫描全局符号表,看看其他文件到底有没有定义该符号,有的话,就修改这个位置并填入合适的值(与寻址方式有关,绝对寻址填符号的绝对地址,相对寻址填 该符号绝对地址 - 下一条指令的地址),没有找到,就报错呗