一:objdump介绍
在 Linux中,一切皆文件。 Linux 编程实际上是编写处理各种文件的代码。系统由许多类型的文件组成,但目标文件具有一种特殊的设计,提供了灵活和多样的用途。
目标文件是包含带有附加地址和值的助记符号的路线图。这些符号可以用来对各种代码段和数据段进行命名,包括经过初始化的和未初始化的。它们也可以用来定位嵌入的调试信息,就像语义 Web,非常适合由程序进行阅读。
objdump命令是Linux下的反汇编目标文件或者可执行文件的命令,它以一种可阅读的格式让你更多地了解二进制文件可能带有的附加信息。
另外需要讲一下符号表,后面会用到。我们平时无论是在Linux上还是windows上用到的可执行程序。可执行程序的生成并不是一蹴而就而是代码经过预处理,编译,汇编和链接而成。编译只是将我们自己写的代码变成了二进制形式,它还需要和系统组件(比如标准库、动态链接库等)结合起来,这些组件都是程序运行所必须的。链接(Link)其实就是一个“打包”的过程,它将所有二进制形式的目标文件和系统组件组合成一个可执行文件。完成链接的过程也需要一个特殊的软件,叫做链接器(Linker)。经过编译链接后,代码中的各种符号都被分配了地址,并将各种信息记录在符号表中。
符号表用来体现作用域与可见性信息,符号表中语言符号可分为关键字符号,操作符符号及标识符符号。
符号表的作用:
- 收集符号属性;(词法分析)
- 上下文语义的合法性检查的依据;(语法分析)
- 作为目标代码生成阶段地址分配的依据;(语义分析)
符号表中的标识符一般设置的属性项目有:
- 符号名
- 符号的类型
- 符号的存储类别
- 符号的作用域及可视性
- 符号变量的存储分配信息
- 符号的其它属性
二:objdump参数
选项 | 详细选项 | 描述 |
-a | --archive-headers | 显示档案库的成员信息,类似 ls -l 将 lib*.a 的信息列出。 |
-b bfdname | --target=bfdname | 指定目标码格式。这不是必须的,objdump 能自动识别许多格式,比如: objdump -b oasys -m vax -h fu.o 显示 fu.o 的头部摘要信息,明确指出该文件是 Vax 系统下用 Oasys 编译器生成的目标文件。objdump -i 将给出这里可以指定的目标码格式列表。 |
-C | --demangle | 将底层的符号名解码成用户级名字,除了去掉所开头的下划线之外,还使得C++函数名以可理解的方式显示出来。 |
-g | --debugging | 显示调试信息。企图解析保存在文件中的调试信息并以 C 语言的语法显示出来。仅仅支持某些类型的调试信息。有些其他的格式被 readelf -w 支持。 |
-e | --debugging-tags | 类似 -g 选项,但是生成的信息是和 ctags 工具相兼容的格式。 |
-d | --disassemble | 从 objfile 中反汇编那些特定指令机器码的 section。 |
-D | --disassemble-all | 与 -d 类似,但反汇编所有 section. |
--prefix-addresses | 反汇编的时候,显示每一行的完整地址。这是一种比较老的反汇编格式。 | |
-EB | ||
-EL | --endian={big|little} | 指定目标文件的小端。这个项将影响反汇编出来的指令。在反汇编的文件没描述小端信息的时候用。例如 S-records. |
-f | --file-headers | 显示 objfile 中每个文件的整体头部摘要信息。 |
-h | --section-headers --headers | 显示目标文件各个section的头部摘要信息。 |
-H | --help | 简短的帮助信息。 |
-i | --info | 显示对于 -b 或者 -m 选项可用的架构和目标格式列表。 |
-j name | --section=name | 仅仅显示指定名称为 name 的 section 的信息 |
-l | --line-numbers | 用文件名和行号标注相应的目标代码,仅仅和 -d、-D 或者 -r 一起使用使用 -ld 和使用 -d 的区别不是很大,在源码级调试的时候有用,要求编译时使用了 -g 之类的调试编译选项。 |
-m machine | --architecture=machine | 指定反汇编目标文件时使用的架构,当待反汇编文件本身没描述架构信息的时候(比如 S-records),这个选项很有用。可以用 -i 选项列出这里能够指定的架构. |
-r | --reloc | 显示文件的重定位入口。如果和 -d 或者 -D 一起使用,重定位部分以反汇编后的格式显示出来。 |
-R | --dynamic-reloc | 显示文件的动态重定位入口,仅仅对于动态目标文件意义,比如某些共享库。 |
-s | --full-contents | 显示指定 section 的完整内容。默认所有的非空 section 都会被显示。 |
-S | --source | 尽可能反汇编出源代码,尤其当编译的时候指定了 -g 这种调试参数时,效果比较明显。隐含了 -d 参数。 |
--show-raw-insn | 反汇编的时候,显示每条汇编指令对应的机器码,如不指定 --prefix-addresses,这将是缺省选项。 | |
--no-show-raw-insn | 反汇编时,不显示汇编指令的机器码,如不指定 --prefix-addresses,这将是缺省选项。 | |
--start-address=address | 从指定地址开始显示数据,该选项影响 -d、-r 和 -s 选项的输出。 | |
--stop-address=address | 显示数据直到指定地址为止,该项影响 -d、-r 和 -s 选项的输出。 | |
-t | --syms | 显示文件的符号表入口。类似于 nm -s 提供的信息 |
-T | --dynamic-syms | 显示文件的动态符号表入口,仅仅对动态目标文件意义,比如某些共享库。它显示的信息类似于 nm -D | --dynamic 显示的信息。 |
-V | --version | 版本信息 |
--all-headers | -x | 显示所可用的头信息,包括符号表、重定位入口。-x 等价于 -a -f -h -r -t 同时指定。 |
-z | --disassemble-zeroes | 一般反汇编输出将省略大块的零,该选项使得这些零块也被反汇编。 |
@file | 可以将选项集中到一个文件中,然后使用这个 @file 选项载入 |
三:实践
1. 查看C程序的汇编代码和源代码
创建一个test.c并生成可执行文件test
gcc -g test.c -o test
#include <stdio.h>
int add(int a, int b)
{
return a+b;
}
int sub(int a, int b)
{
return a-b;
}
int main()
{
int a = 88;
int b = 66;
int sum = add(a, b);
printf("a=%d, b=%d, a+b=%d\n", a, b, sum);
int dif = sub(a, b);
printf("a=%d, b=%d, a-b=%d\n", a, b, dif);
}
objdump -D test | less
objdump -S test | less
objdump -D命令来查看test的汇编代码。
objdump -S命令来以汇编和源代码的形式查看test的代码。
2. 查看可执行文件中函数调用的地址
可以使用以下命令来查看可执行文件中的函数调用地址:
objdump -d -j .plt test
3. 查看共享库中函数的地址
可以使用以下命令来查看共享库中函数的地址:
objdump -T /lib/libc.so.6
上述命令将显示共享库libc.so.6中所有函数的地址。
4. 查看可执行文件中的符号表
可以使用以下命令来查看可执行文件中的符号表:
objdump -t test
可以在符号表中找到sub,add的地址
[root@localhost testEg]# objdump -t test
test: file format elf64-x86-64
SYMBOL TABLE:
0000000000400238 l d .interp 0000000000000000 .interp
0000000000400254 l d .note.ABI-tag 0000000000000000 .note.ABI-tag
0000000000400274 l d .note.gnu.build-id 0000000000000000 .note.gnu.build-id
0000000000400298 l d .gnu.hash 0000000000000000 .gnu.hash
00000000004002b8 l d .dynsym 0000000000000000 .dynsym
0000000000400318 l d .dynstr 0000000000000000 .dynstr
0000000000400358 l d .gnu.version 0000000000000000 .gnu.version
0000000000400360 l d .gnu.version_r 0000000000000000 .gnu.version_r
0000000000400380 l d .rela.dyn 0000000000000000 .rela.dyn
0000000000400398 l d .rela.plt 0000000000000000 .rela.plt
00000000004003c8 l d .init 0000000000000000 .init
00000000004003f0 l d .plt 0000000000000000 .plt
0000000000400420 l d .plt.got 0000000000000000 .plt.got
0000000000400430 l d .text 0000000000000000 .text
0000000000400634 l d .fini 0000000000000000 .fini
0000000000400640 l d .rodata 0000000000000000 .rodata
0000000000400678 l d .eh_frame_hdr 0000000000000000 .eh_frame_hdr
00000000004006c0 l d .eh_frame 0000000000000000 .eh_frame
0000000000600e10 l d .init_array 0000000000000000 .init_array
0000000000600e18 l d .fini_array 0000000000000000 .fini_array
0000000000600e20 l d .jcr 0000000000000000 .jcr
0000000000600e28 l d .dynamic 0000000000000000 .dynamic
0000000000600ff8 l d .got 0000000000000000 .got
0000000000601000 l d .got.plt 0000000000000000 .got.plt
0000000000601028 l d .data 0000000000000000 .data
000000000060102c l d .bss 0000000000000000 .bss
0000000000000000 l d .comment 0000000000000000 .comment
0000000000000000 l df *ABS* 0000000000000000 crtstuff.c
0000000000600e20 l O .jcr 0000000000000000 __JCR_LIST__
0000000000400460 l F .text 0000000000000000 deregister_tm_clones
0000000000400490 l F .text 0000000000000000 register_tm_clones
00000000004004d0 l F .text 0000000000000000 __do_global_dtors_aux
000000000060102c l O .bss 0000000000000001 completed.6355
0000000000600e18 l O .fini_array 0000000000000000 __do_global_dtors_aux_fini_array_entry
00000000004004f0 l F .text 0000000000000000 frame_dummy
0000000000600e10 l O .init_array 0000000000000000 __frame_dummy_init_array_entry
0000000000000000 l df *ABS* 0000000000000000 test.c
0000000000000000 l df *ABS* 0000000000000000 crtstuff.c
00000000004007f0 l O .eh_frame 0000000000000000 __FRAME_END__
0000000000600e20 l O .jcr 0000000000000000 __JCR_END__
0000000000000000 l df *ABS* 0000000000000000
0000000000600e18 l .init_array 0000000000000000 __init_array_end
0000000000600e28 l O .dynamic 0000000000000000 _DYNAMIC
0000000000600e10 l .init_array 0000000000000000 __init_array_start
0000000000400678 l .eh_frame_hdr 0000000000000000 __GNU_EH_FRAME_HDR
0000000000601000 l O .got.plt 0000000000000000 _GLOBAL_OFFSET_TABLE_
0000000000400630 g F .text 0000000000000002 __libc_csu_fini
0000000000601028 w .data 0000000000000000 data_start
000000000040051d g F .text 0000000000000014 add
000000000060102c g .data 0000000000000000 _edata
0000000000400634 g F .fini 0000000000000000 _fini
0000000000000000 F *UND* 0000000000000000 printf@@GLIBC_2.2.5
0000000000000000 F *UND* 0000000000000000 __libc_start_main@@GLIBC_2.2.5
0000000000601028 g .data 0000000000000000 __data_start
0000000000000000 w *UND* 0000000000000000 __gmon_start__
0000000000400648 g O .rodata 0000000000000000 .hidden __dso_handle
0000000000400640 g O .rodata 0000000000000004 _IO_stdin_used
00000000004005c0 g F .text 0000000000000065 __libc_csu_init
0000000000601030 g .bss 0000000000000000 _end
0000000000400430 g F .text 0000000000000000 _start
000000000060102c g .bss 0000000000000000 __bss_start
0000000000400547 g F .text 0000000000000070 main
0000000000601030 g O .data 0000000000000000 .hidden __TMC_END__
0000000000400531 g F .text 0000000000000016 sub
00000000004003c8 g F .init 0000000000000000 _init
5. 查看.o文件的信息
objdump -h test.o
紧接着可以用nm查看函数和全局变量,静态变量
[root@localhost testEg]# nm test.o
0000000000000000 T add
000000000000002a T main
U printf
0000000000000014 T sub
局部变量不会生成符号,最终是分配在栈内存中,不会在函数外部被引用