从汇编看函数调用

news2026/2/14 1:30:00

文章目录

- 函数调用流程
- 栈相关寄存器及的作用简介
- - 寄存器功能
  - 指令功能
- 函数的括号{}
- - 正括号
  - 反括号
- 栈
- - 函数调用
  - 函数内部处理
- 参数传递
- - - 传值，变量不可改
    - 传指针，变量可改
    - C++ 传引用

函数调用流程

目标：函数调用前后栈保持不变
在这里插入图片描述

保存main函数的寄存器上下文
移动栈指针，到新栈
调用新函数：新函数会开辟内存然后操作
恢复栈指针

栈相关寄存器及的作用简介

寄存器功能

在这里插入图片描述 ESP/RSP：堆栈指针寄存器，指向栈顶。栈顶指针
EBP/RBP：栈底指针，指向栈的底部，通常用ebp+偏移量的形式来定位函数存放在栈中的局部变量

rax：通常用于存储函数调用返回值
rdi：第一个入参
rsi：第二个入参
rdx：第三个入参
rcx：第四个入参
r8：第五个入参
r9：第六个入参

寄存器ebp作为当前函数的“栈帧”基地址，配合一定的偏移，就可以读、写函数体的临时变量。如果一个变量是通过ebp寄存器间接访问的，那么它往往是临时变量，也叫“栈”变量。

指令功能

在这里插入图片描述

push rbp 保存上下文，保存rbp值
1.rbp里面的值放到当前rsp指向的位置，保存当前栈底指针的值
2. 然后rsp–，栈顶指针向上移动

pop eax 恢复栈帧
1. 栈顶指针向下移动，这里的值保存的是原函数的栈底位置
2. ebp指向esp里面值的位置，移动栈底指针到原函数位置

在这里插入图片描述
call
1. 会把call指令的下一条指令压入栈，把下一条指令的地址，也就是函数func的返回地址(0x401105e)压入堆栈
2.CPU跳转到函数func的首地址。

函数的括号{}

正负括号都对应三条指令
在这里插入图片描述

正括号

先看正括号，三条指令，作用是保存原栈，并分配新的栈空间

push指令把CPU寄存器ebp的值压入“栈顶”，然后将“栈顶”红色水位线（CPU寄存器esp）上移，扩大栈空间。至此，main函数的“栈帧”保护工作完成！
然后通过mov指令，更新一下“栈帧”基准线，让ebp指向esp，这里就是新的func的栈了
然后是sub指令为临时变量a和b开辟空间

在这里插入图片描述

反括号

然后看反括号三条指令：反括号作用是恢复栈

通过mov指令，把红色水位线（寄存器esp）先降低到蓝色基准线（寄存器ebp）的位置，释放调用函数func栈
pop, 把事先压入“栈顶”的ebp值返还给CPU寄存器ebp。这样蓝色基准线就恢复到了最开始的位置。然后esp红色水位线也随之下降。esp和ebp的值就都恢复了。
ret指令，把“栈顶”处的返回值传给CPU寄存器rip，这样，CPU就可以跳转到主调函数main被打断的地方0x401105e继续执行了。同时，随着“栈顶”的下降，红色水位线也随之下降。这样，红、蓝两条线都恢复到了最开始的位置

在这里插入图片描述

栈

栈是存储临时数据的区域，在普通内存中，它的特点是通过push指令和pop指令进行数据的存储和读出。往栈中存储数据称为“入栈”，从栈中读出数据称为“出栈”。32位x86系列的CPU中，进行1次push或pop，即可处理32位（4字节）的数据。push指令和pop指令中只有一个操作数。该操作数表示的是“push的是什么及pop的是什么”，而不需要指定“对哪一个地址编号的内存进行push或pop”。
这是因为，对栈进行读写的内存地址是由esp寄存器（栈指针）进行管理的。push指令和pop指令运行后，esp寄存器的值会自动进行更新（push指令是-4, pop命令是+4），因而程序员就没有必要指定内存地址了。

栈是由大地址向小地址递减，而堆和普通内存是小地址到大地址递增

操作系统会为每个任务（进程或线程）分配一段内存当作任务“堆栈”；CPU则提供两个寄存器esp、ebp，用来标识当前函数对“堆栈”的使用情况。随着函数的逐层调用，函数的“栈帧”会逐次堆叠，互不重合；随着函数的逐层返回，函数的“栈帧”会被就地放弃，但不会清理内存

函数调用

    //返回两个参数值之和的函数
    int AddNum(int a, int b)	
    {
        return a + b;
    }
    //调用AddNum函数的函数
    void MyFunc()
    {
        int c;
        c =AddNum(123, 456);
    }

c =AddNum(123, 456);
在这里插入图片描述 1. （1）、（2）、（7）、（8）的处理适用于C语言中所有的函数，我们会在后面展示AddNum函数处理内容时进行说明
2.（3）和（4）表示的是将传递给AddNum函数的参数通过push入栈。在C语言的源代码中，虽然记述为函数AddNum（123,456），但入栈时则会按照456、123这样的顺序，也就是位于后面的数值先入栈。这是C语言的规定。
3. （5）的call指令，把程序流程跳转到了操作数中指定的AddNum函数所在的内存地址处。在汇编语言中，函数名表示的是函数所在的内存地址。这时就回去处理AddNum函数。
4. AddNum函数处理完毕后，程序流程必须要返回到编号（6）这一行。call指令运行后，call指令的下一行（（6）这一行）的内存地址（调用函数完毕后要返回的内存地址）会自动地push入栈。该值会在AddNum函数处理的最后通过ret指令pop出栈，然后程序流程就会返回到（6）这一行。

函数内部处理

在这里插入图片描述

（1）（2）和（5）（6）是每个函数都会使用的，我们来详细解释一下
ebp寄存器的值需要保存一下，所以在（1）中入栈，在（5）中出栈恢复到函数调用前的状态。这主要是为了把函数中用到的ebp寄存器的内容，恢复到函数调用前的状态。为此，我们就需要将其暂时保存在栈中，然后再在函数处理完毕之前出栈，使其返回到原来的状态。
（2)中把负责管理栈地址的esp寄存器的值赋值到了ebp寄存器中，不允许使用esp寄存器，这里就采用了不直接通过esp，而是用ebp寄存器来读写栈内容的方法。
（3）是取[ebp+8]指定栈中的地址中存储的第1个参数123，并将其读出到eax寄存器中。像这样，不使用pop指令，也可以查看栈的内容。而之所以从多个寄存器中选择了eax寄存器，是因为eax寄存器是负责运算的累加寄存器。
通过（4）的add指令，把当前eax寄存器的值同第2个参数相加后的结果存储在eax寄存器中。[ebp+12]是用来指定第2个参数456的。在C语言中，函数的返回值必须通过eax寄存器返回，这也是规定。不过，和ebp寄存器不同的是，eax寄存器的值不用还原到原始状态。至此，我们进行了很多细节的说明，其实就是希望大家了解“函数的参数是通过栈来传递，返回值是通过寄存器来返回的”这一点。
（6）中ret指令运行后，函数返回目的地的内存地址会自动出栈，据此，程序流程就会跳转返回到代码清单10-4的（6）（Call _AddNum的下一行）。