函数栈帧的创建和销毁
- 1.前言
- 2.预备知识
- 2.1什么是栈帧
- 2.2什么是栈
- 2.2常见的寄存器
- 2.3常见的汇编指令
- 3.函数栈帧创建和销毁的过程
- 3.1为main函数创建栈空间
- 3.2main函数中创建变量
- 3.3给Add函数传参
- 3.4调用Add函数
- 3.5为Add函数创建栈空间
- 3.6计算
- 3.7把计算好的值返回
1.前言
- 本章节我们将系统性的理解前面我们调用函数时的一些疑问:
- 局部变量是怎么创建的?
- 为什么局部变量的值是随机值?
- 函数是怎么传参的?传参的顺序是怎么样的?
- 形参和实参是什么关系?
- 函数调用是怎么做到?
- 函数调用结束怎么返回的?
- 首先说明以下,编译器越高级越不容易看到函数的创建和销毁的过程函数栈帧的创建和销毁的过程在不同的编译器他的创建和销毁是略有差异的,但是大体逻辑上的一样的具体细节取决于编译器的。
当前使用的环境是(vs 2022 Debug Win32)版本下的编译器。
2.预备知识
2.1什么是栈帧
- 从逻辑上讲,栈帧就是一个函数执行的环境:函数参数、函数的
局部变量
、函数执行完后返回到哪里等等。
实现上有硬件方式和软件方式(有些体系不支持硬件栈) - 首先应该明白,栈是从
高地址向低地址延伸的
。每个函数的每次调用,都有它自己独立的一个栈帧,这个栈帧中维持着所需要的各种信息。寄存器ebp指向当前的栈帧的底部(高地址),寄存器esp指向当前的栈帧的顶部(低地址)。 - 注意:EBP指向当前位于系统栈最上边一个栈帧的底部,而不是系统栈的底部。严格说来,“栈帧底部”和“栈底”是不同的概念;ESP所指的栈帧顶部和系统栈的顶部是同一个位置。
2.2什么是栈
-
栈(stack)又名堆栈,它是一种运算受限的
线性表
。限定仅在表尾进行插入和删除操作的线性表
。这一端被称为栈顶,相对地,把另一端称为栈底。向一个栈插入新元素又称作进栈、入栈或压栈,
它是把新元素放到栈顶元素的上面,使之成为新的栈顶元素;从一个栈删除元素又称作出栈或退栈
,它是把栈顶元素删除掉,使其相邻的元素成为新的栈顶元素。 -
总结一点就是,栈:是一种受限制的线性表,他的特点就是,先进的后出,后进的先出,就好比我们生活中把书放进盒子里,最先放进去的如果想要拿出来就必须先把上面的书全部拿走,才能拿到最下面的书。
2.2常见的寄存器
寄存器名称 | 功能 |
---|---|
eax | 累加寄存器,相对于其他寄存器,在运算方面比较常用。 |
ebx | 基地址寄存器,在内存寻址时存放基地址。 |
ecx | 计数寄存器,用于循环操作,比如重复的字符存储操作,或者数字统计。 |
edx | 作为EAX的溢出寄存器,总是被用来放整数除法产生的余数。 |
esi | 源变址寄存器,主要用于存放存储单元在段内的偏移量。通常在内存操作指令中作为“源地址指针”使用。 |
edi | 目的变址寄存器,主要用于存放存储单元在段内的偏移量。 |
eip | 控制寄存器,存储CPU下次所执行的指令地址(存放指令偏移地址)。 |
esp | 栈顶指针,堆栈的顶部是地址小的区域,压入堆栈的数据越多,esp也就越来越小。在32位平台上,esp每次减少4字节。栈指针寄存器(extended stack pointer),其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的栈顶。是CPU机制决定的,push、pop指令会自动调整esp的值。 |
ebp | 基址指针,指栈的栈底指针。基址指针寄存器(extended base pointer),一般与esp配合使用,可以存取某时刻的esp,这个时刻就是进入一个函数内后,CPU会将esp的值赋给ebp,此时就可以通过ebp对栈进行操作,比如获取函数参数,局部变量等。其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的底部。 |
2.3常见的汇编指令
-
push指令
:它首先减少esp的值,再将源操作数复制到栈地址,在32位平台上,esp每次减少4字节。 -
pop指令
:它首先把esp指向的栈元素内容复制到一个操作数中,再增加esp的值。在32位平台上,esp每次增加4字节。 -
mov指令
:用于将一个数据从源地址传送到目标地址,源操作地址的内容不变。 -
sub指令
:减操作指令,从寄存器中减去<shifter_operand>表示的数值,并将结果保存到目标寄存器中。 -
lea指令
:是“load effective address”的缩写,简单的说,lea指令可以用来将一个内存地址直接赋给目的操作数。 -
rep指令
:重复前缀指令,英文缩写 repeat。能够引发其后字符串指令被重复。 -
stos指令
:串存储指令,英文缩写 store string。 -
call指令
:将程序下一条指令的位置的IP压入堆栈中,并转移到调用的子程序。 -
jmp指令
:无条件跳转指令。 -
add指令
:用于将两个运算子相加,并将结果写入第一个运算子。 -
ret指令
:用于终止当前函数的执行,将运行权交还给上层函数。也就是,当前函数的帧将被回收。
3.函数栈帧创建和销毁的过程
首先我们先写一个比较简单的但是步骤比较详细的函数,来分析他的创建和销毁过程。
#include <stdio.h>
int Add(int x, int y)
{
int z = 0;
z = x + y;
return z;
}
int main()
{
int a = 10;
int b = 20;
int c = 0;
c = Add(a, b);
printf("%d", c);
return 0;
}
而我们每调用一个函数的时候,都会在栈空间中开辟一块空间。
而esp和ebp是用来维护函数栈帧的,我当前调用那个函数,他们就维护哪一块栈帧。
- 我们先分析以下main函数:
我们按F10调试,选择调用堆栈:
于是我们就可以看到我们程序中所有调用的函数:
在这里我们可以看到的是,我们的main函数其实也是被别的函数调用的。
注:这里我们点击调用堆栈的窗口,右击鼠标,打开显示外部代码,不然会看不到函数之间的调用。
由于当前的版本是2022版本的,所以有些细节是很难看到的,只能看到大概的。
我们就可以总结以下。
我们的main函数是被__scrt_common_main_seh函数调用的。
而__scrt_common_main_seh又被__scrt_common_main所调用。
他们的关系就像是套外一样,一个套一个的样子。
3.1为main函数创建栈空间
我们上面知道了,main函数其实也是被别的函数所调用的,所以我们在执行的main函数之前还有一些步骤,也就是为main函数准备过程。
首先我们要调用main函数,首先要调用__scrt_common_main_seh,而要调用__scrt_common_main_seh就要先调用__scrt_common_main函数,所以我一开始esp和ebp为维护的栈空间是__scrt_common_main函数的。
我们首先一下F10之后按打开调用堆栈的步骤打开反汇编。
我们就可以看到我们代码的汇编代码了。
这里我们为了方便观察到我们代码在内存中的地址的变化,右击鼠标,把显示符号名关闭,这个时候我们看到的就是地址之间的变化了。
首先是
注:我们的push这个压栈的过程有个动作,就是push后esp的值会变,就是说,我push后esp指向的push这个值地址了。
3.2main函数中创建变量
这里就可以解释一下,为什么我们一直都强调我们第一变量的时候一定初始化,如果不初始化的话,我们内存里面放到就是CCCCCCCC这个样的数,这也是为什么我们有时候没有初始化变量,显示屏上会出现烫烫烫烫这个样的字。
3.3给Add函数传参
3.4调用Add函数
而存放call指令的下一条指令的地址的目的就是,当我们Add调用完后,返回时可以通过这个地址找到,并返回。
3.5为Add函数创建栈空间
3.6计算
所以我们可以发现,我们的形参根本就不是在Add函数中创建的,而是在Add函数开辟好空间之前就已经把参数传过去了,而且先传过去的是b,也就是说我们传参是从右往左传参的。当创建好Add函数并实现功能的时候,这两个数相加的时候,找参数是回去找我们刚刚调用的时候push压进去的这块空间
这个时候,上图x和y分别是:
3.7把计算好的值返回
紧接着就是返回计算好的值,但是我们返回z,z不是会被销毁吗,所以这个时候我们就可以利用寄存器的全局性,所以有这个样一个操作:把[ebp-8]的值放到eax寄存器中。
上面就式把,Add函数的栈帧空间销毁了。
最后还有一步就是main函数栈空间的销毁了,其实和Add函数栈空间销毁是一样的。
这个就想到做式思考题把,小伙伴们可以自己尝试一下。
现在我们就来总结我们一开始提出的问题:
- 局部变量是怎么创建的?
局部变量的创建首先我们为这个函数创建好栈帧空间
,我们在这个栈帧中我们初始化好一部分空间之后
,然后给我们给局部变量分配空间
- 为什么局部变量的值是随机值
之所以会出现随机值,是因为我们在为函数创建栈空间的时候
,我们随机放进去的,所以
不初始化的话拿到的就是随机值。 - 函数是怎么传参的?传参的顺序是怎么样的?
当我们要调用某个函数的时候,其实在没调用这个函数的时候我们已经push把参数从右向左开始压栈压进去了
,当我们真正进入形参函数的时候,通过指针的偏移量找到形参。
- 形参和实参是什么关系?
形参确实是在压栈的时候开辟的空间,他和实参只是值上是相同的,但是空间是独立的
,所以形参是实参的一份临时拷贝
,改变形参不会影响实参。 - 函数调用是怎么做到?
通过一个call汇编指令,调用函数,同时记住call指令下一条指令的地址
,为了我们函数返回的时候,可以通过这个地址,跳转回call指令下一个指令
。 - 函数调用结束怎么返回的?
我们在调用之前就把调用这个函数的上一个函数的ebp(栈底指针)push压到栈中了
,当我们函数调用完后要返回的时候弹出ebp就能找到上一个函数调用的ebp,而当esp顶指针往下走到时候,就会找到我们之前记住call指令的下一条指令的地址,然后跳转到call指令下一条指令。
而他的返回值则是通过eax寄存器存起来,然后往回带。