文章目录
- 函数调用流程
- 栈相关寄存器及的作用简介
- 寄存器功能
- 指令功能
- 函数的括号{}
- 正括号
- 反括号
- 栈
- 函数调用
- 函数内部处理
- 参数传递
- 传值,变量不可改
- 传指针,变量可改
- C++ 传引用
函数调用流程
目标:函数调用前后栈保持不变
- 保存main函数的寄存器上下文
- 移动栈指针,到新栈
- 调用新函数:新函数会开辟内存然后操作
- 恢复栈指针
栈相关寄存器及的作用简介
寄存器功能
ESP/RSP:堆栈指针寄存器,指向栈顶。栈顶指针
EBP/RBP:栈底指针,指向栈的底部,通常用ebp+偏移量的形式来定位函数存放在栈中的局部变量
rax:通常用于存储函数调用返回值
rdi:第一个入参
rsi:第二个入参
rdx:第三个入参
rcx:第四个入参
r8:第五个入参
r9:第六个入参
寄存器ebp作为当前函数的“栈帧”基地址,配合一定的偏移,就可以读、写函数体的临时变量。如果一个变量是通过ebp寄存器间接访问的,那么它往往是临时变量,也叫“栈”变量。
指令功能
push rbp 保存上下文,保存rbp值
1.rbp里面的值放到当前rsp指向的位置,保存当前栈底指针的值
2. 然后rsp–,栈顶指针向上移动
pop eax 恢复栈帧
1. 栈顶指针向下移动,这里的值保存的是原函数的栈底位置
2. ebp指向esp里面值的位置,移动栈底指针到原函数位置
call
1. 会把call指令的下一条指令压入栈,把下一条指令的地址,也就是函数func的返回地址(0x401105e)压入堆栈
2.CPU跳转到函数func的首地址。
函数的括号{}
正负括号都对应三条指令
正括号
先看正括号,三条指令,作用是保存原栈,并分配新的栈空间
- push指令把CPU寄存器ebp的值压入“栈顶”,然后将“栈顶”红色水位线(CPU寄存器esp)上移,扩大栈空间。至此,main函数的“栈帧”保护工作完成!
- 然后通过mov指令,更新一下“栈帧”基准线,让ebp指向esp,这里就是新的func的栈了
- 然后是sub指令为临时变量a和b开辟空间
反括号
然后看反括号三条指令:反括号作用是恢复栈
- 通过mov指令,把红色水位线(寄存器esp)先降低到蓝色基准线(寄存器ebp)的位置,释放调用函数func栈
- pop, 把事先压入“栈顶”的ebp值返还给CPU寄存器ebp。这样蓝色基准线就恢复到了最开始的位置。然后esp红色水位线也随之下降。esp和ebp的值就都恢复了。
- ret指令,把“栈顶”处的返回值传给CPU寄存器rip,这样,CPU就可以跳转到主调函数main被打断的地方0x401105e继续执行了。同时,随着“栈顶”的下降,红色水位线也随之下降。这样,红、蓝两条线都恢复到了最开始的位置
栈
栈是存储临时数据的区域,在普通内存中,它的特点是通过push指令和pop指令进行数据的存储和读出。往栈中存储数据称为“入栈”,从栈中读出数据称为“出栈”。32位x86系列的CPU中,进行1次push或pop,即可处理32位(4字节)的数据。push指令和pop指令中只有一个操作数。该操作数表示的是“push的是什么及pop的是什么”,而不需要指定“对哪一个地址编号的内存进行push或pop”。
这是因为,对栈进行读写的内存地址是由esp寄存器(栈指针)进行管理的。push指令和pop指令运行后,esp寄存器的值会自动进行更新(push指令是-4, pop命令是+4),因而程序员就没有必要指定内存地址了。
栈是由大地址向小地址递减,而堆和普通内存是小地址到大地址递增
操作系统会为每个任务(进程或线程)分配一段内存当作任务“堆栈”;CPU则提供两个寄存器esp、ebp,用来标识当前函数对“堆栈”的使用情况。随着函数的逐层调用,函数的“栈帧”会逐次堆叠,互不重合;随着函数的逐层返回,函数的“栈帧”会被就地放弃,但不会清理内存
函数调用
//返回两个参数值之和的函数
int AddNum(int a, int b)
{
return a + b;
}
//调用AddNum函数的函数
void MyFunc()
{
int c;
c =AddNum(123, 456);
}
c =AddNum(123, 456);
1. (1)、(2)、(7)、(8)的处理适用于C语言中所有的函数,我们会在后面展示AddNum函数处理内容时进行说明
2.(3)和(4)表示的是将传递给AddNum函数的参数通过push入栈。在C语言的源代码中,虽然记述为函数AddNum(123,456),但入栈时则会按照456、123这样的顺序,也就是位于后面的数值先入栈。这是C语言的规定。
3. (5)的call指令,把程序流程跳转到了操作数中指定的AddNum函数所在的内存地址处。在汇编语言中,函数名表示的是函数所在的内存地址。这时就回去处理AddNum函数。
4. AddNum函数处理完毕后,程序流程必须要返回到编号(6)这一行。call指令运行后,call指令的下一行((6)这一行)的内存地址(调用函数完毕后要返回的内存地址)会自动地push入栈。该值会在AddNum函数处理的最后通过ret指令pop出栈,然后程序流程就会返回到(6)这一行。
函数内部处理
- (1)(2)和(5)(6)是每个函数都会使用的,我们来详细解释一下
- ebp寄存器的值需要保存一下,所以在(1)中入栈,在(5)中出栈恢复到函数调用前的状态。这主要是为了把函数中用到的ebp寄存器的内容,恢复到函数调用前的状态。为此,我们就需要将其暂时保存在栈中,然后再在函数处理完毕之前出栈,使其返回到原来的状态。
- (2)中把负责管理栈地址的esp寄存器的值赋值到了ebp寄存器中,不允许使用esp寄存器,这里就采用了不直接通过esp,而是用ebp寄存器来读写栈内容的方法。
- (3)是取[ebp+8]指定栈中的地址中存储的第1个参数123,并将其读出到eax寄存器中。像这样,不使用pop指令,也可以查看栈的内容。而之所以从多个寄存器中选择了eax寄存器,是因为eax寄存器是负责运算的累加寄存器。
- 通过(4)的add指令,把当前eax寄存器的值同第2个参数相加后的结果存储在eax寄存器中。[ebp+12]是用来指定第2个参数456的。在C语言中,函数的返回值必须通过eax寄存器返回,这也是规定。不过,和ebp寄存器不同的是,eax寄存器的值不用还原到原始状态。至此,我们进行了很多细节的说明,其实就是希望大家了解“函数的参数是通过栈来传递,返回值是通过寄存器来返回的”这一点。
- (6)中ret指令运行后,函数返回目的地的内存地址会自动出栈,据此,程序流程就会跳转返回到代码清单10-4的(6)(Call _AddNum的下一行)。
参数传递
先看下传递参数的汇编:
- 传值调用和传指针其实都是将值传递到函数中,只不过这个值含义不同指针是一个地址的值。
- 还可以看出用作传参的寄存器是哪几个。
传值,变量不可改
我们接着看函数中,对参数赋值的汇编:
1. 这里会将参数寄存器中的值,放入栈中。然后释放参数寄存器。
2. 然后将内存地址数据赋值。
3. 这也就说明原来参数的值被复制了一份到内存中,修改当前形参的值,实际是修改栈中内存的值,原变量不会被修改
传指针,变量可改
- 首先还是将参数的值放入内存中,释放寄存器
- 然后将参数x的内存地址传给寄存器,寄存器当前存储的是该地址
- 然后向该寄存器中存储的地址中,写入0.
这也就直接修改了内存中原变量的值,这里的寄存器rax起到了一个中间过渡作用。
Q:为什么传递参数是通过CPU寄存器,而不是直接压入堆栈呢?
A:传递参数,也可以不通过CPU寄存器,而通过压入堆栈的方式,一些老版本的编译器,也是如此操作的。但通过寄存器传递,可以避免一些内存操作,一定程度上有利于提高函数的执行效率。
C++ 传引用
C++ 传引用和传指针的汇编相同,所以传引用只是一个语法糖