函数调用
不知道有没有人想过一个问题:A函数调用B函数,B函数是如何知道在调用结束后回到A函数中的?
比如下面的代码,main函数调用foo。当foo执行完毕,需要执行main函数的return 0语句。但是main和foo是割裂的,foo是怎么回到main函数中继续执行的呢?
void foo() {
int a = 10;
a = a + 5;
}
int main() {
foo();
return 0;
}
我们对上述代码进行反汇编。
在main函数中,我们没有看到任何蛛丝马迹,只看到call指令。
上图显示,当前代码执行到+8处(但是此行并没有执行,它的上一行执行了)。我们需要注意它的地址以及其后的地址0x0000555555555364,即+18处。理论上说,foo函数执行完毕后,CPU会执行+18处的代码。我们将通过调试来查看具体的原因。
让程序运行到+13处,可以看到当前rsp和rbp值相同,都是0x7fffffffdf10。
进入foo函数内部,可以看到call指令导致rsp减少了4字节,即有一个4字节值被call指令push到栈中。
通过下面指令,我们看到被push进来的值是0x0000555555555364。
我们反汇编这个地址附近代码,可以发现call指令将当前函数返回到的代码地址给push到栈中。这样foo函数在执行完毕后,就可以在栈中取出该地址,从而跳转到此处继续执行,完成从foo函数到main函数的跳跃。
栈平衡
栈平衡是指函数调用子函数后,栈顶要回到没有准备调用子函数之前。
在函数调用前后,涉及压栈操作的有如下情况:
- call指令会将本函数中下条要执行的指令地址push到栈中
- 如果子函数超过6个参数,则从第7个参数开始的参数会通过栈来传递
以下面的代码为例,
void foo10(int a, int b, int c, int d, int e, int f, int g, int h, int i, int j) {
a = a + 5;
b = b + 5;
c = c + 5;
d = d + 5;
e = e + 5;
f = f + 5;
g = g + 5;
h = h + 5;
i = i + 5;
j = j + 5;
int sum = a + b + c + d + e + f + g + h + i + j;
sum = sum + 5;
}
int main() {
int a = 10;
int b = 20;
int c = 30;
int d = 40;
int e = 50;
int f = 60;
int g = 70;
int h = 80;
int i = 90;
int j = 100;
foo10(a, b, c, d, e, f, g, h, i, j);
return 0;
}
其中main函数的反汇编结果如下
我们来通过动态调试,来查看上述代码如何做到栈平衡。
我们让代码执行到+105处,查看此时rsp寄存器和栈上数据
然后让其他参数入栈,可以看到栈增加了0x20。(即rsp的值减少了0x20,0x7fffffffdef0->0x7fffffffded0)
进入foo10函数后,call导致的Next RIP压栈会在其ret时弹出。于是foo10执行完毕回到main函数后,rsp的值还不处于栈平衡状态。
但是紧接着foo10函数的调用,main函数会通过下面的命令让栈获得平衡
总体来说,栈的失衡是函数调用导致的,且发生在调用者函数中;栈的再平衡则是在子函数退出,执行回到调用者函数时立即执行的。