函数栈帧的创建及销毁(超详解)

news2024/12/24 2:36:00

目录

1.预备知识

1.1内存区的划分

1.2认识相关寄存器和汇编指令

1.2.1寄存器

1.2.2相关汇编指令 

2.测试前

2.1测试代码及环境 

2.2 main函数也是被其他函数调用的

3.函数栈帧的创建 

4.进入函数内部 

5.形参与实参 

 6.call/jump add函数

7.函数栈帧的销毁 

7.1保存返回值

7.2销毁add的函数栈帧

 7.3回收形参

 7.4返回值输入


1.预备知识

由于本文重在帮助初学者快速理解函数栈帧的创建及销毁,下面所有概念会讲得通俗一些(不使用标准定义) ,并且调试环境为x86,debug版本,vs2022.

1.1内存区的划分

了解内存分区有助于理解程序的运行机制和内存管理,进而更好理解函数栈帧的创建及销毁。

由低地址到高地址依次是:

  1. 代码区(code segment):简单来讲,你写的代码就在这个区域。
  2. 常量区(constant):你写代码中涉及的字符常量,define的常量,就是不变不可修改的在这个区。
  3. 全局/静态区(global/static):存放全局变量和静态变量,这些变量在整个程序运行期间都存在。包括初始化了的,和未初始化的。
  4. 堆区(heap):也是动态内存分配的区域,由程序员手动控制。常用的malloc函数就是利用的这个区。
  5. 栈区(stack):由编译器自动分配和释放,用于存放函数的参数值、局部变量的值等。栈是一种先进后出的数据结构,用于支持程序的执行流程,如函数调用和返回。你可以理解为你程序运行能得出结果,就是靠的他。

除此以外,我们还需要明确, 代码是由低地址到高地址开始执行的,但函数栈帧是从高地址到低地址的,这个我在下面示例中会详细强调。

1.2认识相关寄存器和汇编指令

1.2.1寄存器

寄存器大家刚开始也不必想得特别复杂,就理解为与平时的int a,int* a差不多功能的存放数据的就行了,大致有四种寄存器:

1.通用寄存器:主要是用来保存一些数据的,可以理解为“万能”的类似于int的数据类型,通常用于算术运算、逻辑运算以及数据传递等操作。包含eax,ebx,ecx,edx四个主要的寄存器。

eax:保存数据来进行加法乘法运算,也可以保存返回值

ebx:主要用于内存寻址时存放指针或索引的基地址

ecx:存放循环次数

edx:除法运算时,存放余数

2.变址寄存器 :主要是存放地址的,你可以理解为函数内的某种指针,指向栈区

esi:通常被称为源变址寄存器。它主要用于存放要处理的数据的内存地址,特别是在进行字符串操作时,ESI寄存器通常用于指向源字符串的起始地址。

edi:通常被称为目的变址寄存器。与ESI相对应,EDI寄存器通常用于存放目标数据的内存地址,在进行字符串操作时,EDI寄存器通常用于指向目标字符串的起始地址。

3.两个核心寄存器 :栈指针寄存器ESP基址指针寄存器EBP,指向栈区

栈区是由高地址向低地址执行的(结合上图加以理解),所以高地址是栈底,低地址是栈顶。

ebp,指向栈底

esp,指向栈顶

4.EIP :指向下一条即将执行的语句,指向代码区

1.2.2相关汇编指令 

mov:数据转移指令
push:数据入栈,同时esp栈顶寄存器也要发生改变
pop:数据弹出至指定位置,同时esp栈顶寄存器也要发生改变
sub:减法命令
add:加法命令
call:函数调用,1. 压入返回地址 2. 转入目标函数
jump:通过修改eip,转入目标函数,进行调用
ret:恢复返回地址,压入eip,类似pop eip命令

2.测试前

2.1测试代码及环境 

环境:x86,debug,vs2022

//代码实现的是计算并打印十六进制A+B的结果

#include<stdio.h>

int add(int a, int b)
{
	int c = 0;
	c = a + b;
	return c;
}

int main()
{
	int x = 0xA;
	int y = 0xB;
	int z = 0;
	z = add(x, y);
	printf("%d\n", z);
	return 0;
}

2.2 main函数也是被其他函数调用的

我们可以看到main函数被invoke_main函数调用, invoke_main函数又被_scrt_common_main_seh函数调用,最后大家会看到,kerner32.dll,实际上就是被操作系统调用了。main函数被其他函数调用,其他函数也会被调用,调用的尽头就是被操作系统调用。

3.函数栈帧的创建 

开始的时候,我们讲详细一些

int main()
{
00A025B0 55                   push        ebp  
00A025B1 8B EC                mov         ebp,esp  
00A025B3 81 EC E4 00 00 00    sub         esp,0E4h  
00A025B9 53                   push        ebx  
00A025BA 56                   push        esi  
00A025BB 57                   push        edi  
00A025BC 8D 7D DC             lea         edi,[ebp-24h]  
00A025BF B9 09 00 00 00       mov         ecx,9  
00A025C4 B8 CC CC CC CC       mov         eax,0CCCCCCCCh  
00A025C9 F3 AB                rep stos    dword ptr es:[edi]  
00A025CB B9 08 C0 A0 00       mov         ecx,0A0C008h  
00A025D0 E8 4B ED FF FF       call        00A01320  
	int x = 0xA;
00A025D5 C7 45 F8 0A 00 00 00 mov         dword ptr [ebp-8],0Ah  
	int y = 0xB;
00A025DC C7 45 EC 0B 00 00 00 mov         dword ptr [ebp-14h],0Bh  
	int z = 0;
00A025E3 C7 45 E0 00 00 00 00 mov         dword ptr [ebp-20h],0  
	z = add(x, y);
00A025EA 8B 45 EC             mov         eax,dword ptr [ebp-14h]  
00A025ED 50                   push        eax  
00A025EE 8B 4D F8             mov         ecx,dword ptr [ebp-8]  
00A025F1 51                   push        ecx  
00A025F2 E8 2C EA FF FF       call        00A01023  
00A025F7 83 C4 08             add         esp,8  
00A025FA 89 45 E0             mov         dword ptr [ebp-20h],eax  
	printf("%d\n", z);
00A025FD 8B 45 E0             mov         eax,dword ptr [ebp-20h]  
00A02600 50                   push        eax  
00A02601 68 CC 7B A0 00       push        0A07BCCh  
00A02606 E8 AB ED FF FF       call        00A013B6  
00A0260B 83 C4 08             add         esp,8  
	return 0;
00A0260E 33 C0                xor         eax,eax  
}
00A02610 5F                   pop         edi  
00A02611 5E                   pop         esi  
00A02612 5B                   pop         ebx  
00A02613 81 C4 E4 00 00 00    add         esp,0E4h  
00A02619 3B EC                cmp         ebp,esp  
00A0261B E8 24 EC FF FF       call        00A01244  
00A02620 8B E5                mov         esp,ebp  
00A02622 5D                   pop         ebp  
00A02623 C3                   ret  

eip代表的即是即将执行的下一条语句,我们F10右键进入反汇编,eip的值为main函数进去后的第一条指令。

eip=00A025B0时,F10,代码走起,push ebp,相当于把ebp自己的地址压入栈中,esp 自己的地址向低地址改变时,esp的值是ebp的地址。(ebp,esp的值是他们所在内存区的地址,而非内存区存放的值)回来看时esp push 后我发现有歧义,我的意思是push  ebp后esp的地址,esp push 前同理。

 

eip=00A025B1,F10,代码走起 ,mov  ebp,esp ,相当于将esp的值(注意是esp的地址,而非内存区的值)给ebp,即ebp与esp指向同一个地方

 

eip =  00A025B3,F10,代码走起,sub  esp,0E4h,也就是将esp向低地址移动0E4h(228)

 

eip = 00A025B9,00A025BA,00A025BB,开始push ebx,esi,edi,跟push  ebp是一个思路。分别将ebx,esi,edi的值压入栈中,esp所在内存区的值就是他们的值 。注意,push的内容在内存中是连续存放的,esp都相差4.

 

 eip = 00A025BC,F10,代码走起,lea  edi,[ebp - 24h],也就是将edi的值改成了ebp - 24h,相当于改变了edi 的指向。跟mov很像,只是mov进行的是数据的计算,而lea进行的是地址的计算。

eip = 00A025BF,F10,代码走起,mov  ecx,9,也就是将循环次数设置为9

eip = 00A025C4 ,F10,代码走起,mov  eax,0CCCCCCCCh ,也就是eax存入CCCCCCCC

eip = 00A025C9,F10,代码走起,rep stos    dword ptr es:[edi],也就是重复次数为9,将eax的值向高地址开始“赋值”,值为CCCCCCC,4*9=36,即最后到了edi + 36上,恰好是到了ebp为止

eip = 00A025CB,F10,代码走起,mov   ecx,0A0C008h,即将0A0C008h的值放进ecx中。

 

 eip = 00A025D0, call   00A01320,即先压入返回地址00A025D5(int x = 0xA;),然后跳转到00A01320去执行。我们在add函数时再详细讲解。

至此,函数栈帧就已基本开辟完毕。

4.进入函数内部 

eip = 00A025D5,00A525DC,00A025E3,执行x,y,z的定义dword ptr [ebp-8],0Ah,dword ptr [ebp-14h],0Bh,dword ptr [ebp-20h],0,相当于将值保存到ebp - 8或14h或20h当中。

 

5.形参与实参 

由于笔者在调试时,不小心退出过一次,重新调试,代码的地址要变,故下列eip会与上不同,但原理一致,而且是同样的代码,故图的是不会发生改变的,相对地址不会变,变的只是地址

	z = add(x, y);
00A025EA 8B 45 EC             mov         eax,dword ptr [ebp-14h]  
00A025ED 50                   push        eax  
00A025EE 8B 4D F8             mov         ecx,dword ptr [ebp-8]  
00A025F1 51                   push        ecx  
00A025F2 E8 2C EA FF FF       call        00A01023  
00A025F7 83 C4 08             add         esp,8  
00A025FA 89 45 E0             mov         dword ptr [ebp-20h],eax  

eip = 00A025EA ~00A025F1,先将y的值放入eax中,再压栈,然后再将x的值放入eax中,再压栈,形参就形成了。

 6.call/jump add函数

eip = 00A025F2,call        00A01023,先压入返回的地址00A025F7(相当于push操作),再调用00A01023处的函数

 

00A01023 E9 B8 07 00 00       jmp         add (0A017E0h)

 eip = 00A01023 ,就直接跳进去了

int add(int a, int b)
{
00A017E0 55                   push        ebp  
00A017E1 8B EC                mov         ebp,esp  
00A017E3 81 EC CC 00 00 00    sub         esp,0CCh  
00A017E9 53                   push        ebx  
00A017EA 56                   push        esi  
00A017EB 57                   push        edi  
00A017EC 8D 7D F4             lea         edi,[ebp-0Ch]  
00A017EF B9 03 00 00 00       mov         ecx,3  
00A017F4 B8 CC CC CC CC       mov         eax,0CCCCCCCCh  
00A017F9 F3 AB                rep stos    dword ptr es:[edi]  
00A017FB B9 08 C0 A0 00       mov         ecx,offset _AB3779B8_Project2024_2_22@c (0A0C008h)  
00A01800 E8 1B FB FF FF       call        @__CheckForDebuggerJustMyCode@4 (0A01320h)  
	int c = 0;
00A01805 C7 45 F8 00 00 00 00 mov         dword ptr [c],0  
	c = a + b;
00A0180C 8B 45 08             mov         eax,dword ptr [a]  
00A0180F 03 45 0C             add         eax,dword ptr [b]  
00A01812 89 45 F8             mov         dword ptr [c],eax  
	return c;
00A01815 8B 45 F8             mov         eax,dword ptr [c]  
}
00A01818 5F                   pop         edi  
00A01819 5E                   pop         esi  
00A0181A 5B                   pop         ebx  
00A0181B 81 C4 CC 00 00 00    add         esp,0CCh  
00A01821 3B EC                cmp         ebp,esp  
00A01823 E8 1C FA FF FF       call        __RTC_CheckEsp (0A01244h)  
00A01828 8B E5                mov         esp,ebp  
00A0182A 5D                   pop         ebp  
00A0182B C3                   ret 

7.函数栈帧的销毁 

是不是感觉前面都很熟悉,简直跟main函数一模一样,没错,都说,main函数也是被其他函数调用,所以被调用的add函数也就差不多了。也可以说得上是创建的逆过程,于是我们直接进入销毁阶段。

7.1保存返回值

eip = 00A01815 ,mov   eax,dword ptr [c]  ,就是先将返回值保存在寄存器中,到时候,再将eax中的值给实参z。

7.2销毁add的函数栈帧

eip = 00A01818 ~00A0182B,其实就相当于从栈底逐渐弹栈,把高的拿完了,再拿低的。add  esp ,加的值其实恰好使esp的值等于了ebp,但vs2022又做了一个安全检查,最后返回

eip = 00A01828 ,ret。ret的是什么呢?刚刚弹了ebp,为什么ebp能回到原来的位置呢?因为push ebp时,esp对应的内存区存放的是ebp原来的地址,弹栈就是能弹回原来的地方,ret对应内存区的地址就是返回地址返回的地址00A025F7。所以F10后,eip能指00A025F7.

 7.3回收形参

eip = 00A025F7,add   esp,8,esp向高地址移动8个单位后,最终回到了原来的地方

 7.4返回值输入

eip = 00A025FA,mov  dword ptr [z],eax,将eax保存的返回值放入参数z中

至此,函数栈帧的销毁就到此结束了。

每个函数栈帧的创建及销毁其实都大同小异 ,对照参考,就能得出。

感谢大佬们的支持,也欢迎能够指出不足!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1465891.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++】C++入门篇,初识C++----第一个C++结构,C++关键字,命名空间,C++的输入输出,缺省参数【图文详解】

欢迎来CILMY23的博客喔&#xff0c;本篇为【C】C入门篇&#xff0c;初识C----第一个C结构&#xff0c;命名空间&#xff0c;C的输入输出&#xff0c;缺省参数【图文详解】&#xff0c;深刻理解命名空间&#xff0c;带大家入门C&#xff0c;感谢观看&#xff0c;支持的可以给个一…

灌水:powershell 练习正则表达式

亲爱的读者们&#xff0c;请展示你们的能力&#xff1a;解析&#xff08;使用代码&#xff09;解析以下字符串 <鱼龙混杂的奇葩文件#> UI1|System.Windows.Forms.linklabel #创建用户对象 1.location.250.250 1.text.磁盘清理 1.autosize #自适应大小 #存在混淆风险…

队列的基本操作——常见队列的对比分析(c语言完整代码包含注释)

目录 一、队列 1.1基本概念 1.2基本操作 1.3 队列分类 1.3.1带头队列 1.3.2不带头队列 1.3.3 循环带头队列 1.3.4 循环不带头队列 1.3.5 总结 二、代码实现 2.1带头队列 2.2不带头队列 2.3循环带头队列 2.4循环不带头队列 一、队列 1.1基本概念 队列&#xff08…

85、字符串操作的优化

上一节介绍了在模型的推理优化过程中,动态内存申请会带来额外的性能损失。 Python 语言在性能上之所以没有c++高效,有一部分原因就在于Python语言将内存的动态管理过程给封装起来了,我们作为 Python 语言的使用者是看不到这个过程的。 这一点有点类似于 c++ 标准库中的一些…

VegaPrime 2013 VP2013

Vega Prime 2013 VegaPrime 2013 VP2013

并发编程(2)管程(悲观锁)

4 共享模型之管程 本章内容 共享问题synchronized线程安全分析Monitorwait/notify线程状态转换活跃性Lock 4.1 共享带来的问题 4.1.1 小故事 老王&#xff08;操作系统&#xff09;有一个功能强大的算盘&#xff08;CPU&#xff09;&#xff0c;现在想把它租出去&#xff…

Linux(ACT)权限管理

文章目录 一、 ATC简介二、 案例1. 添加测试目录、用户、组&#xff0c;并将用户添加到组2. 修改目录的所有者和所属组3. 设定权限4. 为临时用户分配权限5. 验证acl权限 6. 控制组的acl权限 一、 ATC简介 ACL&#xff08;Access Control List&#xff0c;访问控制列表&#xf…

运维SRE-15 自动化批量管理-ansible1

## 1.什么是自动化批量管理重复性工作与内容: 思考如何自动化完成. 部署环境,批量查看信息,批量检查:自动化 一般步骤:1.如何手动实现2.如何自动化管理工具&#xff0c;批量实现3.注意事项&#xff1a;想要自动化一定要先标准化(所有环境&#xff0c;软件&#xff0c;目录一致)…

Vant轮播多个div结合二维数组的运用

需求说明 在开发H5的时候&#xff0c;结合Vant组件的轮播组件Swipe实现如下功能。我们查阅vant组件库官方文档可以得知&#xff0c;每个SwipeItem组件代表一个卡片&#xff0c;实现的是每屏展示单张图片或者单个div轮播方式&#xff0c;具体可以查阅&#xff1a;Vant 2 - 轻量、…

springboot750人职匹配推荐系统

springboot750人职匹配推荐系统 获取源码——》公主号&#xff1a;计算机专业毕设大全

MongoDB从入门到实战之.NET Core使用MongoDB开发ToDoList系统(8)-Ant Design Blazor前端框架搭建

前言 前面的章节我们介绍了一些值得推荐的Blazor UI组件库&#xff0c;通过该篇文章的组件库介绍最终我选用Ant Design Blazor这个UI框架作为ToDoList系统的前端框架。因为在之前的工作中有使用过Ant Design Vue、Ant Design Angular习惯并且喜欢Ant Design设计规范和风格&…

学生成绩管理系统(C语言课设 )

这个学生成绩管理系统使用C语言编写&#xff0c;具有多项功能以方便管理学生信息和成绩。首先从文件中读取数据到系统中&#xff0c;并提供了多种功能&#xff08;增删改查等&#xff09;选项以满足不同的需求。 学生成绩管理系统功能: 显示学生信息增加学生信息删除学生信息…

如何解决服务器之间大量数据文件传输交换慢的问题?

在信息化时代&#xff0c;企业运营的核心之一便是服务器间的数据交换效率。数据流通的速度直接关系到业务的响应速度和企业的整体表现。然而&#xff0c;数据传输速度缓慢的问题时常成为企业发展的绊脚石&#xff0c;可能导致严重的业务损失。本文将深入探讨造成服务器数据传输…

【MySQL】如何理解索引(高频面试点)

一、前言 首先这个博客会介绍一些关于MySQL中索引的基本内容以及一些基本的语法&#xff0c;当然里面也会有些常见的面试题的解答。 二、关于索引 1、概念 索引是一种能够帮助MySQL高效的去磁盘检索数据的一种数据结构。在MySQL的Innodb存储引擎中呢&#xff0c;采用的是B树的…

software framwork

software framwork软件架构 软件架构&#xff0c;之前图没找到&#xff0c;随手画了一个啦&#xff0c;了解架构细分职能和工作任务&#xff1a; 下图&#xff0c;第一是客户端架构包项目&#xff0c;第二是服务端架构包项目 -----------------------------------------------…

Thymeleaf无法显示模板视图,加载页面显示404状态问题的解决方法

本篇文章主要讲解&#xff1a;Thymeleaf无法显示模板视图&#xff0c;加载页面显示404状态问题的解决方法 日期&#xff1a;2024年2月23日 作者&#xff1a;任聪聪 现象说明&#xff1a; 1.只返回输出模板的名称&#xff0c;如图&#xff1a; 2.显示报错信息&#xff1a; Whi…

数字化转型导师坚鹏:县域数字化转型案例研究

县域数字化转型案例研究 课程背景&#xff1a; 很多县级政府存在以下问题&#xff1a; 不清楚县域数字化转型的发展模式 不清楚县域数字化转型的成功案例 课程特色&#xff1a; 针对性强 实用性强 创新性强 学员收获: 学习县域数字化转型的发展模式。 学习县…

129.乐理基础-曾音程、减音程、等音程

内容参考于&#xff1a;三分钟音乐社 上一个内容&#xff1a;128.乐理基础-五线谱-纯四度、纯五度-CSDN博客 上一个内容里练习的答案&#xff1a; 首先c1-重降e1&#xff0c;c1-升e1的时候&#xff0c;也都是三度&#xff0c;但距离肯定不一样这时该叫什么&#xff1f;如下图…

【Ucore 操作系统】3. 多道程序与分时多任务

文章目录 【 0. 引言 】0.1 上章回顾0.2 背景0.3 协作式操作系统0.4 抢占式操作系统0.3 进程小述0.3 本章任务 【 1. 多道程序放置与加载 】1.1 多道程序的放置1.2 多道程序的加载 【 2. 进程基础结构 】2.1 进程的概念2.2 进程的基本管理2.3 进程的分配 【 3. 多道程序与协作式…

开发个IDEA插件

开发IDEA一个插件&#xff0c;但是这个插件的功能是个大杂烩吧&#xff0c; 主要完成以下几个功能&#xff0c;方便组内开发人员提高效率。 1 网关会传过来登录人员的 一些核心字段&#xff0c;公司编码/用户编号/主岗。 因为存在多租户&#xff0c;所以经常要切换任务&…