一些套话
一个由C/C++编译的程序占用的内存分为以下几个部分:栈区,堆区,全局区(静态区),文字常量区,代码区
- 在执行一个C/C++ 程序时,此程序拥有唯一的“内存四区”(栈区,堆区,全局区,代码区)
- 一个可执行程序在存储(没有调入内存时)分为代码区,静态区,文字常量区。
- 可执行性程序在掉入内存后在运行时又多出两个区域(栈区和堆区)
堆区(heap)
允许程序在运行时动态地申请某个大小的内存空间, 一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收。注意它与数据结构中的堆是两回事。
栈区(stack)
由编译器自动分配释放,存放函数的参数值,局部变量的值等。
全局区(静态区)
全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域,程序结束后由系统释放。
文字常量区
常量字符串就是放在这里的,只读的。程序结束后由系统释放。
程序代码区
存放程序的编译后的可执行二进制代码,CPU执行的机器指令,并且是只读的。
int a = 0;
//存放在全局初始化区
char *p1;
//存放在全局未初始化区
main()
{
int b;
//栈区
char s[] = "abc";
//栈区
char *p2;
//栈区
char *p3 = "123456";
//123456\0在常量区,p3在栈区。
static int c =0;
//全局(静态)初始化区
p1 = (char *)malloc(10);
p2 = (char *)malloc(20);
//分配得来得10和20字节的区域就在堆区。
strcpy(p1, "123456");
//123456\0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方。
}
内存分区运行前后的区别
运行之前(代码区+数据区+未初始化数据区)
在没有运行程序前(程序没有加载到内存前),分别为 代码区(text)、数据区(data)和未初始化数据区(bss)3 个部分(把 data 和 bss 合起来叫做静态区或全局区)。
- 代码区
存放 CPU 执行的机器指令。通常代码区是可“共享”的(即另外的执行程序可以调用它),使其可共享的目的是对于频繁被执行的程序,只需要在内存中有一份代码即可(节约内存)。代码区是只读的,使其只读的原因是防止程序意外的修改了它的指令。另外,代码区还规划了局部变量的相关信息。 - 全局初始化数据区/静态数据区(data段)
该区包含了在程序中①被初始化的全局变量②已经初始化的静态变量(包括全局静态变量)③常量数据(如字符串常量)。 - 未初始化数据区(又叫 bss 区)
存入的是全局未初始化静态变量。未初始化数据区的数据在程序开始执行之前被内核初始化为 0 或者空(NULL)。
总体来讲,程序源代码被编译之后主要分成两种段:程序指令(代码区)和程序数据(数据区)。代码段属于程序指令,而数据域段和 bss 段属于程序数据。
注:那为什么把程序的指令和程序数据分开呢?
程序被加载到内存中之后,可以将数据和代码分别映射到两个内存区域。由于数据区域对进程来说是可读可写的,而指令区域对程序来讲是只读的,所以分区之后呢,可以将程序指令区域和数据区域分别设置成只读或可读可写。这样可以防止程序的指令有意或者无意被修改。
当系统中运行着多个同样的程序的时候,这些程序执行的指令都是一样的,所以只需要内存中保存一份程序的指令就可以了,只是每一个程序运行中数据不一样而已,这样可以节省大量的内存。
运行之后(代码区+数据区+未初始化数据区+栈区+堆区)
程序在加载到内存前,代码区和全局区(data+ bss)的大小就是固定的,程序运行期间不能改变。然后,运行可执行程序,操作系统把物理硬盘程序加载到内存,除了根据可执行程序的信息分出代码区(text)、数据区(data)和未初始化数据区(bss)之外,还额外增加了栈区、堆区。
-
代码区(text segment)
加载的是可执行文件代码段,所有的可执行代码都加载到代码区,这块内存是不可以在运行期间修改的。 -
未初始化数据区(BSS)
加载的是可执行文件 BSS 段,位置可以分开也可以紧靠数据段,存储于数据段的数据(全局未初始化,静态未初始化数据)的生存周期是整个程序运行过程。 -
全局初始化数据区/静态数据区(data segment)
加载的是可执行文件数据段,存储于数据段(全局初始化,静态初始化数据,文字常量(只读))的数据的生存周期是整个程序运行过程。 -
栈区(stack)
栈是由编译器自动分配释放,存放函数的参数值、返回值、局部变量等。在程序运行过程中实时加载和释放,因此,局部变量的生存周期为申请到释放该段栈空间。 -
堆区(heap)
堆是一个大容器,它的容量要远远大于栈,但没有栈那样先进后出的顺序。用于动态内存分配。堆在内存中位于 BSS 区和栈区之间。一般由程序员分配和释放,若程序员不释放,程序结束时可能会由操作系统回收。
类型 | 作用 | 生命周期 | 存储位置 |
---|---|---|---|
auto变量 | 一对{}内 | 当前函数 | 栈区 |
static局部变量 | 一对{}内 | 整个程序运行期 | 初始化在data段,未初始化在BSS段 |
extern变量 | 整个程序 | 整个程序运行期 | 初始化在data段,未初始化在BSS段 |
static全局变量 | 当前文件 | 整个程序运行期 | 初始化在data段,未初始化在BSS段 |
extern函数 | 整个程序 | 整个程序运行期 | 代码区 |
static函数 | 当前文件 | 整个程序运行期 | 代码区 |
register变量 | 一对{}内 | 当前函数 | 运行时存储在cpu寄存器 |
字符串常量 | 当前文件 | 整个程序运行期 | data段 |
栈和堆的对比
数据结构中的堆和内存分配中的堆的区别
数据结构中的堆
堆的定义:是一棵完全二叉树结构,特点是父节点的值大于(小于)两个子节点的值(分别称为大顶堆和小顶堆)。堆是一种经过排序的树形数据结构,每个结点都有一个值。通常我们所说的堆的数据结构,是指二叉堆。它常用于管理算法执行过程中的信息,应用场景包括堆排序,优先队列等。
堆的特点:是根结点的值最小(或最大),且根结点的两个子树也是一个堆。由于堆的这个特性,常用来实现优先队列,堆的存取是随意,
堆的形象例子:就如同我们在图书馆的书架上取书,虽然书的摆放是有顺序的,但是我们想取任意一本时不必像栈一样,先取出前面所有的书,书架这种机制不同于箱子,我们可以直接取出我们想要的书。
内存分配中的堆
**堆的定义:**堆允许程序在运行时动态地申请某个大小的内存空间,从堆中分配的内存需要程序员手动释放,如果不释放,而系统内存管理器又不自动回收这些堆内存的话,那就一直被占用(Java中由JVM虚拟机的垃圾回收机制自动回收)。如果一直申请堆内存,而不释放,内存会越来越少。