文章目录
- 分配内存
- 释放内存
- GC
- 标记清除算法
- 分代算法
- .NET的GC机制有这样两个问题:
官方文档
自动内存管理
自动内存管理是CLR在托管执行过程中提供的服务之一。 公共语言运行时的垃圾回收器为应用程序管理内存的分配和释放。 对开发人员而言,这就意味着在开发托管应用程序时不必编写执行内存管理任务的代码。 自动内存管理可解决常见问题,例如,忘记释放对象并导致内存泄漏,或尝试访问已释放对象的内存。
分配内存
总的来说,C#内存是分为四个区块的,分别是
- 全局数据区:存放全局变量,静态数据,常量
- 代码区:存放所有程序代码
- 栈区:存放为运行而分配的局部变量,参数,返回数据,返回地址等
- 堆区:即自由存储区
在进程中,代码执行的两大区域,是栈和堆。在栈中,代码以栈的形式依次入栈出栈执行,每个线程会维护一个属于自己的线程栈,而栈区的内存地址从上往下增加:
摘自一文读懂C#的 堆、栈、值类型、引用类型
深入理解C#中的堆(Heap)与栈(Stack),一次性全都掌握!
C#垃圾回收机制详解
相信对于代码在栈中的执行,不少计算机专业的都相当清楚。而在堆中却不是这样,初始化新进程时,运行时会为进程保留一个连续的地址空间区域。 这个保留的地址空间被称为托管堆。
托管堆是专门用于C#的自动内存管理的,它由CLR进行管理。
托管堆维护着一个指针,用它指向将在堆中分配的下一个对象的地址。最初,该指针设置为指向托管堆的基址。与栈不同,堆是从下往上的,因此所有自由空间都在已用空间的上面。而与栈不同的最大特点就是,我们往堆中存取时是自由存取的,可以以任意顺序进行存取和移除。
(乱七八糟的堆)
记得我在之前曾经讲过,C#的变量类型存在两种,第一种值类型,它是直接存储在栈上的,且使用值类型赋值,则需要完全复制一个副本存在堆栈上。而我们的操作都是在栈上实现的,因为栈上的操作速度快,内存分配和释放简单。
而引用类型则方便许多,一方面,引用类型的本体是存储在堆中的,在堆中的存取更加自由。另一方面,我们会往栈中内存入栈存储了堆地址变量。当我们想要访问引用类型时,只需通过栈中的地址就可以找到它。但是却不能直接访问堆,因为数据存储太随意,如果没有栈中的指针,我们根本不知道它在堆中的什么位置。
但是使用堆引发一个问题:在栈中,由于程序执行完毕,各种入栈的变量会自动释放。但是堆首先存取随意,如果程序员忘了释放用完的变量,就会浪费内存。其次堆中的变量就算释放了,那么被释放的变量对应内存就空在那里了。如果空着的连续内存太小我们根本用不了,就会产生内存碎片。因此C#使用托管堆,由GC机制帮助我们自动管理这个堆。
应用程序创建第一个引用类型时,将为托管堆的基址中的类型分配内存。
应用程序创建下一个对象时,垃圾回收器在紧接第一个对象后面的地址空间内为它分配内存。
只要地址空间可用,垃圾回收器就会继续以这种方式为新对象分配空间。
从托管堆中分配内存要比非托管内存分配速度快。 由于运行时通过为指针添加值来为对象分配内存,所以这几乎和从堆栈中分配内存一样快。
另外,由于连续分配的新对象在托管堆中是连续存储,所以应用程序可以快速访问这些对象。
总结:栈主要用于存储局部变量和方法调用信息,它的操作速度较快;而堆主要用于存储动态分配的对象,它的操作速度较慢但能够支持更长的生命周期和对象共享。对于数据较小、生命周期短暂的变量,可以考虑使用栈;对于较大的对象或需要长时间存活的对象,需要使用堆。
释放内存
让我们了解一下GC机制是怎么释放内存的。
.NET 的垃圾回收器管理应用程序的内存分配和释放。 每当有对象新建时,公共语言运行时都会从托管堆为对象分配内存。 只要托管堆中有地址空间,运行时就会继续为新对象分配空间。 不过,内存并不是无限的。 垃圾回收器最终必须执行垃圾回收来释放一些内存。 垃圾回收器的优化引擎会根据所执行的分配来确定执行回收的最佳时机。 执行回收时,垃圾回收器会在托管堆中检查应用程序不再使用的对象,然后执行必要的操作来回收其内存。
当满足以下条件之一时将发生垃圾回收:
-
系统具有低的物理内存。 内存大小是通过操作系统的内存不足通知或主机指示的内存不足检测出来的。
-
由托管堆上已分配的对象使用的内存超出了可接受的阈值。 随着进程的运行,此阈值会不断地进行调整。
-
调用 GC.Collect 方法。 几乎在所有情况下,你都不必调用此方法,因为垃圾回收器会持续运行。 此方法主要用于特殊情况和测试。
GC
总体来看C#的GC和Lua的GC其实差不多
引用跟踪:GC的第一步是通过引用跟踪,确定哪些对象仍然被活动的引用所引用。GC会从栈上的根对象开始,根对象包括方法中的局部变量和静态变量。然后,从根对象开始,跟踪引用链,找出所有的可达对象。
根对象标记:在引用跟踪的过程中,GC会将所有可达的对象标记为活动对象。这些活动对象将被保留下来,不会被清理。
标记清除算法
对象标记:GC接下来会遍历堆中的所有对象,从根对象可达的对象开始,将它们标记为活动对象。GC使用一种叫做“标记-清除(mark and sweep)”的算法来标记对象。首先所有的堆中的对象全部默认为垃圾,接着通过遍历栈找到引用的对象,给这些被引用的对象打上标记。最后将所有的垃圾内存释放(或者标记为空闲状态)。
压缩阶段:当清理完垃圾之后,堆中的内存会变得零零散散的,为了避免内存碎片,接着就会把所有存活的对象移动到堆的底部。
分代算法
分代算法的原理基于统计学,简单来说活动时间越长的对象使用率越高,则死亡率越低,越不需要进行清理。
分代算法的假设前提条件:
1、大量新创建的对象生命周期都比较短,而较老的对象生命周期会更长
2、对部分内存进行回收比基于全部内存的回收操作要快
3、新创建的对象之间关联程度通常较强。heap分配的对象是连续的,关联度较强有利于提高CPU cache的命中率
.NET将heap分成3个代龄区域: Gen 0、Gen 1、Gen 2
每次迭代时使用标记清除算法去除垃圾。而堆将被分为3个代龄区域,相应的GC有3种方式: # Gen 0 collections
, # Gen 1 collections
, #Gen 2 collections
。
当Gen0区域内存达到阈值将触发# Gen 0 collections
后,存活的对象将进入Gen1区域;
当Gen1区域内存达到阈值将触发 # Gen 1 collections
,将Gen0存活对象放入Gen1,Gen1存活对象放入Gen2。
当Gen2区域内存达到阈值将触发 # Gen 2 collections
,将Gen0存活对象放入Gen1,Gen1存活对象放入Gen2,Gen2存活对象位置不变。
Gen 0和Gen 1比较小,这两个代龄加起来总是保持在16M左右;Gen2的大小由应用程序确定,可能达到几G,因此0代和1代GC的成本非常低,2代GC称为fullGC,通常成本很高。粗略的计算0代和1代GC应当能在几毫秒到几十毫秒之间完成,Gen 2 heap比较大时fullGC可能需要花费几秒时间。大致上来讲.NET应用运行期间2代、1代和0代GC的频率应当大致为1:10:100。
和Lua一样,当对象被GC清理的时候,会调用一个终结器函数。
.NET的GC机制有这样两个问题:
首先,GC并不是能释放所有的资源。它不能自动释放非托管资源。
第二,GC并不是实时性的,这将会造成系统性能上的瓶颈和不确定性。
GC并不是实时性的,这会造成系统性能上的瓶颈和不确定性。所以有了IDisposable接口,IDisposable接口定义了Dispose方法,这个方法用来供程序员显式调用以释放非托管资源。使用using 语句可以简化资源管理。