(笔记参考书籍:《JVM高级特性与最佳实践》)
一、介绍
Garbage First(简称G1)收集器是垃圾收集器技术发展历史上的里程碑式的成果,它开创了收集器面向局部收集的设计思路和基于Region的内存布局形式。
G1是一款主要面向服务端应用的垃圾收集器。作为CMS收集器的替代者和继承人,设计者们希望做出一款能够建立起“停顿时间模型”的收集器。停顿时间模型的意思是能够支持指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间大概率不超过N毫秒这样的目标,这几乎已经是实时Java(RTSJ)的中软实时垃圾收集器特征了。
实现这个目标需要有一个思想上的改变,在G1收集器出现之前的所有其他收集器,包括CMS在内,垃圾收集器的目标范围要么是整个新生代(Minor GC),要么就是整个老年代(Major GC),再要么就是整个Java堆(Full GC)。而G1跳出了这个桎梏,它可以面对堆内存任何部分来组成回收集(Collection Set,一般简称CSet)进行回收,衡量标准不再是它属于哪个分代,而是哪块内存中存放的垃圾数量最多,回收收益最大,这就是G1收集器的Mixed GC模式。
G1开创的基于Region的堆内存布局是它能够实现这个目标的关键。虽然G1也仍是遵循分代收集理论设计的,但其堆内存的布局与其他收集器有非常明显的差异:G1不再坚持固定大小以及固定数量的分代区域划分,而是把连续的Java堆划分为多个大小相等的独立区域(Region),每一个Region都可以根据需要,扮演新生代的Eden空间、Survivor空间,或者老年代空间。收集器能够对扮演不同角色的 Region采用不同的策略去处理,这样无论是新创建的对象还是已经存活了一段时间、熬过多次收集的旧对象都能获取很好的收集效果。
Region中还有一类特殊的Humongous区域,专门用来存储大对象。G1认为只要大小超过了一个
Region容量一半的对象即可判定为大对象。每个Region的大小可以通过参数-XX:G1HeapRegionSize设定,取值范围为1MB~32MB,且应为2的N次幂。而对于那些超过了整个Region容量的超级大对象,将会被存放在N个连续的Humongous Region之中,G1的大多数行为都把Humongous Region作为老年代的一部分来进行看待。
虽然G1仍然保留新生代和老年代的概念,但新生代和老年代不再是固定的了,它们都是一系列区域(不需要连续)的动态集合。G1收集器之所以能建立可预测的停顿时间模型,是因为它将Region作为单次回收的最小单元,即每次收集到的内存空间都是Region大小的整数倍,这样可以有计划地避免在整个Java堆中进行全区域的垃圾收集。更具体的处理思路是让G1收集器去跟踪各个Region里面的垃圾堆积的“价值”大小,价值即回收所获得的空间大小以及回收所需时间的经验值,然后在后台维护一个优先级列表,每次根据用户设定允许的收集停顿时间(使用参数-XX:MaxGCPauseMillis指定,默认值是200毫秒),优先处理回收价值收益最大的那些Region,这也就是“Garbage First”名字的由来。这种使用Region划分内存空间,以及具有优先级的区域回收方式,保证了G1收集器在有限的时间内获取尽可能高的收集效率。
(图片引用自CSDN博主CodingFire)
二、细节分析
1、垃圾收集对用户线程的影响部分体现在回收过程中新创建对象的内存分配上,程序要继续运行就肯定会持续有新对象被创建,G1为每一个Region设计了两个名为TAMS(Top at Mark Start)的指针,把Region中的一部分空间划分出来用于并发回收新对象分配,并发回收时新分配的对象地址都必须要在这两个指针位置以上。G1收集器默认在这个地址以上的对象是被隐式标记过的,即默认它们是存活的,不纳入回收范围。与CMS中的“Concurrent Mode Failure”失败会导致FULL GC类似,如果内存回收的速度赶不上内存分配的速度,G1收集器也要被迫冻结用户线程执行,导致Full GC而产生“Stop The World”。
2、Region里面存在的跨Region引用对象如何解决?使用记忆集避免全堆作为GC Roots扫描,但在G1收集器上记忆集的应用其实要复杂很多,它的每个Region都维护有自己的记忆集,这些记忆集会记录下别的Region指向自己的指针,并标记这些指针分别在哪些卡页的范围之内。G1的记忆集在存储结构的本质上是一种哈希表,Key是别的Region的起始地址,Value是一个集合,里面存储的元素是卡表的索引号。这种“双向”的卡表结构(卡表是“我指向谁”,这种结构还记录了“谁指向我”)比原来的卡表实现起来更复杂,同时由于Region数量比传统收集器的分代数量明显要多得多,因此G1收集器要比其他的传统垃圾收集器有着更高的内存占用负担。
三、工作流程
G1收集器的运作过程大致可划分为以下四个步骤:
1)初始标记:仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS指针的值,让下一阶段用户线程并发运行时,能正确地在可用的Region中分配新对象。这个阶段需要停顿线程,但耗时很短,而且是借用进行Minor GC的时候同步完成的,并没有额外停顿。
2)并发标记:从GC Roots开始对堆中对象进行可达性分析,递归扫描整个堆里的对象图,找出要回收的对象,这阶段耗时较长,但可与用户程序并发执行。当对象图扫描完成以后,还要重新处理SATB记录下的在并发时有引用变动的对象。
SATB是指"Snapshot at the Beginning",它是一种记录对象引用变动的技术,在并发标记阶段使用。在并发标记过程中,应用程序可能会同时进行对象的修改和垃圾收集器的标记操作,这就可能导致并发标记过程中出现对象引用的变动。为了解决这个问题,CMS(Concurrent Mark Sweep)垃圾收集器使用了SATB技术。 SATB技术的基本思想是,在并发标记阶段开始之前,先对堆中的所有对象进行一次快照,记录下所有对象的引用关系。这个快照被称为"Snapshot at the Beginning",即记录了并发标记开始时刻的对象引用情况。 在并发标记阶段进行对象图的遍历和标记时,如果发现某个对象的引用发生了变动,即原先被标记的对象现在变成了未标记的对象,那么就需要对这个变动的对象重新进行标记。这样可以保证在并发标记阶段结束时,所有的对象都能够被正确地标记为可达或不可达状态。 通过使用SATB技术,CMS收集器可以在并发标记阶段同时进行对象的修改和标记操作,避免了并发标记过程中对象引用变动的问题,提高了垃圾收集的效率和并发性能。
3)最终标记:对用户线程做另一个短暂的暂停,用于处理并发阶段结束后仍遗留下来的最后那少量的SATB记录。
4)筛选回收:负责更新Region的统计数据,对各个Region的回收价值和成本进行排序,根据用户所期望的停顿时间来制定回收计划,可以自由选择任意多个Region构成回收集,然后把决定回收的那一部分Region的存活对象复制到空的Region中,再清理掉整个旧Region的全部空间。这里的操作涉及存活对象的移动,是必须暂停用户线程,由多条收集器线程并行完成的。
G1收集器除了并发标记外,其余阶段也是要完全暂停用户线程的。
四、G1与CMS垃圾收集器比较
1、相比CMS,G1的优点有很多,暂且不论可以指定最大停顿时间、分Region的内存布局、按收益动态确定回收集这些创新性设计带来的红利,单从最传统的算法理论上看,G1也更有发展潜力。
2、CMS的“标记-清除”算法不同,G1从整体来看是基于“标记-整理”算法实现的收集器,但从局部(两个Region之间)上看又是基于“标记-复制”算法实现,无论如何,这两种算法都意味着G1运作期间不会产生内存空间碎片,垃圾收集完成之后能提供规整的可用内存。这种特性有利于程序长时间运行,在程序为大对象分配内存时不容易因无法找到连续内存空间而提前触发下一次收集。
3、比起CMS,G1的弱项也可以列举出不少,如在用户程序运行过程中,G1无论是为了垃圾收集产生的内存占用(Footprint)还是程序运行时的额外执行负载(Overload)都要比CMS要高。
4、就内存占用来说,虽然G1和CMS都使用卡表来处理跨代指针,但G1的卡表实现更为复杂,而且堆中每个Region,无论扮演的是新生代还是老年代角色,都必须有一份卡表,这导致G1的记忆集(和其他内存消耗)可能会占整个堆容量的20%乃至更多的内存空间;相比起来CMS的卡表就相当简单,只有唯一一份,而且只需要处理老年代到新生代的引用,反过来则不需要,由于新生代的对象具有朝生夕灭的不稳定性,引用变化频繁,能省下这个区域的维护开销是很划算的。
5、在执行负载的角度上,同样由于两个收集器各自的细节实现特点导致了用户程序运行时的负载会有不同,譬如它们都使用到写屏障,CMS用写后屏障来更新维护卡表;而G1除了使用写后屏障来进行同样的(由于G1的卡表结构复杂,其实是更烦琐的)卡表维护操作外,为了实现原始快照搜索(SATB)算法,还需要使用写前屏障来跟踪并发时的指针变化情况。相比起增量更新算法,原始快照搜索能够减少并发标记和重新标记阶段的消耗,避免CMS那样在最终标记阶段停顿时间过长的缺点,但是在用户程序运行过程中确实会产生由跟踪引用变化带来的额外负担。由于G1对写屏障的复杂操作要比CMS消耗更多的运算资源,所以CMS的写屏障实现是直接的同步操作,而G1就不得不将其实现为类似于消息队列的结构,把写前屏障和写后屏障中要做的事情都放到队列里,然后再异步处理。
6、目前在小内存应用上CMS的表现大概率仍然要会优于G1,而在大内存应用上G1则大多能发挥其优势,这个优劣势的Java堆容量平衡点通常在6GB至8GB之间。
五、知识补充
1、写屏障(Write Barrier)是一种在并发垃圾收集器中使用的技术,用于追踪对象引用的变动。它主要用于标记清除(Mark and Sweep)和复制(Copying)算法中。 在并发垃圾收集器中,应用程序可能会同时进行对象的修改和垃圾收集器的标记操作。这就可能导致并发标记过程中出现对象引用的变动。为了解决这个问题,垃圾收集器需要在对象引用发生变动时进行相应的处理,以确保垃圾收集器能够正确地追踪对象的引用关系。 写屏障是一种插入到应用程序代码中的特殊指令或代码段,它会在对象引用发生变动时被触发。当应用程序对一个对象进行写操作(如修改对象的引用值)时,写屏障会被触发,它会记录下发生变动的对象引用。这样,在并发标记阶段进行对象图的遍历和标记时,垃圾收集器可以通过检查写屏障的记录来判断对象引用是否发生了变动,以便对变动的对象重新进行标记。 写屏障的作用是保证在并发标记过程中,所有对象的引用都能被准确地追踪和标记,避免遗漏或错误地标记对象。它是并发垃圾收集器中保证数据一致性的关键技术之一。 需要注意的是,写屏障会带来一定的性能开销,因为它会在每次对象写操作时被触发。因此,在设计和实现垃圾收集器时,需要权衡性能和准确性,并合理地使用和优化写屏障的策略。
2、写前屏障(Write Barrier)和写后屏障(Write Barrier)是并发垃圾收集器中两种常见的写屏障技术,它们在处理对象引用变动时的时机和操作略有不同。 写前屏障是在对象引用变动之前被触发的屏障。当应用程序执行写操作时,写前屏障会在写操作之前被执行。它的作用是在对象引用变动之前捕获变动前的状态,记录下变动前的对象引用。这样,在并发标记阶段进行对象图的遍历和标记时,垃圾收集器可以通过检查写前屏障的记录来判断对象引用是否发生了变动,以便对变动的对象重新进行标记。写前屏障可以提供更加精细的对象引用变动信息,但也会带来更多的性能开销,因为它需要在每次写操作之前被触发。 写后屏障是在对象引用变动之后被触发的屏障。当应用程序执行写操作时,写后屏障会在写操作之后被执行。它的作用是在对象引用变动之后进行相应的处理,例如标记变动后的对象为可达状态。写后屏障相对于写前屏障来说,可能会产生更少的开销,因为它只在对象引用变动之后才触发。 总的来说,写前屏障和写后屏障都是用于追踪对象引用变动的技术,它们的差别在于触发时机和处理操作。写前屏障在对象引用变动之前被触发,记录变动前的状态;写后屏障在对象引用变动之后被触发,进行相应的处理。选择使用哪种屏障技术取决于具体的垃圾收集算法和应用场景的需求。