五种引用
强引用(不回收)
强引用不会被强制垃圾回收,即使发生OOM也绝对不回收.保护了数据的安全性
软引用(内存不足即回收)
软引用是用来描述一些还有用,但非必需的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。
软引用通常用来实现内存敏感的缓存。比如: 高速缓存就有用到软引用。如果还有空闲内存,就可以暂时保留缓存,当内存不足时清理掉,这样就保证了使用缓存的同时,不会耗尽内存。
垃圾回收器在某个时刻决定回收软可达的对象的时候,会清理软引用,并可选地把引用存放到一个引用队列 (Reference Queue)
类似弱引用,只不过Java虚拟机会尽量让软引用的存活时间长一些,迫不得已才清理
在JDK 1.2版之后提供了java.lang.ref.SoftReference类来实现软引用。
SoftReference<Object>: sf = new SoftReference<Object>(obj);
弱引用(发现即回收)
弱引用也是用来描述那些非必需对象,只被弱引用关联的对象只能生存到下一次垃圾收集发生为止。在系统GC时,只要发现弱引用,不管系统堆空间使用是否充足,都会回收掉只被弱引用关联的对象。
但是,由于垃圾回收器的线程通常优先级很低,因此,并不一定能很快地发现持有弱引用的对象。在这种情况下,弱引用对象可以存在较长的时间。
弱引用和软引用一样,在构造弱引用时,也可以指定一个引用队列,当弱引用对象被回收时,就会加入指定的引用队列,通过这个队列可以跟踪对象的回收情况。
弱引用非常适合来保存那些可有可无的缓存数据。如果这么做,当系统内存不足时,这些缓存数据会被回收,不会导致内存溢出。而当内存资源充足时,这些缓存数据又可以存在相当长的时间,从而起到加速系统的作用。
在JDK 1.2版之后提供了java.lang.ref.WeakReference类来实现弱引用.
虚引用
也称为“幽灵引用”或者“幻影引用”,是所有引用类型中最弱的一个。
一个对象是否有虚引用的存在,完全不会决定对象的生命周期。如果一个对象仅持有虚引用,那么它和没有引用几乎是一样的,随时都可能被垃圾回收器回收。
它不能单独使用,也无法通过虚引用来获取被引用的对象。当试图通过虚引用的get()方
法取得对象时,总是nu11。
为一个对象设置虚引用关联的唯一目的在于跟踪垃圾回收过程。比如:能在这个对象被收集器回收时收到一个系统通知。
- 虚引用必须和引用队列一起使用。虚引用在创建时必须提供一个引用队列作为参数。当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象后,将这个虚引用加入引用队列,以通知应用程序对象的回收情况。
- 由于虚引用可以跟踪对象的回收时间,因此,也可以将一些资源释放操作放置在虚引用中执行和记录。
终接器引用
- 它用以实现对象的finalize()方法,也可以称为终结器引用
- 无需手动编码,其内部配合引用队列使用。
- 在GC时,终结器引用入队。由Finalizer线程通过终结器引用找到被引用对象并调用它的finalize()方法,第二次GC时才能回收被引用对象
GC评估
一些概念介绍
- 吞吐量:程序的运行时间 《程序的运行时间十内存回收的时间 )
- 垃圾收集开销:吞吐量的补数,垃圾收集器所占时间与总时间的比例。
- 暂停时间: 执行垃圾收集时,程序的工作线程被暂停的时间。
- 收集频率:相对于应用程序的执行,收集操作发生的频率。
- 内存占用: java 堆区所占的内存大小。
- 快速: 一个对象从诞生到被回收所经历的时间。
两个优先
- 吞吐量优先: 单位时间内,STW的时间最短: 0.2 + 0.2 = 0.4
- 响应时间优先: 尽可能让单次STW的时间最短: 0.1 + 0.1 + 0.1 + 0.1 + 0.1 = 0.5
红色的三项共同构成一个“不可能三角”。三者总体的表现会随着技术进步而越来越好款优秀的收集器通常最多同时满足其中的两项。这三项里,暂停时间的重要性目益凸显。因为随着硬件发展,内存占用多些越来越能容忍
吞吐量VS暂停时间
高吞吐量较好因为这会让应用程序的最终用户感觉只有应用程序线程在做“生产性”工作。直觉上,吞吐量越高程序运行越快。
低暂停时间(低延迟) 较好因为从最终用户的角度来看不管是GC还是其他原因导致一个应用被挂起始终是不好的。这取决于应用程序的类型,有时候甚至短暂的200毫秒暂停都可能打断终端用户体验。因此,具有低的较大暂停时间是非常重要的,特别是对于一个交互式应用程序。
不幸的是”高吞吐量”和”低暂停时间”是一对相互竞争的目标(矛盾)。
- 因为如果选择以吞吐量优先,那么必然需要降低内存回收的执行频率,但是这样会导致GC需要更长的暂停时间来执行内存回收。
- 相反的,如果选择以低延迟优先为原则,那么为了降低每次执行内存回收时的暂停时间,也只能频繁地执行内存回收,但这又引起了年轻代内存的缩减和导致程序吞吐量的下降。
在设计(或使用) GC算法时,我们必须确定我们的目标: 一个GC算法只可能针对两个目标之一(即只专注于较大吞吐量或最小暂停时间),或尝试找到一个二者的折衷。
现在JVM调优标准: 在最大吞吐量优先的情况下,降低停顿时间。
GC垃圾回收器
大致介绍
- 串行回收器:Serial,Serial Old
- 并行回收器:ParNew,Parallel Scavenge,Parallel Old
- 并发回收器:CMS,G1
几种垃圾回收器介绍
Serial GC(串行回收)
- Seria1收集器是最基本、历史最悠久的垃圾收集器了。JDK1.3之前回收新生代唯一的选择。
- Seria1收集器作为HotSpot中client模式下的默认新生代垃圾收集器
- Serial 收集器采用复制算法、串行回收和”stop-the-World”机制的方式执行内存回收。
- 除了年轻代之外,Seria1收集器还提供用于执行老年代垃圾收集的Serial old收集器。Serial old 收集器同样也采用了串行回收和”stop the world”机制,只不过内存回收算法使用的是标记-压缩(整理)算法。
- Serial old是运行在client模式下默认的老年代的垃圾回收器
- Serial old在Server模式下主要有两个用途:与新生代的ParallelScavenge配合使用,作为老年代CMS收集器的后备垃圾收集方案
总结
- 简单而高效(与其他收集器的单线程比) ,对于限定单个 CPU 的环境来说,Seria1收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。
- 运行在client模式下的虚拟机是个不错的选择。
- 在用户的桌面应用场景中,可用内存一般不大 (几十MB至一两百MB》 ,可以在较短时间内完成位圾收集(几十ms至一百多ms),只要不频繁发生,使用串行回收器是可以接受的。
- 在HotSpot虚拟机中,使用-XX:+UseSerialGC参数可以指定年轻代和老年代都使用串行收集器。等价于新生代用Serial GC,且老年代用Serial old GC
- 这种垃圾收集器大家了解,现在已经不用串行的了。而且在限定单核cpu才可以用。现在都不是单核的了。对于交互较强的应用而言,这种垃圾收集器是不能接受的。一般在Java web应用程序中是不会采用串行垃圾收集器的。
ParNew GC(并行回收)
- 如果说Serial GC是年轻代中的单线程垃圾收集器,那么ParNew收集器则是Serial收集器的多线程版本。Par是Parkllel的缩写,New是指只能处理新生代
- ParNew 收集器除了采用并行回收的方式执行内存回收外,两款垃圾收集器之间几乎没有任何区别。ParNew收集器在年轻代中同样也是采用复制算法、"stop-the-World"机制。
- ParNew 是很多JVM运行在Server模式下新生代的默认垃圾收集器
- 对于新生代,回收次数频繁,使用并行效率更高
- 对于老年代,回收次数少,使用串行方式节省资源,(CPU并行需要切换线程,串行可以省去切换线程的资源)
总结
- 由于ParNew收集器是基于并行回收,那么是否可以断定ParNew收集器的回收效率在任何场景下都会比Seria1收集器更高效?
- ParNew 收集器运行在多CPU的环境下,由于可以充分利用多CPU、多核心等物理硬件资源优势,可以更快速地完成垃圾收集,提升程序的吞吐量。
- 但是在单个CPU的环境下,ParNew收集器不比Serial 收集器更高效。虽然Serial收集器是基于串行回收,但是由于CPU不需要频繁地做任务切换,因此可以有效避免多线程交互过程中产生的一些额外开销。
- 因为除Seria1外,目前只有ParNew GC能与CMS收集器配合工作
- 在程序中,开发人员可以通过选项"-XX:+UseParNewGC"手动指定使用ParNew收集器执行内存回收任务.它表示年轻代使用并行收集器,不影响老年代
- -XX:ParallelGCThreads限制线程数量.默认开启和CPU核心数相同的线程数
Parallel GC(并行回收,吞吐量优先)
- HotSpot的年轻代中除了拥有ParNew收集器是基于并行回收的以外,Parallel Scavenge收集器同样也采用了复制算法、并行回收和”stop the world”机制。
- 那么Paralle1收集器的出现是否多此一举?
- 和ParNew收集器不同,Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量(Throughput),它也被称为吞吐量优先的垃圾收集器。
- 自适应调节策略也是Parallel Scavenge与ParNew一个重要区别(这里会导致新生代的8:1:1实际值可能不是,因为他属于自适应的策略)
- 高吞吐量则可以高效率地利用 CPU 时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。因此,常见在服务器环境中使用。例如,那些执行批量处理、订单处理、工资支付、科学计算的应用程序。
- Parallel 收集器在JDK1.6时提供了用于执行老年代垃圾收集的Parallel old收集器,用来代替老年代的Serial old收集器。
- Parallel old收集器采用了标记-压缩算法,但同样也是基于并行回收和Stop-the-World”机制。
- 在程序吞吐量优先的应用场景中, Parallel 收集器和Parallel old收集器的组合在Server模式下的内存回收性能很不错。
- 在Java8中,默认是此垃圾收集器
参数配置
- -XX:+UseParallelGC手动指定年轻代使用Paralle1并行收集器执行内存回收任务
- -XX:+UseParalleloldGC 手动指定老年代都是使用并行回收收集器
- 分别适用于新生代和老年代。默认jdk8是开启的。
- 上面两个参数,默认开启一个,另一个也会被开启。(互相激活)
- -XX:ParallelGCThreads 设置年轻代并行收集器的线程数。一般地,最好与CPU数量相等,以避免过多的线程数影响垃圾收集性能。
- 在默认情况下,当CPU 数量小于8个, ParallelGCThreads 的值等于CPU 数量。
- 当CPU数量大于8个,ParallelGCThreads 的值等于3+[5*CPU_Count]/8]
- -XX:MaxGCPauseMillis 设置垃圾收集器最大停顿时间(即STW的时间)。单位是亮秒
- 为了尽可能地把停顿时间控制在MaxGCPauseMills以内,收集器在工作时会调整Java堆大小或者其他一些参数。
- 对于用户来讲,停顿时间越短体验越好。但是在服务器端,我们注重高并发,整体的吞吐量。所以服务器端适合Paralle1,进行控制。
- 该参数使用需谨慎。
- -XX:GCTimeRatio 垃圾收集时间占总时间的比例 (= 1 / (N + 1))。用于衡量吞吐量的大小。
- 取值范围 (0,100) 。默认值99,也就是垃圾回收时间不超过1%。
- 与前一个-XX:MaxGCPauseMillis参数有一定矛盾性。暂停时间越长,Radio参数就容易超过设定的比例。
- -XX:+UseAdaptiveSizePolicy设置Parallel Scavenge收集器具有自适应调节策略
- 在这种模式下,年轻代的大小、Eden和Survivor的比例、晋升老年代的对象年龄等参数会被自动调整,已达到在堆大小、吞吐量和停顿时间之间的平衡点。
- 在手动调优比较困难的场合,可以直接使用这种自适应的方式,仅指定虚拟机的最大堆、目标的吞吐量 (GCTimeRatio) 和停顿时间 (MaxGCPauseMills)让虚拟机自己完成调优工作。
CMS(并发回收 低延迟)
- 在 JDK 1.5 时期,HotSpot 推出了一款在强交互应用中几乎可认为有划时代意义的垃圾收集器: CMS (Concurrent-Mark-Sweep)收集器,这款收集器是HotSpot虚拟机中第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程同时工作。
- CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短(低延迟) 就越适合与用户交互的程序,良好的响应速度能提升用户体验。
- 目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。
- CMS的垃圾收集算法采用标记-清除算法,并且也会”stop-the-world”
不幸的是,CMS 作为老年代的收集器,却无法与 JDK 1.4. 中已经存在的新生代收集器Parallel Scavenge 配合工作,所以在JDK 1.5中使用CMS来收集老年代的时候,新生代只能选择ParNew或者Seria1收集器中的一个。
在G1出现之前,CMS使用还是非常广泛的。一直到今天,仍然有很多系统使用CMS GC。
过程
CMS整个过程比之前的收集器要复杂,整个过程分为4个主要阶段,即初始标记阶段、并发标记阶段、重新标记阶段和并发清除阶段。
- 初始标记 (Initial-Mark) 阶段: 在这个阶段中,程序中所有的工作线程都将会因为“stop-the-World”机制而出现短暂的暂停,这个阶段的主要任务仅仅只是标记出GC Roots能直接关联到的对象。一旦标记完成之后就会恢复之前被暂停的所有应用线程。由于直接关联对象比较小,所以这里的速度非常快
- 并发标记 (Concurrent-Mark) 阶段: 从GC Roots的直接关联对象开始遍历整个对象图的过程,这个过程耗时较长但是不需要停顿用户线程,可以与垃圾收集线程一起并发运行。
- 重新标记(Remark)阶段: 由于在并发标记阶段中,程序的工作线程会和垃圾收集线程同时运行或者交叉运行,因此为了修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录(比如: 由不可达变为可达对象的数据),这个阶段的停顿时间通常会比初始标记阶段稍长一些,但也远比并发标记阶段的时间短。
- 并发清除(Concurrent-Sweep) 阶段: 此阶段清理删除掉标记阶段判断的已经死亡的对象,释放内存空间。由于不需要移动存活对象,所以这个阶段也是可以与用户线程同时并发的
参数设置
- -XX:+UseConcMarkSweepGC 手动指定使用CMS 收集器执行内存回收任务。
- 开启该参数后会自动将-XX:+UseParNewGC打开。即: ParNew(Young区用)+CMS(old区用)+Serial old的组合。
- -XX:CMSInitiatingOccupanyFraction 设置堆内存使用率的阙值,一旦达到该阙值,便开始进行回收。
- JDK5及以前版本的默认值为68,即当老年代的空间使用率达到68%时,会执行一次CMS 回收。JDK6及以上版本默认值为92
- 如果内存增长缓慢,则可以设置一个稍大的值,大的阙值可以有效降低CMS的触发频率,减少老年代回收的次数可以较为明显地改善应用程序性能。反之,如果应用程序内存使用率增长很快,则应该降低这个阙值,以避免频繁触发老年代串行收集器。因此通过该选项便可以有效降低Fu11 GC 的执行次数。
- -XX:+UseCMSCompactAtFulICollection 用于指定在执行完Ful1 GC后对内存空间进行压缩整理,以此避免内存碎片的产生。不过由于内存压缩整理过程无法并发执行,所带来的问题就是停顿时间变得更长了。
- -XX:CMSFulGCsBeforeCompaction 设置在执行多少次Full GC后对内存空间进行压缩整理。
总结
- CMS的优点:
- 并发收集
- 低延迟
- CMS的弊端:
- 会产生内存碎片,导致并发清除后,用户线程可用的空间不足。在无法分配大对象的情况下,不得不提前触发Fu11 GC。
- CMS收集器对CPU资源非常敏感。在并发阶段,它虽然不会导致用户停顿,但是会因为占用了一部分线程而导致应用程序变慢,总吞吐量会降低。
- CMS收集器无法处理浮动垃圾。可能出现“Concurrent Mode Failure”失败而导致另一次 Fu11 GC 的产生。在并发标记阶段由于程序的工作线程和垃圾收集线程是同时运行或者交叉运行的,那么在并发标记阶段如果产生新的垃圾对象,CMS将无法对这些垃圾对象进行标记,最终会导致这些新产生的垃圾对象没有被及时回收,从而只能在下一次执行GC时释放这些之前未被回收的内存空间。
G1 GC(区域化分代式)
名称由来
- 因为G1是一个并行回收器,它把堆内存分割为很多不相关的区域 (Region) (物理上不连续的)。使用不同的Region来表示Eden、幸存者0区,幸存者1区,老年代等。
- G1 GC有计划地避免在整个Java 堆中进行全区域的垃圾收集。G1 跟踪各个 Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值》,在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region。
- 由于这种方式的侧重点在于回收垃圾最大量的区间(Region),所以我们给G1一个名字:垃圾优先T(Garbage First)。
概述
G1 (Garbage-First) 是一款面向服务端应用的垃圾收集器,主要针对配备多核CPU及大容量内存的机器,以极高概率满足GC停顿时间的同时,还兼具高吞吐量的性能特征。
在JDK1.7版本正式启用,移除了Experimental的标识,是JDK 9以后的默认垃圾回收器取代了CMS 回收器以及Parallel + Parallel old组合。被Oracle官方称为“全功能的垃圾收集器”
与此同时,CMS已经在JDK 9中被标记为废弃 (deprecated) 。在jdk8中还不是默认的垃圾回收器,需要使用-XX:+UseG1GC来启用。
- G1 (Garbage-First) 是一款面向服务端应用的垃圾收集器,兼顾吞吐量和停顿时间的GC实现。
- 在JDK1.7版本正式启用,是JDK 9以后的默认GC选项,取代了CMS 回收器
特点
与其他 GC 收集器相比,G1使用了全新的分区算法,其特点如下所示:
- 并行与并发
- 并行性: G1在回收期间,可以有多个GC线程同时工作,有效利用多核计算能力。此时用户线程STW
- 并发性: G1拥有与应用程序交替执行的能力,部分工作可以和应用程序同时执行,因此,一般来说,不会在整个回收阶段发生完全阻塞应用程序的情况
- 分代收集
- 从分代上看,G1依然属于分代型垃圾回收器,它会区分年轻代和老年代,年轻代依然有Eden区和Survivor区。但从堆的结构上看,它不要求整个Eden区、年轻代或者老年代都是连续的,也不再坚持固定大小和固定数量。
- 将堆空间分为**若干个区域(Region) **,这些区域中包含了逻辑上的年轻代和老年代
- 和之前的各类回收器不同,它同时兼顾年轻代和老年代。对比其他回收器,或者工作在年轻代,或者工作在老年代;
- 空间整合
- CMS:“标记-清除”算法、内存碎片、若干次GC后进行一次碎片整理
- G1将内存划分为一个个的region。内存的回收是以region作为基本单位的。Region之间是复制算法,但整体上实际可看作是标记-压缩(Mark-Compact)算法,两种算法都可以避免内存碎片。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC。尤其是当Java堆非常大的时候,G1的优势更加明显。
- 可预测的停顿时间模型(即: 软实时soft real-time)
- 这是 G1 相对于 CMS 的另一大优势,G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内,消耗在垃圾收集上的时间不得超过 N 毫秒。
- 由于分区的原因,G1可以只选取部分区域进行内存回收,这样缩小了回收的范围因此对于全局停顿情况的发生也能得到较好的控制。
- G1 跟踪各个 Region 里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region。保证了 G1 收集器在有限的时间内可以获取尽可能高的收集效率。
- 相比于CMS GC,G1未必能做到CMS在最好情况下的延时停顿,但是最差情况要好很多。
参数设置
- -XX: +UseG1GC 手动指定使用G1收集器执行内存回收任务。
- -XX:G1HeapRegionSize 设置每个Region的大小。值是2的幂,范围是1MB到32MB之间,目标是根据最小的Java堆大小划分出约2048个区域。默认是堆内存的1/2000.
- -XX:MaxGCPauseMillis 设置期望达到的最大GC停顿时间指标(JVM会尽力实现但不保证达到)。默认值是200ms
- -XX:ParallelGCThread 设置STW时GC线程数的值。最多设置为8
- -XX:ConcGCThreads 设置并发标记的线程数。将n设置为并行垃圾回收线程数(ParalleGCThreads)的1/4左右。
- -XX:InitiatingHeapOccupancyPercent 设置触发并发GC周期的Java堆占用率阙值。超过此值,就触发GC。默认值是45
适用场景
- 面向服务端应用,针对具有大内存、多处理器的机器。(在普通大小的堆里表现并不惊喜)
- 最主要的应用是需要低GC延迟,并具有大堆的应用程序提供解决方案.
- 在堆大小约6GB或更大时,可预测的暂停时间可以低于0.5秒; (G1通过每次只清理一部分而不是全部的Region的增量式清理来保证每次GC停顿时间不会过长)。
- 用来替换掉JDK1.5中的CMS收集器
- 在下面的情况时,使用G1可能比CMS好:
- 超过50%的Java堆被活动数据占用:
- 对象分配频率或年代提升频率变化很大;
- GC停顿时间过长 (长于.5至1秒)。
- HotSpot 垃圾收集器里,除了G1以外,其他的垃圾收集器使用内置的JVM线程执行GC的多线程操作,而G1 GC可以采用应用线程承担后台运行的GC工作,即当JVM的GC线程处理速度慢时,系统会调用应用程序线程帮助加速垃圾回收过程。
分区Region(化整为零)
- 使用 G1 收集器时,它将整个Java堆划分成约2048个大小相同的独立Region块,每个Region块大小根据堆空间的实际大小而定,整体被控制在1MB到32MB之间,且为2的N次幂,即1MB,2MB,4MB,8MB,16MB,32MB。可以通过-XX:G1HeapRegionSize设定。所有的Region大小相同,且在JVM生命周期内不会被改变。
- 虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region (不需要连续) 的集合。通过Region的动态分配方式实现逻辑上的连续。
- 一个 region 有可能属于 Eden,Survivor 或者 old/Tenured 内存区域。但是个region只可能属于一个角色。图中的 E 表示该region属于Eden内存区域,S表示属于survivor内存区域,0表示属于old内存区域。图中空白的表示未使用的内存空间
- G1 垃圾收集器还增加了一种新的内存区域,叫做 Humongous 内存区域,如图中的H 块。主要用于存储大对象,如果超过1.5个region,就放到H。
设置H的原因:
对于堆中的大对象,默认直接会被分配到老年代,但是如果它是一个短期存在的大对象,就会对垃圾收集器造成负面影响。为了解决这个问题,G1划分了一个Humongous区,它用来专门存放大对象。如果一个H区装不下一个大对象,那么G1会寻找连续的H区来存储。为了能找到连续的H区,有时候不得不启动Ful1 GC。G1的大多数行为都把H区作为老年代的一部分来看待。
垃圾回收过程
- 年轻代回收
- 并发标记过程
- 初始标记阶段: 标记从根节点直接可达的对象。这个阶段是STW的,并且会触发一次年轻代GC。
- 根区域扫描 (Root Region Scanning): G1 GC扫描Survivor区直接可达的老年代区域对象,并标记被引用的对象。这一过程必须在young GC之前完成。
- 并发标记(Concurrent Marking): 在整个堆中进行并发标记(和应用程序并发执行),此过程可能被young GC中断。在并发标记阶段,若发现区域对象中的所有对象都是垃圾,那这个区域会被立即回收。同时,并发标记过程中,会计算每个区域的对象活性(区域中存活对象的比例)。
- 再次标记(Remark): 由于应用程序持续进行,需要修正上一次的标记结果。是STW的。G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning(SATB)。
- 独占清理(cleanup,STW): 计算各个区域的存活对象和GC回收比例,并进行排序,识别可以混合回收的区域。为下阶段做铺垫。是STW的。这个阶段并不会实际上去做垃圾的收集.
- 并发清理阶段:识别并清理完全空闲的区域。
- 混合回收
- 当越来越多的对象晋升到老年代old region时,为了避免堆内存被耗尽,虚拟机会触发一个混合的垃圾收集器,即Mixed GC,该算法并不是一个old GC,除了回收整个Young Region,还会回收一部分的old Region。这里需要注意: 是一部分老年代,而不是全部老年代 可以选择哪些old Region进行收集,从而可以对垃圾回收的耗时时间进行控制,也要注意的是Mixed GC并不是Fu11 GC。
- 并发标记结束以后,老年代中百分百为垃圾的内存region被回收了,部分为垃圾的内存region被计算了出来。默认情况下,这些老年代的内存分段会分8次(可以通过XX:G1MixedGCCountTarget设置)被回收。
- 混合回收的回收集 (Collection Set) 包括八分之一的老年代内存分段,Eden区内存分段,Survivor区内存分段。混合回收的算法和年轻代回收的算法完全一样,只是回收集多了老年代的内存分段。具体过程请参考上面的年轻代回收过程。
- 由于老年代中的内存分段默认分8次回收,G1会优先回收垃圾多的内存分段。垃圾占内存分段比例越高的,越会被先回收。并且有一个阙值会决定内存分段是否被回收,-XX:G1MixedGCLiveThresholdPercent,默认为65%,意思是垃圾占内存分段比例要达到65%才会被回收。如果垃圾占比太低,意味着存活的对象占比高,在复制的时候会花费更多的时间。
- 混合回收并不一定要进行8次。有一个阙值-XX:G1HeapwastePercent,默认值为10%,意思是允许整个堆内存中有10%的空间被浪费,意味着如果发现可以回收的垃圾占堆内存的比例低于10%,则不再进行混合回收。因为GC会花费很多的时间但是回收到的内存却很少。
- FULL GC
- G1的初衷就是要避免Fu11 GC的出现。但是如果上述方式不能正常工作,G1会停止应用程序的执行(stop-The-world) ,使用单线程的内存回收算法进行垃圾回收,性能会非常差,应用程序停顿时间会很长。
- 导致G1进行Fu11 GC的原因可能有两个:
- Evacuation(回收阶段) 的时候没有足够的to-space来存放晋升的对象;
- 并发处理过程完成之前空间耗尽。
- 所以解决G1的FULL GC可以通过增大内存来解决
G1优化设置建议
- 年轻代大小
- 避免使用-Xmn或-XX:NewRatio等相关选项显式设置年轻代大小
- 固定年轻代的大小会覆盖暂停时间目标
- 暂停时间目标不要太过严苛
- G1 GC的吞吐量目标是99%的应用程序时间和10%的垃圾回收时间
- 评估G1 GC的吞吐量时,暂停时间目标不要太严苛。目标太过严苛表示你愿意承受更多的垃圾回收开销,而这些会直接影响到吞吐量。
补充:
从oracle官方透露出来的信息可获知,回收阶段 (Evacuation) 其实本也有想过设计成与用户程序一起并发执行,但这件事情做起来比较复杂,考虑到G1只是回收一部分Region,停顿时间是用户可控制的,所以并不迫切去实现,而选择把这个特性放到了G1之后出现的低延迟垃圾收集器(即ZGC) 中。另外,还考虑到G1不是仅仅面向低延迟,停顿用户线程能够最大幅度提高垃圾收集效率,为了保证吞吐量所以才选择了完全暂停用户线程的实现方案。
各个GC使用场景
垃圾收集器 | 分类 | 作用位置 | 使用算法 | 特点 | 适用场景 |
---|---|---|---|---|---|
Serial | 串行运行 | 作用域新生代 | 复制算法 | 响应速度优先 | 适用于单CPU环境下的client模式 |
ParNew | 并行运行 | 作用于新生代 | 复制算法 | 响应速度优先 | 多CPU环境Server模式下与CMS配合使用 |
Parallel | 并行运行 | 作用于新生代 | 复制算法 | 吞吐量优先 | 适用于后台运算而不需要太多交互的场景 |
Serial Old | 串行运行 | 作用于老年代 | 标记-压缩算法 | 响应速度优先 | 适用于单CPU环境下的client模式 |
Parallel Old | 并行运行 | 作用于老年代 | 标记-压缩算法 | 吞吐量优先 | 适用于后台运算而不需要太多交互的场景 |
CMS | 并发运行 | 作用于老年代 | 标记-清除算法 | 响应速度优先 | 适用于互联网或者B/S业务 |
G1 | 并发,并行运行 | 作用于新生代,老年代 | 标记-压缩算法(变种,本质是这个算法) | 响应速度优先 | 面向服务端应用 |