快速理解 Java 垃圾回收算法 & 垃圾回收器
先说个关系概念,垃圾回收的算法是逻辑概念的定义,用于规范垃圾回收器实现方的一些行为,而垃圾回收器就是实现这些算法的工具,这些工具大概是一系列的 C++ 的类以及其实现的一些对应回收算法。
分代和对象流转
基本上我们常用的垃圾回收算法对于堆空间都会有 分代 这一概念,通常来说分为 年轻代 和 老年代
年轻代又下分 eden 区 和 survive0 和 survive1 区。对于一个新的对象一般来说会先进入年轻代的 eden 区,在对象的对象头 Mark Word 中会记录其分代年龄,最大是 15 (只给了 4 bit 位来存),默认也是 15。
通常我们说 GC 的时候又分为 年轻代的 GC 即 young gc 和 老年代的 GC 即 full gc,一般来说 young gc 耗时远低于 full gc 。我们优化堆空间分配的过程就是要尽量避免 full gc 的过程。
在 young gc 的过程中,会对年轻代区域的对象进行清理回收,存活下来的由 eden 进入 s0 ,或者由 s0 进入 s1 (或者 s1 进入 s0 这个是标记复制的过程)
每次 young gc 存活下来的对象分代年龄就会 +1,当达到 15 时(这个可以配置)。会将其移进老年代,不在参与之后的 young gc
这意味着老年代的对象一般应该是存活时间较长的对象。
9
基本的回收算法
标记复制
标记复制,准备两部分区域,这两部分区域实际使用只会用一部分,另一部分作为待复制空间。在垃圾回收过程中,将所有非垃圾对象直接复制到另一区域,本区域清空。 此算法清理速度较快,但空间利用率较低。
标记清理
标记清理算法比较暴力,标记好垃圾对象后直接将垃圾对象删除,这个速度也是很快的,但是会产生较多的内存碎片,进而可能影响后续的空间分配
标记整理
标记整理算法相对于标记清理算法多了一步整理,这不整理会将清理后碎片化的空间整理为连续空间,当然付出的代价是整理的耗时。
初级垃圾回收器 Serial & Parallel
Serial -XX:+UseSerialGC -XX:+UseSerialOldGC
Serial 收集器是最基础的垃圾收集器,其收集过程为单线程收集,适用于单核 CPU ,或者垃圾回收异常情况的备选方案,逻辑简单高效。
该收集器在垃圾回收过程中会全程 STW (Stop The Word 仅垃圾回收线程工作,其他线程暂停,即用户服务不可用)
年轻代使用算法:标记复制
老年代使用算法:标记整理
Parallel -XX:+UseParallelGC(年轻代),-XX:+UseParallelOldGC(老年代)
Parallel 相当于是 Serial 的多线程版,多线程收集效率更高 STW 时间更短,适用于多核 CPU, 4G 左右内存回收都是 OK 的。
年轻代使用算法:标记复制
老年代使用算法:标记整理
进阶常用垃圾收集器 ParNew + CMS & G1
ParNew -XX:+UseParNewGC
这个玩意,和 Parallel 是一样的,它的诞生是为了兼容配合 CMS 进行垃圾收集,CMS 是老年代的垃圾收集器,它只负责老年代的垃圾收集。
CMS
重头戏,CMS 是 Concurrent Mark Sweep 并发标记清除 ,CMS 进行垃圾回收分以下步骤
- 初始标记 STW:时间短,标记快,仅标记 gc roots 根对象
- 并发标记:二阶段标记,开始遍历 gc roots 引用的对象并进行标记,耗时较长但不会 STW 可以和用户线程同时运行
- 重新标记 STW:三阶段标记,收拾二阶段并发标记的残局,修正一些用户线程导致的对象引用变化
- 并发清理:清理,新增的垃圾不会处理,所以可能有浮动垃圾,但我觉得吧可以接受
- 并发重置:重置此次 GC 的标记数据
CMS 对于 8G 以内的内存处理表现良好,高于 8G 推荐使用 G1
大家应该看出来了,垃圾收集器的迭代在于想优化 STW 的时间,使其尽量短或者可控
G1 我公司线上服务就配置的这个
Garbage First 这个适用于大内存的垃圾收集 32G 以内效果比较好 (PS 不建议内存分配超过 32G 内存,否则默认的指针压缩将会失效)
并且 G1 在区域划分上进行了改变,它将整个堆空间划分为多个 Region 区域默认是堆大小除以 2048,而分代的区域不再是固定的区域,而是随着垃圾收集动态调整。并增加了大对象区的概念,如果一个对象被认定为大对象(超出 Region 区的 50%)则直接放到大对象区 Humongous 此区域会在 full gc 时回收
G1 垃圾回收对于 CMS 的优点就是可控的 STW 时间,并且因为没有物理隔离年轻代、老年代、存活区,G1 的所有垃圾回收方式都可以使用标记复制进行,速度极快
G1 垃圾回收分为以下过程:
- 初始标记 STW:速度极快
- 并发标记
- 重新标记 STW
- 筛选回收 STW:这个阶段 G1 将根据用户期望的 STW 时间进行选择性的回收,在用户期望 STW 停顿时间内回收最具性价比的垃圾。
G1 的垃圾收集分三类
young gc : eden 区满切预计回收时间接近 -XX:MaxGCPauseMills 配置的暂停时间则进行新生代回收,否则尝试扩容 eden 区
mixed gc : 混合 gc 在收集区域上类似 CMS 的 full gc ,会回收 young 和 old 以及 humongous
full gc: 这个更像是最终解决方案,当 mixed gc 都无法正常释放空间时,将进入并发失败进行单线程的 full gc 全程 STW
之前些了篇详解感兴趣可以看看,这里不在赘述 JVM 垃圾收集器 G1 详解