一、内存结构
G1将堆内存划分成2048个相同大小的内存Region,一般Region大小等于堆内存大小除以2048,比如堆内存有4个G,每个Region大小为2M(-XX:G1HeapRegionSize参数可以设置Region大小,一般不推荐修改)
G1堆内存分为Eden、Survivor、Old、Humongous四类,年轻代占整堆的5%,如果堆内存大小是4个G,年轻代应该占200M左右(-XX:G1NewSizePercent参数可以设置年轻代占比),在运行的过程中会不断给年轻代增加Region,但新生代最多不超过整堆的60%(-XX:G1MaxNewSizePercent可以调整年轻代最大占比),Eden区和Survivor区还是默认遵循8:1:1
一个Region之前是年轻代,如果Region被回收可能又变成老年代
G1有专门存放大对象的Region叫Humongous区,大对象不会进入到老年代的Region(减少gc开销),一般对象超过一个Region区的50%,就会放到Humongous中,如果一个对象太大,会横跨多个Region存储
二、垃圾收集分类
1、YoungGC
G1计算Eden区回收时间接近指定的最大停顿时间(-XX:MaxGCPauseMills参数设置),就会触发YoungGC
2、MixedGC
当老年代达到堆占比时会触发,回收所有年轻代和部分老年代(为了满足最大停顿时间回收效率高的Region)以及大对象区,正常情况G1的垃圾收集是先做MixedGC,主要使用复制算法,如果没有足够空的Region供复制对象就会触发一次Full GC
3、Full GC
暂停用户线程,开启单线程进行标记、清除和压缩整理
三、垃圾收集过程
- 初始标记(init mark, STW):暂停用户线程,并记录GC Roots直接能引用的对象,速度很快
- 并发标记(Concurrent Mark):同CMS并发标记
- 最终标记(Remark, STW):同CMS重新标记
- 筛选回收(Cleanup, STW):会对各个Region回收成本进行排序,根据设定的最大停顿时间(-XX:MaxGCPauseMillis指定)来制定回收计划,因为这部分回收时间是可控的所以没有让用户线程和gc线程并发执行,G1采用的是复制算法,不会像CMS那样回收完有很多内存碎片(注意:CMS回收阶段是跟用户线程一起并发执行的,G1因为内部实现太复杂暂时没实现并发回收,不过到了ZGC,Shenandoah就实现了并发收集,Shenandoah可以看成是G1的升级版本)
G1收集器在后台维护了一个优先列表,每次根据允许的收集时间,优先选择回收价值最大的Region(这也就是它的名字Garbage-First的由来),比如一个Region花200ms能回收10M垃圾,另外一个Region花50ms能回收20M垃圾,在回收时间有限情况下,G1当然会优先选择后面这个Region回收
四、使用建议
1、G1收集器参数设置
- -XX:+UseG1GC:使用G1收集器
- -XX:ParallelGCThreads:指定GC工作的线程数量
- -XX:G1HeapRegionSize:指定分区大小(1MB~32MB,且必须是2的N次幂),默认将整堆划分为2048个分区
- -XX:MaxGCPauseMillis:目标暂停时间(默认200ms)
- -XX:G1NewSizePercent:新生代内存初始空间(默认整堆5%,值配置整数,默认就是百分比)
- -XX:G1MaxNewSizePercent:新生代内存最大空间
- -XX:TargetSurvivorRatio:Survivor区的填充容量(默认50%),Survivor区域里的一批对象(年龄1+年龄2+年龄n的多个年龄对象)总和超过了Survivor区域的50%,此时就会把年龄n(含)以上的对象都放入老年代(对象动态年龄判断机制)
- -XX:MaxTenuringThreshold:最大年龄阈值(默认15)
- -XX:InitiatingHeapOccupancyPercent:老年代占用空间达到整堆内存阈值(默认45%),则执行新生代和老年代的混合收集(MixedGC),比如我们之前说的堆默认有2048个region,如果有接近1000个region都是老年代的region,则可能就要触发MixedGC了
- -XX:G1MixedGCLiveThresholdPercent(默认85%) region中的存活对象低于这个值时才会回收该region,如果超过这个值,存活对象过多,回收的的意义不大。
- -XX:G1MixedGCCountTarget:在一次回收过程中指定做几次筛选回收(默认8次),在最后一个筛选回收阶段可以回收一会,然后暂停回收,恢复系统运行,一会再开始回收,这样可以让系统不至于单次停顿时间过长。
- -XX:G1HeapWastePercent(默认5%): gc过程中空出来的region是否充足阈值,在混合回收的时候,对Region回收都是基于复制算法进行的,都是把要回收的Region里的存活对象放入其他Region,然后这个Region中的垃圾对象全部清理掉,这样的话在回收过程就会不断空出来新的Region,一旦空闲出来的Region数量达到了堆内存的5%,此时就会立即停止混合回收,意味着本次混合回收就结束了。
2、优化建议
- -XX:MaxGCPauseMills参数如果设置很大,时间跨度就会很长,这个时间年轻代已经放了很多对象了,触发YoungGC存活下来的对象可能就会很多,加上对象动态年龄判断机制Survivor区也有一部分也会进入老年代,会导致MixedGC频繁触发
- -XX:MaxGCPauseMills参数如果设置很小,那么一次回收的对象就会比较少,迟早会触发Full GC
3、什么场景适合使用G1
- 50%以上的堆被存活对象占用
- 对象分配和晋升的速度变化非常大
- 垃圾回收时间特别长,超过1秒
- 8GB以上的堆内存(建议值)
- 停顿时间是500ms以内