1.回收算法
1.1 标记-清除算法(Mark-Sweep)
分为两个阶段,标注和清除。标记阶段标记出所有需要回收的对象,清除阶段回收被标记的对象所占用的空间。
该算法最大的问题是内存碎片化严重,后续可能发生大对象不能找到可利用空间的问题。
1.2 复制算法(Copying)
按内存容量将内存划分为等大小的两块。每次只使用其中一块,当这一块内存满后将尚存活的对象复制到另一块上去,把已使用的内存清掉。
这种算法虽然实现简单,内存效率高,不易产生碎片,但是最大的问题是可用内存被压缩到了原本的一半。且存活对象增多的话,Copying算法的效率会大大降低。
1.3 标记-整理算法(Mark-Compact)
标记后不是清理对象,而是将存活对象移向内存的一端。然后清除端边界外的对象。
2.HotSpot虚拟机的垃圾收集器
展示了7种作用于不同分代的收集器,如果两个收集器之间存在连线,就说明它们可以搭配使用。虚拟机所处的区域,则表示它是属于新生代收集器还是老年代收集器。
2.1 新生代的收集器
Serial 收集器(复制算法)
新生代单线程收集器,标记和清理都是单线程,
优点:
简单高效:对于有限的资源环境,Serial 收集器由于其简单的算法和单线程的执行方式,在垃圾收集上能够达到一定的效率。
易于实现:没有多线程间同步的复杂性,使得Serial 收集器相对容易实现和维护。
缺点:
停顿时间:所有工作线程在垃圾收集时都需要暂停,这可能导致应用响应时间变长,特别是堆内存较大时,GC停顿时间会更加明显。
不适合多核处理器:在多核处理器系统上,由于Serial 收集器只能使用单个核心进行垃圾收集,无法充分利用现代硬件资源。
Serial/Serial Old收集器运行示意图
ParNew 收集器 (复制算法)
新生代并行收集器,实际上是 Serial 收集器的多线程版本
使用-XX:+UseParNewGC(新生代使用并行收集器,老年代使用串行回收收集器) 或者-XX:+UseConcMarkSweepGC(新生代使用并行收集器,老年代使用 CMS)
优点:
- 多线程收集:ParNew 收集器能够并行地使用多个线程进行垃圾收集,这使得它在多核处理器上相较于 Serial 收集器具有更好的性能表现。
- 适合多核环境:随着现代服务器通常配备多核处理器,ParNew 收集器能够更有效地利用这些处理器资源,提高垃圾收集的效率。
- 与CMS兼容:ParNew 收集器经常与老年代的 Concurrent Mark Sweep (CMS) 收集器配合使用,为需要低停顿时间且具有多核处理器的应用提供了一种有效的垃圾收集解决方案。
- 适用于交互式应用:由于 ParNew 收集器能够减少垃圾收集时的停顿时间,它特别适合于对响应时间有较高要求的交互式应用。
缺点:
- 消耗更多的CPU资源:虽然 ParNew 收集器通过并行收集减少了停顿时间,但这也意味着在垃圾收集过程中会使用更多的CPU资源,可能会对应用程序的其他部分造成影响。
- 配置和调优复杂:ParNew 收集器的配置和调优相对于 Serial 收集器更加复杂,需要合理设置并行线程数等参数以达到最佳性能。
- 停顿时间仍存在:尽管 ParNew 收集器减少了垃圾收集的停顿时间,但在进行垃圾收集时,仍然需要暂停所有工作线程(Stop-The-World),在大堆内存的情况下,这可能仍然导致明显的停顿。
- 在JDK 9+中被淘汰:随着G1收集器的引入和成为默认的垃圾收集器,ParNew 加 CMS 的组合在 JDK 9 及之后的版本中不再是主流选择,因为 G1 提供了更平衡的吞吐量和停顿时间,以及更简单的调优过程。
ParNew/Serial Old收集器运行示意图
Parallel Scavenge 收集器 (复制算法)
新生代并行收集器, 追求高吞吐量, 高效利用 CPU
-XX:MaxGCPauseMillis 配置最大垃圾收集停顿时间 -XX:GCTimeRatio 配置吞吐量大小
并行垃圾回收器在进行垃圾回收时, 同样会持有所有应用程序的线程, 并冻结所有应用程序线程,来进行垃圾回收工作
优点:
- 高吞吐量:Parallel Scavenge 收集器注重达到一个可控制的吞吐量(Throughput),它使用多个线程并行执行垃圾收集操作,可以充分利用多核CPU的计算能力,从而实现高吞吐量的垃圾收集。这使得它非常适合处理大规模数据和对处理能力要求较高的应用。
- 快速回收:该收集器主要关注减少垃圾收集时的停顿时间,通过将垃圾收集任务划分为多个阶段,并使用多个线程并行执行,可以更快地完成垃圾收集,并尽量减少应用程序的暂停时间。
- 可控制的吞吐量和最大停顿时间:Parallel Scavenge 收集器提供了一些参数来精确控制吞吐量和最大停顿时间的平衡。可以根据应用程序的性能需求来调整这些参数,以达到最佳的垃圾收集性能。
缺点:
- 高延迟:由于 Parallel Scavenge 收集器注重吞吐量而非低延迟,因此在追求高吞吐量的同时,可能会导致垃圾收集的停顿时间相对较长。这对于某些对实时性要求较高的应用程序可能不太适合。
- 内存占用:Parallel Scavenge 收集器为了追求高吞吐量,通常会使用较大的堆空间来存储对象,并且不会立即释放未使用的内存。这可能导致在某些情况下,垃圾收集器无法及时回收所有可回收的内存,从而造成一定的内存浪费。
Parallel Scavenge/Parallel Old收集器运行示意图
2.2 老年代的收集器
Serial Old 收集器 (标记-整理算法)
老年代单线程收集器,Serial 收集器的老年代版本,使用“标记-整理”(Mark-Compact)算法来进行垃圾收集。在标记阶段,它会遍历堆内存,标记出所有可达的对象;然后在整理阶段,将所有存活的对象向一端移动,从而清理出连续的空闲内存空间,减少内存碎片。
优点:
- 简单高效:对于单核处理器或者小内存资源的应用,Serial Old 收集器因为其简单和直接的垃圾回收方式,在这类环境下可以非常高效。
- 易于实现和调试:由于只涉及单线程操作,使得 Serial Old 收集器相对容易实现和调试。
缺点:
- 停顿时间长:所有应用线程都必须在垃圾收集期间暂停,这可能导致较长的停顿时间,影响到应用的响应速度和吞吐量。
- 不适合多核处理器:在多核处理器系统上,Serial Old 收集器无法充分利用硬件资源,因此并不适合大型、多线程的服务器端应用。
Serial/Serial Old收集器运行示意图
Parallel Old 收集器 (标记-整理算法)
老年代并行收集器, 吞吐量优先, Parallel Scavenge收集器的老年代版本
特点
- 多线程:Parallel Old 收集器同样采用多线程进行垃圾回收,这意味着它可以充分利用多核心处理器的优势,提高垃圾收集的效率。
- 算法:它使用“标记-整理”(Mark-Compact)算法来处理老年代的垃圾收集。与“标记-清除”(Mark-Sweep)算法相比,“标记-整理”算法在完成垃圾收集后不会留下空间碎片,从而避免了长时间运行后可能出现的内存分配问题。
- 适用场景:Parallel Old 收集器适用于多核服务器环境中,对吞吐量有较高要求的场景。它能够提供比CMS更好的吞吐量,但在停顿时间上可能不如CMS收集器和G1收集器
Parallel Scavenge/Parallel Old收集器运行示意图
CMS(Concurrent Mark Sweep)收集器(标记-清除算法)
收集器是一种以获取最短回收停顿时间为目标的垃圾收集器,主要用于收集老年代的垃圾。它适用于对响应时间有较高要求的场景,通过并发标记和清除来实现减少停顿时间的目的。
整个过程分为4个步骤,包括:
1.初始标记(CMS initial mark)
- 特点:这是一个需要“Stop-The-World”(STW)的阶段,但其持续的时间相对较短。
- 工作内容:标记所有直接与GC Roots相连的对象,以及从年轻代到老年代的引用对象(跨代引用)。此阶段虽然停顿时间短,但需要暂停所有应用线程。
2.并发标记(CMS concurrent mark)
- 特点:在这个阶段,GC线程和应用线程可以并发运行,不需要暂停应用线程。
- 工作内容:从初始标记阶段找到的根对象开始遍历整个对象图,标记所有可达的存活对象。由于在并发标记过程中应用线程仍在运行,可能会改变对象引用关系,因此需要记录这些改变。
3.重新标记(CMS remark)
- 特点:这也是一个需要STW的阶段,但CMS采用了多种技术(如增量更新、原始快照等)来缩短这一阶段的停顿时间。
- 工作内容:修正并发标记阶段因程序运行导致的标记记录变动。为了减少停顿时间,CMS在这个阶段使用了算法,如增量更新(Incremental Update)和原始快照(SATB,Snapshot At The Beginning),来处理并发阶段遗留的问题。
4.并发清除(CMS concurrent sweep)
- 特点:应用线程和垃圾收集线程可以并发执行,不需要暂停应用线程。
- 工作内容:清理掉在标记阶段标记为已死亡的对象,并回收他们占用的内存空间。这一阶段结束后,CMS收集器将已经清理好的内存空间归还给JVM使用。
但是CMS还远达不到完美的程度,它有以下3个明显的缺点:
- CMS收集器对CPU资源非常敏感。
- CMS收集器无法处理浮动垃圾(Floating Garbage),
- CMS收集结束时会有大量空间碎片产生。
Concurrent Mark Sweep收集器运行示意图
2.3 整个堆
G1(Garbage First)收集器 (标记-整理算法)
G1 回收的范围是整个 Java 堆(包括新生代,老年代)
G1具备如下特点。
- 并行与并发:G1能充分利用多CPU、多核环境下的硬件优势,使用多个CPU(CPU或者CPU核心)来缩短Stop-The-World停顿的时间,部分其他收集器原本需要停顿Java线程执行的GC动作,G1收集器仍然可以通过并发的方式让Java程序继续执行。
- 分代收集:与其他收集器一样,分代概念在G1中依然得以保留。虽然G1可以不需要其他收集器配合就能独立管理整个GC堆,但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的旧对象以获取更好的收集效果。
- 空间整合:与CMS的“标记—清理”算法不同,G1从整体来看是基于“标记—整理”算法实现的收集器,从局部(两个Region之间)上来看是基于“复制”算法实现的,但无论如何,这两种算法都意味着G1运作期间不会产生内存空间碎片,收集后能提供规整的可用内存。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。
- 可预测的停顿:这是G1相对于CMS的另一大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒,这几乎已经是实时Java(RTSJ)的垃圾收集器的特征了。
G1收集器的运作大致可划分为以下几个步骤:
1.初始标记(Initial Marking)
- 特点:此阶段需要暂停所有的应用线程(Stop-The-World, STW),但持续时间相对较短。
- 工作内容:标记从GC Roots直接可达的对象,以及年轻代中存活对象的边界。
2.根区域扫描(Root Region Scanning)
- 特点:在应用线程运行的同时执行,不需要暂停应用线程。
- 工作内容:处理初始标记阶段找到的存活对象所引用的对象。这一步骤必须在年轻代的下一次垃圾收集前完成。
3.并发标记(Concurrent Marking)
- 特点:与应用线程并发执行,不会导致应用线程停顿。
- 工作内容:从根区域扫描阶段标记的对象开始,遍历整个堆,标记出所有可达的存活对象。
4.最终标记(Final Marking)
- 特点:需要STW,但通过优化(如使用记忆集和卡表来减少标记范围)尽量缩短停顿时间。
- 工作内容:处理并发标记阶段遗留的少量工作,如处理SATB(Snapshot At The Beginning)队列中的剩余对象,以及修正并发标记期间因应用程序运行产生的变动。
5.筛选回收(Live Data Counting and Evacuation)
- 特点:需要STW,此阶段的停顿时间是G1收集器控制的重点。
- 工作内容:根据之前的标记结果,选择一部分内存区域进行清理。G1会优先选择回收价值最大的区域(即垃圾最多的区域)进行清理,以提高垃圾收集的效率。在这个阶段,存活的对象会被移动到其他区域,同时整理碎片,释放空间。
G1收集器运行示意图