堆空间的基本结构
Java 的自动内存管理主要是针对对象内存的回收和对象内存的分配。同时,Java 自动内存管理最核心的功能是 堆 内存中对象的分配与回收。
Java 堆是垃圾收集器管理的主要区域,因此也被称作 GC 堆(Garbage Collected Heap)。
从垃圾回收的角度来说,由于现在收集器基本都采用分代垃圾收集算法,所以 Java 堆被划分为了几个不同的区域,这样我们就可以根据各个区域的特点选择合适的垃圾收集算法。
在 JDK 7 版本及 JDK 7 版本之前,堆内存被通常分为下面三部分:
- 新生代内存(Young Generation)
- 老生代(Old Generation)
- 永久代(Permanent Generation)
下图所示的 Eden 区、两个 Survivor 区 S0 和 S1 都属于新生代,中间一层属于老年代,最下面一层属于永久代。
JDK 1.8 及之后 PermGen(永久代) 已被 Metaspace(元空间) 取代,元空间使用的是直接内存 。
关于Java内存区域的详细介绍,请移步观看JVM面试题详解系列——JVM内存区域详解。
内存分配和回收原则
对象优先在 Eden 区分配
大多数情况下,对象在新生代的 Eden 区分配。当 Eden 区没有足够的空间是,虚拟机将发起一次 MinorGC。
长期存活的对象将进入老年代
既然虚拟机采用了分代回收的思想来管理内存,那么就必须识别哪些对象应该放在新生代,哪些对象应该放在老年代。为了做到这一点,虚拟机给每个对象一个对象年龄(Age)计数器。
大多谁情况下,对象首先在 Eden 区分配。如果对象在 Eden 区出生,并且经历了一次 Minor GC 后仍能够存活,并且能够被 Survivor 区容纳,将被移动到 Survivor 区(S0 或 S1),并将对象年龄设为1(Eden 区 -> Survivor 区后对象的初始年龄变为 1)。
对象在 Survivor 中每熬过一次 MinorGC,年龄就增加 1 岁,当它的年龄增加到一定程度(晋升老年代的年龄阈值—MaxTenuringThreshold),就会被晋升到老年代中。对象晋升到老年代的年龄阈值,可以通过参数 -XX:MaxTenuringThreshold 来设置。
Hotspot 遍历所有对象时,按照年龄从小到大对其所占用的内存大小进行累积, 当累积到某个年龄时,对象所占用的内存大小超过了 survivor 区的50时
(默认值是 50%, 可以通过 -XX:TargetSurvivorRatio=percent 来设置),取这个年龄和 MaxTenuringThreshold 中更小的一个值,
作为新的晋升老年代的年龄阈值
注意: 默认晋升到老年代的年龄阈值取决于所使用的垃圾回收器,一般是 15,但是 CMS 是 6。
大对象直接进入到老年代
大对象就是指需要大量连续内存空间的对象(比如:字符串、数组)。
大对象直接进入老年代主要是为了避免为大对象分配内存时由于分配担保机制带来的复制而降低效率。
GC分类
针对 HotSpot VM 的实现,它里面的 GC 其实准确分类只有两大种:
部分收集 (Partial GC):
- 新生代收集(Minor GC / Young GC):只对新生代进行垃圾收集;
- 老年代收集(Major GC / Old GC):只对老年代进行垃圾收集。需要注意的是 Major GC 在有的语境中也用于指代整堆收集;
- 混合收集(Mixed GC):对整个新生代和部分老年代进行垃圾收集。
整堆收集 (Full GC): 收集整个 Java 堆和方法区。
空间分配担保
空间分配担保是为了确保在 Minor GC 之前老年代本身还有容纳新生代所有对象的剩余空间。
JDK 6 Update 24 之前,在发生 Minor GC 之前,虚拟机必须先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那这一次 Minor GC 可以确保是安全的。
如果不成立,虚拟机会先查看 -XX:HandlePromotionFailure 参数的设置值是否允许担保失败(Handle Promotion Failure); 如果允许,那会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试进行一次 Minor GC,尽管这次 Minor GC 是有风险的; 如果小于,或者 -XX: HandlePromotionFailure 设置不允许冒险,那这时就要改为进行一次 Full GC。
JDK 6 Update 24 之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小,就会进行 Minor GC,否则将进行 Full GC。
为什么会出现空间分配担保机制呢?
因为 Survivor 区的对象每进行一次 Minor GC 后,存活的对象年龄会加 1 ,如果某些对象的年龄增长到晋升老年代的年龄阈值,这些对象就会进入到老年代中。假设一种极端的情况,新生代的所有对象都集中在 Survivor 区,并且经过某次 Minor GC 后所有的对象都还存活,并且都达到了晋升老年代的年龄阈值,那么就意味着所有的新生代对象都将进入老年代,所以此时老年代必须还有容纳新生代所有对象的剩余空间,这次 Minor GC 才能安全进行。
死亡对象判断方法
堆中几乎存放着所有的对象实例,对堆进行垃圾回收的第一步就是要判断哪些对象已经死亡(即不能再被任何途径使用的对象)。
引用计数器法
给对象添加一个引用计数器
- 每当有一个地方引用对象,计数器就加 1。;
- 当某个引用失效,计数器就减 1;
- 任何时候计数器为 0 的对象就是不可能再被使用的。
这个方法实现简单,效率高,但是目前主流的虚拟机中并没有选择这个算法来管理内存,其最主要的原因是它很难解决对象之间相互循环引用的问题。
所谓对象之间的相互引用问题,如下面代码所示:除了对象 objectA 和 objectB 相互引用着对方之外,这两个对象之间再无任何引用。但是他们因为互相引用对方,导致它们的引用计数器都不为 0,于是引用计数算法无法通知 GC 回收器回收他们。
public class TestA {
Object instance = null;
public static void main(String[] args) {
TestA objectA = new TestA();
TestA objectB = new TestA();
objectA.instance = objectB;
objectB.instance = objectA;
}
解释: 此时,objectA 被 objectB 引用,objectB 被 objectA 引用。如果想要回收 objectA 就要先回收 objectB,让 objectB 释放对 objectA 的引用,但是 objectB 又被 objectA 引用,如果想要回收 objectB 就要先回收 objectA,让 objectA 释放对 objectB 的引用。二者之间相互循环引用,这样程序运行结束垃圾回收器也无法回收这两个对象。
可达性分析算法
这个算法的基本思想就是通过一系列称为 “GC Roots” 的节点作为起点,从这些节点开始向下搜索,搜索节点过程所走过的路径被称为引用链,当一个对象到 “GC Roots” 节点没有任何引用链与之相连,则证明这个对象是不可用的,需要被回收。
下图中的 Object5 ~ Object7 之间虽有引用关系,但它们到 GC Roots 不可达,因此为需要被回收的对象。
哪些对象可以作为 GC Roots 呢?
可作为GC Roots的节点主要在全局性的引用(例如常量或类静态属性)与执行上下文(例如栈帧中的本地变量表)中。
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 本地方法栈(Native 方法)中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 所有被同步锁持有的对象
对象可以被回收,就代表一定会被回收吗?
当一个对象在可达性分析时被判定为不可达对象时,不会马上被回收,还需要进行两次标记。
第一次标记:判断当前对象是否有 finalize() 方法并且该方法没有被执行过,若不存在则标记为垃圾对象,等待回收;若有的话,并且该方法没有被执行,则进行第二次标记;
第二次标记将当前对象放入 F-Queue 队列,并生成一个 finalize 线程去执行该方法,虚拟机不保证该方法一定会被执行,这是因为如果线程执行缓慢或进入了死锁,会导致回收系统的崩溃;
如果执行了 finalize() 方法之后仍然没有与 GC Roots 有直接或者间接的引用,则该对象会被回收。
被引用的对象就一定能存活吗?
不一定,看 Reference 类型,弱引用在 GC (不论内存是否充足) 时会被回收,软引用在内存不足的时候,即 OOM 前会被回收。
引用类型总结
强引用(StrongReference)
以前我们使用的大部分引用实际上都是强引用,这是使用最普遍的引用。如果一个对象具有强引用,那就类似于必不可少的生活用品,垃圾回收器绝不会回收它。当内存空间不足,Java 虚拟机宁愿抛出 OutOfMemoryError 错误,使程序异常终止,也不会靠随意回收具有强引用的对象来解决内存不足问题。
软引用(SoftReference)
如果一个对象只具有软引用,那就类似于可有可无的生活用品。如果内存空间足够,垃圾回收器就不会回收它,如果内存空间不足了,就会回收这些对象的内存。只要垃圾回收器没有回收它,该对象就可以被程序使用。
软引用可用来实现内存敏感的高速缓存。
软引用可以和一个引用队列(ReferenceQueue)联合使用,如果软引用所引用的对象被垃圾回收,JAVA 虚拟机就会把这个软引用加入到与之关联的引用队列中。
弱引用(WeakReference)
如果一个对象只具有弱引用,那就类似于可有可无的生活用品。
弱引用与软引用的区别在于:只具有弱引用的对象的生命周期更加短暂。在垃圾回收器线程扫描它所管辖的内存区域的过程中,一旦发现了只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存。
不过,由于垃圾回收器是一个优先级很低的线程, 因此不一定会很快发现那些只具有弱引用的对象。、
弱引用可以和一个引用队列(ReferenceQueue)联合使用,如果弱引用所引用的对象被垃圾回收,Java 虚拟机就会把这个弱引用加入到与之关联的引用队列中。
虚引用(PhantomReference)
"虚引用"顾名思义,就是形同虚设,与其他几种引用都不同,虚引用并不会决定对象的生命周期。如果一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收。
虚引用主要用来跟踪对象被垃圾回收的活动。
虚引用与软引用和弱引用的区别
虚引用必须和引用队列(ReferenceQueue)联合使用。当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象的内存之前,把这个虚引用加入到与之关联的引用队列中。
程序可以通过判断引用队列中是否已经加入了虚引用,来了解被引用的对象是否将要被垃圾回收。程序如果发现某个虚引用已经被加入到引用队列,那么就可以在所引用的对象的内存被回收之前采取必要的行动。
特别注意,在程序设计中一般很少使用弱引用与虚引用,使用软引用的情况较多,这是因为软引用可以加速 JVM 对垃圾内存的回收速度,可以维护系统的运行安全,防止内存溢出(OutOfMemory)等问题的产生。
如何判断一个常量是废弃常量?
运行时常量池主要回收的是废弃的常量。那么,我们如何判断一个常量是废弃常量呢?
JDK1.7 之前运行时常量池逻辑包含字符串常量池,被存放在方法区, 此时 hotspot 虚拟机对方法区的实现为永久代
JDK1.7 字符串常量池被从方法区拿到了堆中, 这里没有提到运行时常量池,也就是说字符串常量池被单独拿到堆,运行时常量池剩下的东西还在方法区,
也就是 hotspot 中的永久代 。
JDK1.8 hotspot 移除了永久代用元空间(Metaspace)取而代之, 这时候字符串常量池还在堆, 运行时常量池还在方法区,
只不过方法区的实现从永久代变成了元空间(Metaspace)。
假如在字符串常量池中存在字符串 “abc”,如果当前没有任何 String 对象引用该字符串常量的话,就说明常量 “abc” 就是废弃常量,如果这时发生内存回收的话而且有必要的话,“abc” 就会被系统清理出常量池了。
如何判断一个类是无用的?
方法区主要回收的是无用的类,那么如何判断一个类是无用的类的呢?
要判定一个类是“无用的类”,类需要同时满足下面 3 个条件才能算是 “无用的类” :
- 该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。
- 加载该类的
ClassLoader
已经被回收。 - 该类对应的
Java.lang.Class
对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。