面试官:JVM是如何判定对象已死的?学JVM必会的知识!

news2024/11/13 11:00:00

本文已收录至GitHub,推荐阅读 👉 Java随想录

文章目录

    • 引用计数算法
    • 可达性分析算法
    • 引用类型
    • Dead Or Alive
    • 永久代真的"永久"吗?
    • 垃圾收集算法
      • 标记-清除算法
      • 标记-复制算法
      • 标记-整理算法
      • 标记-清除 VS 标记-整理

作为一名Java程序员,我们每天都在程序里不停地去new对象,但是你知道这些被new出来的对象,最后是怎么被回收的吗?

在堆里面存放着Java世界中几乎所有的对象实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象之中哪些还「存活」着,哪些已经「死去」(“死去”即不可能再被任何途径使用的对象)。

JVM必然是有自己的一套方法来判断哪些对象该回收,哪些不该回收。

本篇文章就来聊聊这个话题。

引用计数算法

这种算法的工作原理是这样的:在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的

客观的说,引用计数算法虽然占用了一些额外的内存空间来计数,但原理简单,效率也很高。

但是目前主流的Java虚拟机里面都没有选用引用计数法来进行内存管理,why?

主要原因是,引用计数算法很难解决对象之间相互「循环引用」的问题。下面放段代码,举个例子:

public class MyObject {
    public Object ref = null;
    public static void main(String[] args) {
        MyObject myObject1 = new MyObject();
        MyObject myObject2 = new MyObject();
        myObject1.ref = myObject2;
        myObject2.ref = myObject1;
        myObject1 = null;
        myObject2 = null;
    }
}

这段代码里定义了一个类MyObject,只有一个成员变量ref
当设置myObject1 = nullmyObject2 = null后,仅仅是清除了myObject1myObject2变量所持有的引用。并没有影响到myObject1对象内部的ref字段和myObject2对象内部的ref字段,它们仍然在相互引用。

我们可以看出myObject1myObject2这两个对象除互相引用外再无任何引用,实际上这两个对象已经不可能再被访问,但是它们因为互相引用着对方,导致它们的引用计数都不为零,引用计数算法也就无法回收它们,这就是循环引用问题。

有点类似死锁的概念,A和B互相持有,谁也不释放,直接卡住。

通过这个例子我们可以看出引用计数法是存在弊端的。

所以HotSpot虚拟机并不是通过引用计数算法来判断对象是否存活的,使用的是「可达性分析算法」。

可达性分析算法

JVM通过可达性分析(Reachability Analysis)算法来判定对象是否存活的。

这个算法的基本思路就是通过一系列称为GC Roots的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索。
搜索过程所走过的路径称为引用链(Reference Chain)如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的

如图,对象object 5、object 6、object 7到GC Roots是不可达的,因此它们将会被判定为可回收的对象。

上文提到的GC Roots,我们可以认为是起点,而在JVM里面,固定可以作为GC Roots的对象包括以下几种:

  • 在虚拟机栈(栈中 的本地变量表)中引用的对象,例如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。
  • 在方法区中常量引用的对象,例如字符串常量池(String Table)里的引用。
  • 在本地方法栈中JNI(本地方法)引用的对象。
  • Java虚拟机内部的引用,如基本数据类型对应的Class对象,一些常驻的异常对象(NullPointException、OutOfMemoryError)等,以及系统类加载器。
  • 所有被同步锁(synchronized)持有的对象。
  • 反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

通过枚举一个一个根节点(GC Roots),然后顺藤摸瓜一路摸下来,然后没摸到的那些对象,也就是不存在引用的对象就把它咔嚓回收了。这个过程称之为「根节点枚举」。

目前所有的垃圾收集器在根节点枚举这一步骤时都是必须暂停用户线程的,也就是必须会有STW(Stop the Wrold)。
这里面细讲东西很多,先埋个坑,后续会有文章专门来讲根节点枚举。

上面我们讲了可达性分析算法是根据引用来回收的,而对不同的引用类型有不同的处理方式,JVM也是会去「差别对待的」。

引用类型

Java将引用分为强引用(Strongly Re-ference)软引用(Soft Reference)弱引用(Weak Reference)虚引用(Phantom Reference)4种,这4种引用强度依次逐渐减弱。

  • 强引用是最传统的“引用”的定义,在程序代码之中普遍存在,即类似Object obj=new Object()这种引用关系。如果一个对象具有强引用,那就类似于"必不可少的生活用品"。只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。

  • 软引用是用来描述一些还有用,但非必须的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。在JDK 1.2版之后提供了SoftReference类来实现软引用。

  • 弱引用也是用来描述那些非必须对象,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2版之后提供了WeakReference类来实现弱引用。

  • 虚引用是最弱的一种引用关系。如果一个对象仅持有虚引用,那么它就和没有任何引用一样,随时都可能被垃圾回收器回收,无法通过虚引用来取得一个对象实例。虚引用主要用来跟踪对象被垃圾回收器回收的活动,比如确保某个资源被finalize后,做一些后续的清理工作。在JDK 1.2版之后提供了PhantomReference类来实现虚引用。

上面巴拉巴拉说了一堆话,我知道你们肯定不爱看,也记不住。所以铁子,我总结成一句话,你听这句话就够了。

总结一句话就是:强引用内存不足也不会回收,软引用内存不足才回收,弱引用和虚引用看见就回收

看到这里有个疑问,在可达性分析算法中判定为不可达的对象,就一定「非死不可」吗?

Dead Or Alive

当一个对象被判断为不可达的时候,这时候该对象处在「缓刑」阶段。

意思就是说刀已经架你脖子上了,但是还没落下来,还是有商量的余地的。

要真正宣告一个对象死亡,至少要经历两次标记过程

如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记,随后进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法

假如对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,那么虚拟机将这两种情况都视为“没有必要执行”。

如果这个对象被判定为确有必要执行finalize()方法,那么该对象将会被放置在一个名为F-Queue的队列之中,并在稍后由一条由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize()方法

这里所说的“执行”是指虚拟机会触发这个方法开始运行,但并不承诺一定会等待它运行结束。

这样做的原因是,如果某个对象finalize()方法执行缓慢,或者更极端地发生了死循环,将很可能导致F-Queue队列中的其他对象永久处于等待,卡死在这里。甚至导致整个内存回收子系统的崩溃。

finalize()方法是对象逃脱死亡命运的最后一次机会,救命的最后一根稻草,稍后收集器将对F-Queue中的对象进行第二次小规模的标记。

如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移出「即将回收」的集合。

如果对象这时候还没有逃脱,那基本上它就真的要被回收了,就真要说byebye了

需要注意的是:任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,不能指望我每次都救你,我只能救你一次,剩下的就靠你自己了

看起来对象能够使用finalize()方法实现自我救赎,然而这个方法并没有什么用,放一段《深入理解Java虚拟机》里的原话:

总结一下,就是finalize()这个方法并没什么卵用,大家还是把他忘了好

对象的回收行为主要发生在新生代和老年代,那么有兄弟可能会问了,永久代有垃圾回收行为吗?

永久代真的"永久"吗?

注意一下,这里说的永久代,主要还是针对于Java 8以前,在Java 8以及之后的版本中,永久代被元数据区(Metaspace)取代。

永久代和方法区和元空间的关系可能有点混乱,稍微提一嘴:方法区是由Java虚拟机规范定义的一个逻辑区域,是个逻辑上的概念,而永久代和元空间则是HotSpot对方法区的两种不同实现

一图胜千言,直接上图。

有些人认为方法区(如HotSpot虚拟机中的元空间或者永久代)是没有垃圾收集行为的,但其实方法区是可以被回收的,只不过回收的判定条件过于苛刻,垃圾收集的成果很差

并不是名字叫永久代就真的「永久」了,出来混,欠的债总要还的

我们先搞清楚方法区要回收的是什么,方法区的垃圾收集主要回收两部分内容:「废弃的常量」和「不再使用的类型」。

判定一个常量是否“废弃”还是相对简单,看这个常量有没有在用就行了,而要判定一个类型是否属于「不再被使用的类」的条件就比较苛刻了。需要同时满足下面三个条件(注意是同时!):

  • 该类所有的实例都已经被回收,也就是Java堆中不存在该类及其任何派生子类的实例。
  • 加载该类的类加载器已经被回收,这个条件除非是经过精心设计的可替换类加载器的场景,如OSGi、JSP的重加载等,否则通常是很难达成的。
  • 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

Java虚拟机被允许对满足上述三个条件的无用类进行回收,这里说的仅仅是“被允许”,而并不是和对象一样,没有引用了就必然会回收。

关于是否要对类型进行回收,HotSpot虚拟机提供了-Xnoclassgc参数进行控制。

对于Oracle的HotSpot JVM,这个参数默认是不开启的,意味着默认情况下,类元数据可以被垃圾收集器回收。如果你明确使用了 -Xnoclassgc 参数来启动JVM,那么就会禁止类的垃圾回收。

也就是说如果没有开启这项参数支持类型的卸载,哪怕满足了所有条件,也不会进行类型的卸载

上面我们讲了对象回收的条件,知道了回收的条件之后,我们再讲讲怎么被回收,也就是垃圾回收算法。

这块可是面试重点,面试问到JVM这块少不了要被教育一番,大家好好听,下次可以跟面试官对波线。

垃圾收集算法

垃圾收集(Garbage Collection,GC)算法是Java虚拟机(JVM)用来自动管理内存的一种方式。主要的目标是找出那些已经不再使用的对象,并释放它们所占用的内存空间。

通俗来说就是发现垃圾之后怎么收垃圾,是打包带走,还是来个垃圾分类

标记-清除算法

标记-清除算法是最早出现也是最基础的垃圾收集算法。

它分为「标记」和「清除」两个阶段:首先标记出所有需要回收的对象,在标记完成后,统一回收掉所有被标记的对象,也可以反过来,标记存活的对象,统一回收所有未被标记的对象

下图为使用“标记-清除”算法回收前后的状态:

  • 优点:不需要进行对象的移动,在存活对象比较多的情况下非常高效。

  • 缺点:标记-清除算法主要缺点有两个:

    第一个是执行效率不稳定,如果Java堆中包含大量对象,而且其中大部分是需要被回收的,这时必须进行大量标记和清除的动作。

    第二个是内存空间的碎片化问题,标记、清除之后会产生大量不连续的「内存碎片」,而内存碎片是无法被分配对象的,内存碎片太多可能会导致当以后在程序运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

第一个问题其实还好,但是第二个内存碎片是个大问题,无法容忍。试想一下就跟你打游戏,玩着越来越卡,玩一秒卡二秒,这还怎么玩?

所以后续的收集算法大多都是以标记-清除算法为基础,改进了内存碎片的问题,对其缺点进行改进而得到的

标记-复制算法

为了解决标记-清除算法面对大量可回收对象时执行效率低的问题,1969年Fenichel提出了一种称为「半区复制(Semispace Copying)」的垃圾收集算法。

它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉

如果内存中多数对象都是存活的,这种算法将会产生大量的内存间复制的开销,但对于多数对象都是可回收的情况,算法需要复制的就是占少数的存活对象,而且每次都是针对整个半区进行内存回收,分配内存时也就不用考虑有空间碎片的复杂情况。

所以,标记-复制算法通常用在新生代的Eden区和Survivor区,这两个区的对象,朝生夕死,多数对象都是可回收的

总结一下,标记-复制算法有如下优点和缺点:

  • 优点:实现简单,内存回收时不用考虑内存碎片的出现。

  • 缺点:代价是将可用内存缩小为了原来的一半,并且在对象存活率较高时就要进行较多的复制操作,效率将会降低。

下图为使用复制算法回收前后的状态:

标记-复制看着还行,但是比较大的缺点是浪费了50%的空间,要知道内存是很贵的啊。

标记-整理算法

标记-复制算法在对象存活率较高时就要进行较多的复制操作,效率将会降低。

更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况。

所以在老年代一般不能直接选用这种算法。针对老年代对象的存亡特征,1974年Edward Lueders提出了另外一种有针对性的标记-整理(Mark-Compact)算法

其中的标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向内存空间一端移动,然后直接清理掉边界以外的内存。

  • 优点:经过整理之后,新对象的分配只需要通过指针碰撞便能完成,也解决了内存碎片的问题。
  • 缺点:GC 暂停的时间会增长,对象移动的时间成本是十分可观的。

下图为使用“标记-整理”算法回收前后的状态:

标记-清除 VS 标记-整理

标记-清除算法与标记-整理算法的本质差异在于前者是一种「非移动式」的回收算法,而后者是「移动式」的。

别小看这一差异,是否移动回收后的存活对象是一项优缺点并存的风险决策

如果移动存活对象,尤其是在老年代这种每次回收都有大量对象存活区域,移动存活对象会是一种极为负重的操作,而且这种对象移动操作必须全程暂停用户应用程序才能进行。

但如果跟标记-清除算法那样完全不考虑移动和整理存活对象的话,弥散于堆中的存活对象导致的内存碎片问题就只能依赖更为复杂的内存分配器和内存访问器来解决。

譬如通过「分区空闲分配链表」来解决内存分配问题。

内存的访问是用户程序最频繁的操作,甚至都没有之一,假如在这个环节上增加了额外的负担,势必会直接影响应用程序的吞吐量

基于以上两点,是否移动对象都存在弊端,移动则内存回收时会更复杂,不移动则内存分配时会更复杂。从垃圾收集的停顿时间来看,不移动对象停顿时间会更短,但是从整个程序的吞吐量来看,移动对象会更划算

HotSpot虚拟机里面关注吞吐量的Parallel Scavenge收集器是基于标记-整理算法的,而关注延迟的CMS收集器则是基于标记-清除算法的,这也从侧面印证这点

另外,还有一种「和稀泥式」解决方案可以不在内存分配和访问上增加太大额外负担,做法是让虚拟机平时多数时间都采用标记-清除算法,暂时容忍内存碎片的存在,直到内存空间的碎片化程度已经大到影响对象分配时,再采用标记-整理算法收集一次,以获得规整的内存空间。

基于标记-清除算法的CMS收集器采用的就是这种处理办法。

当CMS出现「并发失败”(Concurrent Mode Failure)」时,这时会启用Serial Old收集器来重新进行老年代的垃圾收集,而Serial Old正是基于标记-整理算法。

好了,本篇文章到这就结束了,这篇文章主要是讲JVM是怎么回收对象的,明白了这个,JVM算是初窥门径了。


感谢阅读,如果本篇文章有任何错误和建议,欢迎给我留言指正。

老铁们,关注我的微信公众号「Java 随想录」,专注分享Java技术干货,文章持续更新,可以关注公众号第一时间阅读。

一起交流学习,期待与你共同进步!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/902738.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Autosar存储入门系列02_NVM之CRC校验及显隐式同步机制

本文框架 0.前言1. NVM中CRC校验2. NVM的显隐式同步机制2.1 隐式同步2.2 显式同步 0.前言 本系列是Autosar存储入门系列,希望能从学习者的角度把存储相关的知识点梳理一遍,这个过程中如果大家觉得有讲得不对或者不够清晰的地方,还请一定指出…

Linus对AMD的fTPM 漏洞表示”沮丧” 呼吁禁用该功能

导读AMD 的 fTPM 问题在业内众所周知,经常导致系统崩溃和卡死。Linux 的创建者 Linus Torvalds 对该功能表示失望,称其为内核的”瘟疫”。 简单回顾一下,可信平台模块(Trusted Platform Module 或 TPM)是一种安全检查…

抖音火山引擎推出免费域名DNS和公共DNS服务

抖音旗下的云计算服务火山引擎最近推出了"TrafficRoute DNS 套件"服务,其中包括两款产品,对软希网来说非常有用。 1.域名DNS: 这是一个用于网站域名的DNS服务,可以加速域名解析速度,从而提升网站的速度。如…

【100天精通python】Day42:python网络爬虫开发_HTTP请求库requests 常用语法与实战

目录 1 HTTP协议 2 HTTP与HTTPS 3 HTTP请求过程 3.1 HTTP请求过程 3.2 GET请求与POST请求 3.3 常用请求报头 3.4 HTTP响应 4 HTTP请求库requests 常用语法 4.1 发送GET请求 4.2 发送POST请求 4.3 请求参数和头部 4.4 编码格式 4.5 requests高级操作-文件上传 4.6 …

线性代数的学习和整理4: 求逆矩阵的多种方法汇总

目录 原始问题:如何求逆矩阵? 1 EXCEL里,直接可以用黑盒表内公式 minverse() 数组公式求A- 2 非线性代数方法:解方程组的方法 3 增广矩阵的方法 4 用行列式的方法计算(未验证) 5 A-1/|A|*A* &…

构建 NodeJS 影院微服务并使用 docker 部署【01/4】

图片来自谷歌 — 封面由我制作 一、说明 构建一个微服务的电影网站,需要Docker、NodeJS、MongoDB,这样的案例您见过吗?如果对此有兴趣,您就继续往下看吧。 在本系列中,我们将构建一个 NodeJS 微服务,并使用…

【排序】插入排序 希尔排序(改进)

文章目录 插入排序时间复杂度空间复杂度 代码希尔排序时间复杂度空间复杂度 代码 以从小到大排序为例进行说明。 插入排序 插入排序就是从前向后(i1开始)进行选择,如果找到在i之前(分配一个j下标进行寻找)有比array[i…

第 7 章 排序算法(2)(冒泡排序)

7.5冒泡排序 7.5.1基本介绍 冒泡排序(Bubble Sorting)的基本思想是:通过对待排序序列从前向后(从下标较小的元素开始),依次比较相邻元素的值,若发现逆序则交换,使值较大的元素逐渐从前移向后部…

手写Promise一:结构的设计

手写Promise 这里写目录标题 手写Promise手写Promise的规范手册promisesaplus官网手写Promise-结构的设计 手写Promise的规范手册promisesaplus官网 链接: 官网链接 手写Promise-结构的设计 // 手写Promsie const PROMISE_STATUS_PENDING pending //等待状态 const PROMIS…

自动驾驶仿真:基于Carsim开发的加速度请求模型

文章目录 前言一、加速度输出变量问题澄清二、配置Carsim动力学模型三、配置Carsim驾驶员模型四、添加VS Command代码五、Run Control联合仿真六、加速度模型效果验证 前言 1、自动驾驶行业中,算法端对于纵向控制的功能预留接口基本都是加速度,我们需要…

【LeetCode75】第三十四题 叶子相似的树

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 给我们两棵二叉树,让我们判断这两棵二叉树的从左到右的叶子节点组成的叶子序列是否一致,即从左到右的叶子节点的数…

python爬虫实战零基础(2)——网页图片

网页图片的批量爬取保存 分析思路预备知识xpath用法response.text和 response.content两者的区别 代码实战请求网页内容批量图片保存 分析思路 还是基于request和xpath的爬虫代码 定位目标网址(里面图片还是很好看的 https://pic.netbian.com/4kdongman/index.html&…

漏洞指北-VulFocus靶场专栏-入门

漏洞指北-VulFocus靶场01-入门 VulFocus靶场前置条件:入门001 命令执行漏洞step1: 输入默认index的提示step2: 入门002 目录浏览漏洞step1:进入默认页面,找到tmp目录step2 进入tmp目录获取flag文件 VulFocus靶场前置条…

Linux 线程库中的接口介绍

1.pthread_create()创建线程 pthread_create()的语法形式: 参数解释: 第一个参数thread:事先创建好的pthread_t类型的参数。成功时thread指向的内存单元被设置为新创建线程的线程ID。 第二个参数attr:用于定制各种不同的线程属性…

三角形添加数--夏令营

题目 tips: 1.本题不要求正三角形输出,只要输出左下三角即可 2.这种输入三角形的,都是可以理解为左下三角形的模型,然后去写f[i][j]f[i-1][j]f[i-1][j1],写行列 3.还有双重for循环输入输出三角形,注意第二…

数据处理与统计分析——MySQL与SQL

这里写目录标题 1、初识数据库1.1、什么是数据库1.2、数据库分类1.3、相关概念1.4、MySQL及其安装1.5、基本命令 2、基本命令2.1、操作数据库2.2、数据库的列类型2.3、数据库的字段属性2.4 创建和删除数据库表2.5、数据库存储引擎2.6、修改数据库 3、MySQL数据管理3.1、外键 My…

YOLOv5+deepsort实现目标追踪。(附有各种错误解决办法)

一、YOLOv5算法相关配置 🐸这里如果是自己只想跑一跑YOLOV5的话,可以参考本章节。只想跑通YOLOv5+deepsort的看官移步到下一章节。 1.1 yolov5下载 🐸yolov5源码在github下载地址上或者Gitee上面都有。需要注意的是由于yolov5的代码库作者一直在维护,所以下载的时候需…

【前端】vscode javascript 代码片段失效问题解决

1. 文件--首选项--用户代码片段-vue.json : 添加 // { // // Place your global snippets here. Each snippet is defined under a snippet name and has a scope, prefix, body and // // description. Add comma separated ids of the languages where the snippet is app…

CentOS 7重置root密码

CentOS 7 如何找回被您 遗忘得 root密码呢? 步骤如下: 步骤一:在开机出现如下界面的时候就按“e”键 步骤二:在步骤一按下”e”键之后,出现如下界面,按 ↓键一直到底部找到“LANG=zh_CN.UTF-8”这句,在这句后面加上“init=/bin/sh”,然后按Ctrl+x进入单用户,此时需要…

Log4Qt日志框架(1)- 引入到QT中

Log4Qt日志框架(1)- 引入到QT中 1 下载源码2 简介3 加入到自己的项目中3.1 使用库文件3.2 引入源文件 4 说明 1 下载源码 github:https://github.com/MEONMedical/Log4Qt 官方(版本较老):https://sourceforge.net/projects/log4q…