深入学习JVM —— GC垃圾回收机制

news2025/1/23 17:48:32

前言

        前面荔枝已经梳理了有关JVM的体系结构和类加载机制,也详细地介绍了JVM在类加载时的双亲委派模型,而在这篇文章中荔枝将会比较详细地梳理有关JVM学习的另一大重点——GC垃圾回收机制的相关知识,重点了解的比如对象可达性的判断、四种回收算法、分代回收机制的流程和区域划分。希望对有需要的小伙伴有帮助~~~~


文章目录

前言

一、基本概念

1.1 Java中的引用类型 

1.2 垃圾回收区域

1.3 判断对象可回收的方法

1.3.1 引用计数法

1.3.2 可达性分析法

二、JVM中的垃圾回收算法

2.1 标记——清除算法

2.2 标记——复制算法

2.3 标记——整理算法

三、分代回收机制

3.1 垃圾回收的类型

3.2 空间结构与区域划分

3.3 跨代引用

总结


一、基本概念

        GC(Carbage Collection)又称为垃圾回收器,我们知道一个对象在其生命周期结束的时候是会被销毁掉的,在Java中对象的销毁时不需要开发者去显示调用的,而是交给Java虚拟机中的垃圾回收器来回收。Java中提供了多种垃圾回收器,而在JVM中会一直维护一个垃圾回收线程,通常该线程只有在堆内存不足或者是JVM空闲的时候才会触发执行,将他们添加到要回收的集合中并进行回收。

GC监控时机 

        对于GC来说,当程序员创建对象时,GC就开始监控这个对象的地址、大小以及使用情况。通常,GC采用有向图的方式记录和管理堆(heap)中的所有对象。通过这种方式确定哪些对象是"可达的",哪些对象是"不可达的"。当GC确定一些对象为"不可达"时,GC就有责任回收这些内存空间。

1.1 Java中的引用类型 

Java中的引用类型有四种,分别是:强引用、弱引用、软引用和虚引用。Java中的默认声明其实就是强引用。

//强引用
//强引用所关联的对象始终不会被垃圾回收机制回收
String str
Object obj = new Object();

//软引用
//内存不足的时候才会回收软引用所关联的对象
//软引用是通过java.lang.ref.SoftReference
buff = new byte[1024 * 1024];
SoftReference<byte[]> sr = new SoftReference<>(buff);

//弱引用
//无论内存是否足够,只要 JVM 开始进行垃圾回收,那些被弱引用关联的对象都会被回收
//java.lang.ref.WeakReference 来表示弱引用
byte[] buff = new byte[1024 * 1024];
WeakReference<byte[]> sr = new WeakReference<>(buff);

//虚引用
//虚引用是最弱的一种引用关系,如果一个对象仅持有虚引用,那么它就和没有任何引用一样,它随时可能会被回收
//用 PhantomReference 类来表示
  • 强引用:发生 gc 的时候不会被回收,即使内存不足也不会回收而是抛出异常,如果想中断强引用于对象之间的联系,可以给引用赋值为null,这样对象就可以被回收了。
  • 软引用:有用但不是必须的对象,在发生内存溢出之前会被回收。
  • 弱引用:有用但不是必须的对象,在下一次GC时会被回收。
  • 虚引用:无法通过虚引用获得对象,用 PhantomReference 实现虚引用,虚引用的用途是在 gc 时返回一个通知。

1.2 垃圾回收区域

         在上一篇文章JVM的体系架构中我们了解了JVM的内存结构,其中讲到了JVM内存结构中的栈区中的基本类型数据是不会被垃圾回收机制给回收的,而是在超出其作用范围自动销毁滴。其实JVM中的GC机制主要是回收堆区和方法区内的基本数据和对象。

1.3 判断对象可回收的方法

在GC垃圾回收机制中,当对象没有引用了或者方法不可达就可以判断该对象可以回收,即垃圾回收线程可以将该对象加入回收集合了,具体的判断对象可达性的方法如下: 

1.3.1 引用计数法

为每个对象创建一个引用计数,有对象引用时计数器 +1,引用被释放时计数 -1,当计数器为 0 时就可以被回收,这种方法实现起来比较简单。

缺点:无法回收相互引用的对象。

1.3.2 可达性分析法

        可达性分析法又被称为根搜索法,用来判断对象是否存活。从GC机制的某一个根节点触发开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是可以被回收的。

可作为根节点的对象:

  • 在虚拟机栈帧中引用的对象,例如线程调用方法时,使用或产生的参数、局部变量、临时变量等。
  • 在方法区中,类的引用类型静态变量或常量;
  • 在本地方法栈中的JNI引用的对象;
  • 在JVM内部的对象,例如基本数据类型的Class对象,一些常驻的异常对象(NullPointExcepiton),系统类加载器等;
  • 所有synchronized同步锁的持有对象;
  • 反映JVM内部情况的JMXBean、JVMTI注册的回调、本地代码缓存等。

二、JVM中的垃圾回收算法

JVM中的垃圾回收算法主要有四种,其中按回收策略来说应该分为两类:分代回收和局部回收。我们先来梳理局部回收的三种回收算法:

2.1 标记——清除算法

        简单描述该方法就是标记出所有的存活对象,再扫描整个空间中未被标记的对象进行垃圾清除(回收)。标记 - 清除算法由于回收后没有进行整理的操作,所以会存在内存空间碎片化的问题,可能会导致后续产生的对象不能找到可利用的空间这个问题。

2.2 标记——复制算法

        常规的复制算法就是将内存分为两块大小相同的空间,但其中的一块内存用完后就会将存活的对象拷贝到另一块内存中,之后再将原空间进行一次性清理,这个方法虽然效率高但却是以牺牲内存空间为代价的。标记-复制算法在这个基础之上对其进行了优化,不再是通过1:1的比例来分配内存空间,而是按照8:1:1来分配内存空间的,即将内存空间的80%作为Eden空间,剩下的20%分成两个10%的Survivor空间。把Eden和其中一块Survivor空间中存活的对象,复制到另一块空闲的Survivor空间,然后直接把Eden和使用过的那块Survivor空间清理掉。

需要注意的是:

        目前主流的使用分代回收机制的Java虚拟机,都是使用标记-复制算法来作为新生代的回收算法。它非常适合用在新生代这种回收率极高的场景,这样的场景下,复制算法浪费的空间几乎可以忽略不计。效率高,且内存不会有碎片化的问题。 

分配担保机制

        极端情况下可能会出现超过10%的对象存活,分配担保机制就是为了保证当出现这种情况时,有其他内存空间来存放存活的对象。通常这个“担保人”是老年代,当存活的对象超过Survivor空间大小时,这些存活的对象会忽略年龄,直接进入老年代里。  

2.3 标记——整理算法

        在前面我们了解到标记-清除算法的缺点就是会产生内存碎片,不适合哪些需要大量连续内存空间的场景,而标记-整理算法就是在其基础之上,增加了整理这个操作来解决内存空间碎片化的问题

算法流程

        首先标记出所有的存活对象,但在清除之前会先进行整理,把所有存活的对象往内存空间的左边移动,然后清理掉存活对象边界以外的内存,即完成了清除的操作。标记-整理 算法是在 标记-清除 算法之上,又进行了对象的移动排序整理,因此成本更高,但却解决了内存碎片的问题。上面的几种算法比较适合于老年代中的对象回收。


三、分代回收机制

接着我们来看看分代回收算法,在介绍分代回收机制之前,我们需要明确两个分代假说,或者说是常识也行:

  • 弱分代假说:绝大多数对象都是朝生夕改的
  • 强分代假说:熬过越多次垃圾回收的对象就越难消亡

根据分代假说,既然绝大多数对象容易被垃圾回收,而留下的对象不易被回收,就可以对GC区域内对象进行分类,分为新生代和老年代。相比两个区域内的对象的特性,GC就不用每次都对老年代进行搜索标记,而仅需要搜索标记新生代所存放的内存空间即可。

3.1 垃圾回收的类型

  • Minor GC:只回收新生代对象存放的内存空间
  • Major GC:只回收老年代对象存放的内存空间,只有CMS收集器实现了Major GC
  • Full GC:回收整个堆区和方法区,相当于全盘扫描标记,效率低
  • Mixed GC:回收整个新生代和部分老年代。G1收集器实现了这个类型 

需要注意的是:在老年代里,触发GC,除了CMS和G1之外的其他收集器,大多数触发的其实是 Full GC。

3.2 空间结构与区域划分

我们知道在GC中一般将对象分为新生代(年轻代)和老年代(年老代),下面我们详细认识一下整个二者以及堆区和方法区的具体空间结构。

新生代:

绝大多数新创建的对象会被分配到新生代里,仅在该区域进行垃圾回收被称之为Minor GC。

老年代:

        对象在新生代周期中存活了下来的,会被拷贝到这里。通常情况下这个区域分配的空间要比新生代多。正是由于对象经历的GC次数越多越难回收,加上相对大的空间,一般发生在老年代的GC次数要比新生代少得多。这个区域触发的垃圾回收称之为:Major GC 或者 Full GC。

永久代

        是hotspot虚拟机的特有的概念,他不属于堆内存,是方法区的一种实现,各大厂商对方法区其实都有各自的实现。永久代一般存放jvm运行时需要的类,包含java库的类和方法,在触发full gc的情况下,永久代也会被进行垃圾回收。在JDK1.8之后,JVM使用元空间metaspace来取代永久代,最大区别是元空间中的数据是储存在本地内存的。

空间结构

        一般来说呢,新生代的空间会被按照 8:1:1 的方式来进行划分为一个Eden空间和两个Survivor空间,这种设计是为了更好的适配新生代对象容易被回收的特点,同时也比较适合使用标记——复制算法来GC。那些经历了多次GC的对象一般都是从新生代的Eden到Survive空间,重复N次达到设定的阈值后才会到老年代空间里面,当然也有一些比较大的对象是直接到老年代空间里面的。

 

老年代区域GC耗时更长的原因:

  • 老年代中会有更比较大的对象,并且老年代的内存占比一般更大;
  • 老年代使用的是标记-整理算法,清理内存前会把存活的对象重新排序整理成连续的空间,成本更高

3.3 跨代引用

场景:新生代中的对象很有可能会被老年代里的对象所引用,当新生代触发GC的时候,只搜索新生代的区域明显是不够的,还得搜索老年代的对象是否引用了新生代中非 GC Roots 引用链上的对象,来确保正确性。 

解决方法 

        Java定义了一种名为记忆集的抽象的数据结构,用于记录存在跨区域引用的对象指针集合。大多数的虚拟机,都采用一种名为卡表(Card Table)的方式去实现记忆集,卡表由一个数组构成,每一个元素都对应着一块特定大小的内存区域,这块内存区域被称之为卡页(Card Page),每一个卡页,可能会包含N个存在跨区域引用的对象,只要存在跨区域引用的对象,这个卡页就会被标识为1。当GC发生的时候,就不需要扫描整个区域了,只需要把这些被标识为1的卡页加入对应区域的 GC Roots 里一起扫描即可。


总结

        这篇文章结束,荔枝有关JVM的初步学习就要告一段落啦,这篇文章主要还是大体上了解了JVM的垃圾回收机制中的一些空间结构和区域划分,以及不同时期的对象在堆空间中存储的区域和相关的回收算法。总的来说通过这几篇文章应该就答题了解的差不多了,接下来荔枝就要开始看项目和继续学习一些中间件了哈哈哈,大家一起加油啦~~~

今朝已然成为过去,明日依然向往未来!我是小荔枝,在技术成长的路上与你相伴,码文不易,麻烦举起小爪爪点个赞吧哈哈哈~~~ 比心心♥~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/840219.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

推荐一款老化测试软件 Monitor.Analog

1. 数据采集模块&#xff1a; 该模块负责与下位机设备通信&#xff0c;实时采集模拟量数据。支持多种通信协议&#xff0c;如Modbus、OPC等&#xff0c;以适应不同类型的设备。数据采集模块还需要具备异常数据处理功能&#xff0c;例如数据丢失、错误数据等。 2. 数据存储模块…

Linux命令200例:用Look一个进行文本搜索工具

&#x1f3c6;作者简介&#xff0c;黑夜开发者&#xff0c;全栈领域新星创作者✌&#xff0c;阿里云社区专家博主&#xff0c;2023年6月csdn上海赛道top4。 &#x1f3c6;数年电商行业从业经验&#xff0c;历任核心研发工程师&#xff0c;项目技术负责人。 &#x1f3c6;本文已…

Python简单应用V

题目 通过编写函数实现下述各题。 输入一字符串&#xff0c;各个子串之间按空白字符隔开&#xff0c;分别显式其中最长、最短子串&#xff0c;以及最大、最小字符。 输入单个字符&#xff0c;判断并显示该字符是否为大写英文字母、小写英文字母、非英文文字字符、空格、数字或…

【Paper Reading】DETR:End-to-End Object Detection with Transformers

背景 Transformer已经在NLP领域大展拳脚&#xff0c;逐步替代了LSTM/GRU等相关的Recurrent Neural Networks&#xff0c;相比于传统的RNN&#xff0c;Transformer主要具有以下几点优势 可解决长时序依赖问题&#xff0c;因为Transformer在计算attention的时候是在全局维度进行…

CentOS7---部署Tomcat和安装Jpress

总览需求 1. 简述静态网页和动态网页的区别。 2. 简述 Webl.0 和 Web2.0 的区别。 3. 安装tomcat8&#xff0c;配置服务启动脚本&#xff0c;部署jpress应用。1、简述静态网页和动态网页的区别 静态网页&#xff1a; 请求响应信息&#xff0c;发给客户端进行处理&#xff0c…

回顾 OWASP 机器学习十大风险

日复一日&#xff0c;越来越多的机器学习 (ML) 模型正在开发中。机器学习模型用于查找训练数据中的模式&#xff0c;可以产生令人印象深刻的检测和分类能力。机器学习已经为人工智能的许多领域提供了动力&#xff0c;包括情感分析、图像分类、面部检测、威胁情报等。 数十亿美…

复现sci顶刊中的画中画(局部细节放大)

简介 小编在撰写学术论文时&#xff0c;为了突出所提模型的优越性&#xff0c;你可以通过放大图形中的局部位置来进行比较。尽管从全局来看&#xff0c;各个方法的拟合效果都还不错&#xff0c;但通过放大图中的特定区域&#xff0c;可以更清楚地展示所提模型相对于其他模型的…

echarts实现立体柱状图

实现效果图如下&#xff1a; 上面除了立体图之外还增加了背景图。注意&#xff0c;可以发现这个图的右下角是是和x轴平齐的&#xff0c;如果右下角也要折角&#xff0c;可以根据代码修改下描点的点位就可以了。 完整代码如下&#xff1a; <template><div id"ba…

从特斯拉FSD v11.4.6,看FSD入华

从特斯拉FSD v11.4.6&#xff0c;看FSD入华 1. 芝加哥城区a. 亮点b. 问题 2. 小镇中心a. 亮点b. 问题 3. FSD入华a. 技术路线b. 场景 4. 参考视频 FSD最近更新了v11.4.6&#xff0c;本文根据2个FSD城区测试视频&#xff0c;一起看一下有哪些亮点和问题。 FSD入华的消息也甚嚣尘…

HTML5中Canvas学习笔记:Canvas

目录 一、HTML中Canvas画图strokeStyle 和 fillStyle 的区别是什么&#xff1f; 二、如何设置一幅canvas图中某个颜色透明&#xff1f; 三、H5 canvas中strokeRect参数如果是小数&#xff0c;如何处理&#xff1f; 四、H5 Canvas中如何画圆角矩形框&#xff1f; 一、HTML中…

python字符串输入输出与注解

目录 数据输入 前言 数据输出 字符串 字符串的三种定义方法 引号嵌套 字符串的拼接 字符串格式化 拼接字符串缺点 python常用的格式符号 格式化的精度控制 字符串快速格式化 快速格式化特点 对表达式进行格式化 具体案例 字符串的大小比较 字符串比较方式 变…

分类预测 | MATLAB实现WOA鲸鱼算法同步优化特征选择结合支持向量机分类预测

分类预测 | MATLAB实现WOA鲸鱼算法同步优化特征选择结合支持向量机分类预测 目录 分类预测 | MATLAB实现WOA鲸鱼算法同步优化特征选择结合支持向量机分类预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 MATLAB实现WOA鲸鱼算法同步优化特征选择结合支持向量机分类预测…

DASCTF 2023 0X401七月暑期挑战赛 Web方向 EzFlask ez_cms MyPicDisk 详细题解wp

EzFlask 源码直接给了 CtrlU查看带缩进的源码 import uuidfrom flask import Flask, request, session # 导入黑名单列表 from secret import black_list import jsonapp Flask(__name__) # 为 Flask 应用设置一个随机的 secret_key app.secret_key str(uuid.uuid4())# 检查…

epoll、poll、select的原理和区别

select&#xff0c;poll&#xff0c;epoll都是IO多路复用的机制。I/O多路复用就是通过一种机制&#xff0c;一个进程可以监视多个描述符&#xff0c;一旦某个描述符就绪&#xff08;一般是读就绪或者写就绪&#xff09;&#xff0c;能够通知程序进行相应的读写操作。但select&a…

Android 实现账号诊断动画效果,逐条检测对应的项目

Dialog中的项目 逐条检测效果&#xff1a; 依赖库&#xff1a; implementation com.github.li-xiaojun:XPopup:2.9.19 implementation com.blankj:utilcodex:1.31.1 implementation com.github.CymChad:BaseRecyclerViewAdapterHelper:3.0.101、item_account_check.xml <…

【C语言】静态关键字static的用法(详解)

&#x1f388;个人主页&#xff1a;库库的里昂 &#x1f390;CSDN新晋作者 &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 ✨收录专栏&#xff1a;C语言初阶 ✨其他专栏&#xff1a;代码小游戏 &#x1f91d;希望作者的文章能对你有所帮助&#xff0c;有不足的地方请在评论…

I.MX6ULL_Linux_驱动篇(44)linux MISC驱动

MISC 驱动也叫做杂项驱动&#xff0c;也就是当我们板子上的某些外设无法进行分类的时候就可以使用 MISC 驱动。 MISC 驱动其实就是最简单的字符设备驱动&#xff0c;通常嵌套在 platform 总线驱动中&#xff0c;实现复杂的驱动&#xff0c;本章我们就来学习一下 MISC 驱动的编写…

恺英网络宣布:与华为鸿蒙系统展开合作,将开发多款手游

8月5日消息&#xff0c;恺英网络宣布旗下子公司盛和网络参加了华为开发者大会&#xff08;HDC.Together&#xff09;游戏服务论坛&#xff0c;并在华为鸿蒙生态游戏先锋合作启动仪式上进行了亮相。恺英网络表示&#xff0c;将逐步在HarmonyOS上开发多款游戏&#xff0c;利用Har…

【C++】做一个飞机空战小游戏(五)——getch()控制两个飞机图标移动(控制光标位置)

[导读]本系列博文内容链接如下&#xff1a; 【C】做一个飞机空战小游戏(一)——使用getch()函数获得键盘码值 【C】做一个飞机空战小游戏(二)——利用getch()函数实现键盘控制单个字符移动【C】做一个飞机空战小游戏(三)——getch()函数控制任意造型飞机图标移动 【C】做一个飞…