深入理解Java虚拟机-GC

news2024/11/15 1:44:05

深入理解Java虚拟机-GC

当需要排查各种内存溢出、内存泄漏时,当垃圾回收成为系统到达更高并发量的瓶颈时,我们必须对内存动态分配和内存回收技术这样的“自动化”技术采用必要的监控和调节。

Java堆和方法区:一个接口的多个实现类需要的内存可能会不一样,一个方法所执行的不同条件分支所需要的内存也可能不一样,只有处于运行期间,我们才能知道程序究竟会创建哪些对象,创建多少个对象,这部分内存的分配和回收是动态的。

  • 哪些内存需要回收?
  • 什么时候回收?
  • 如何回收?

哪些内存需要回收?

  • 引用计数法 缺点:有很多例外情况要考虑,必须要配合大量额外处理才能保证正确地工作,譬如单纯的引用计数就很难解决对象之间相互循环引用的问题。
可达性分析算法(Java c#)

“GC Roots”的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”(Reference Chain),如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的。
GC Roots

  • 在虚拟机栈(栈帧中本地变量表)中引用的对象
  • 方法区中静态属性引用的对象
  • 方法区中常量引用的对象
  • 本地方法栈中JNI引用的对象
  • Java虚拟机内部的引用,如基本数据类型对应的Class对象,一些常驻的异常对象。
  • 所有被synchronized 关键字持有的对象
  • 反映Java虚拟机内部情况的JM XBean、JVM TI中注册的回调、本地代码缓存等。
引用
  • 强引用:引用赋值,即类似“Object obj=new Object()”这种引用关系。
  • 软引用:描述还有用,非必须的对象。在JDK 1.2版之后提供了SoftReference类来实现软引用。
  • 弱引用:被弱引用关联的对象只
    能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2版之后提供了WeakReference类来实现弱引用。
  • 虚引用:虚引用的存在完全不会影响对象的生命周期。为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时收到一个系统通知。
两次标记
  • 第一次标记:可达性分析标记没有与GC Root相连的引用链的对象。
  • 进行筛选,找出需要执行finalize()方法的对象,放入F-Queue队列,稍后由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize()方法。
  • 第二次标记:收集器对F-Queue中的对象进行第二次小规模的标记,如果F-Queue中的对象重新与引用链上的任何一个对象建立关联,那么它将被移出“即将回收”的集合。
  • 两次标记都没有逃出“即将回收”的集合,那它基本上就要被回收。
  • tips:finalize()运行代价高昂,不确定性达,无法保证各个对象的调用顺序,不推荐使用。
  • tips:任何一个对象的finalize()方法都只会被系统自动调用一次
回收方法区
  • 方法区垃圾收集的“性价比”较低
  • 方法区垃圾收集主要回收废弃的常量不再使用的类型
  • 没有任何字符串对象引用常量池中的"xxx"常量,且虚拟机中也没有其他地方引用该"xxx"。则,如果在这时发生垃圾回收,且垃圾收集器判断有必要进行回收,则该“xxx"常量将会被清理出常量池。
    判断一个类型是否属于“不再被使用的类”:
  • Java堆中不存在该类及其任何派生子类的实例。该类所有的实例都已经被回收
  • 加载该类的类加载器已经被回收,除了OSGi、JSP的重载等,通常很难达成。
  • 该类对应的java.lang.Class对象没有任何地方被引用,无法通过反射访问该类的方法。

在大量使用反射、动态代理、CGLib等字节码框架,动态生成JSP以及OSGi这类频繁自定义类加载器的场景中,通常都需要Java虚拟机具备类型卸载的能力,以保证不会对方法区造成过大的内存压力。

HotSpot虚拟机参数
  • -Xnoclassgc
  • -verbose: class
  • -XX: +TraceClass-Loading
  • -XX: +TraceClassUnLoading
分代收集理论

分代假说:

  • 弱分代假说
  • 强分代假说
    经验法则:跨代引用假说:跨代引用相对于同代引用来说仅占极少数。
    所以,不应该为了少量的跨代引用去扫描整个老年代,也不必浪费空间专门记录每一个对象是否存在及存在哪些跨代引用。在新生代上建立一个全局数据结构记忆集。记忆集将老年代划分为若干小块,标识老年代的哪一块内存会存在跨代引用。**Minor GC时,**将包含了跨代引用的小块内存中的对象加入到GC Root进行扫描。
Partial GC 部分收集

Minor GC/ Young GC新生代收集
Major GC/Old GC老年代收集,请注意“M ajor GC”这个说法现在有点混淆,在不同资料上常有不同所指,读者需按上下文区分到底是指老年代的收集还是整堆收集。
Mixed GC混合收集:目标是收集整个新生代和部分老年代的垃圾收集,目前只有G1收集器有这钟行为

Full GC 整堆收集

收集整个Java堆和方法区的垃圾收集。

垃圾回收算法

标记-清除 算法
算法分为“标记”和“清除”两个阶段:首先标记出所有需要回
收的对象,在标记完成后,统一回收掉所有被标记的对象,
也可以反过来,标记存活的对象,统一回收所有未被标记的对象。
缺点:
  • 执行效率不稳定,标记和清除两个过程的执行效率都随对象数量增长而降低;
  • 内存空间的碎片化问题。
标记-复制 算法

“半区复制” 缺点:内存空间浪费大。
新生代中的对象有98%熬不过第一轮收集。因此
并不需要按照1∶1的比例来划分新生代的内存空间。

“Appel式回收”:HotSpot虚拟机默认的Eden : Survivor = 8 : 1 。“逃生门”安全设计 – Survivor空间不足以容纳一次Minor GC之后存活的对象时,需要依赖其他内存区域进行分配担保。即,Survivor空间没有足够空间存放上一次新生代收集下来的存活对象,这些对象便将通过分配担保机制直
接进入老年代。

标记-整理 算法

移动式的垃圾回收算法。
优点:解决了弥散于堆中的存活对象导致的
空间碎片化问题。
缺点Stop The World 对象移动操作必须全程暂停用户应用程序才能进行。

HotSpot虚拟机里面关注吞吐量的Parallel
Scavenge收集器是基于标记-整理算法的,而关注延迟的CM S收集器则是基于标记-清除算法的。

HotSpot

根节点枚举
  • Stop The World ,枚举根节点时必须要暂停用户线程。
  • OopMap数据结构的协助下,HotSpot可以快速准确地完成GC Roots枚举 类加载动作完成时,HotSpot会把对象内什么偏移量上是什么类型的数据计算出来,在即时编译过程中,会在特定的位置记录下栈里和寄存器里哪些位置是引用。收集器在扫描时就可以直接得知这些信息,不需要真正一个不漏地从方法区等GC Roots开始查找。
安全点 Safepoint

用户程序强制要求必须执行到达安全点后才能够停顿下来进行垃圾回收

安全点的选定既不能太少以至于让收集器等待时间过长,也不能太过频繁以至于过分增大运行时的内存负荷。
  • 安全点以“是否具有让程序长时间执行的特征”为标准进行选定。
如何让所有线程都跑到最近的安全点?
  • 抢先式中断:在垃圾收集发生时,系统首先把所有用户线程全部中断,如果发现有用户线程中断的地方不在安全点上,就恢复这条线程执行,让它一会再重新中断,直到跑到安全点上。
  • 主动式中断:当垃圾收集需要中断线程的时候,不直接对线程进行操作。设置一个标志位,各个线程在执行的过程中会不断地轮询这个标志,线程发现标志为真时,就会在最近的安全点上中断挂起。
安全区域

解决户线程处于Sleep状态或者Blocked状态时,线程无法响应虚拟机的中断请求,不能再走到安全的地方去中断挂起自己,虚拟机也显然不可能持续等待线程重新被激活分配处理器时间的问题。

  • 用户线程执行到安全区域里面的代码
  • 用户线程标志自己进入安全区域
  • 虚拟机发起垃圾收集,不关已声明自己在安全区域的线程
  • 线程要离开安全区域时,检查虚拟机是否已经完成了根节点枚举(或者垃圾收集过程中其他需要暂停用户线程的阶段)
  • 如果完成了,那线程就当作没事发生过,继续执行;
  • 否则它就必须一直等待,直到收到可以离开安全区域的信号为止。
记忆集与卡表

跨代引用的问题

  • 记忆集是一钟用于记录从非收集区域指向收集区域的指针集合的抽象数据结构
  • 记忆粒度: 字长精度;对象精度;卡精度
  • 卡表:卡表就是记忆集的一种具体实现,它定义了记忆集的记录精度、与堆内存的映射关系等。卡表最简单的形式可以只是一个字节数组。字节数组CARD_TABLE的每一个元素都对应着其标识的内存区域中一块特定大小的内存块,这个内存块被称作“卡页”。
  • 只要卡页内有一个(或更多)对象的字段存在着跨代指针,那就将对应卡表的数组元素的值标识为1,称为这个元素变脏(Dirty),没有则标识为0。
  • 在垃圾收集发生时,只要筛选出卡表中变脏的元素,就能轻易得出哪些卡页内存块中包含跨代指针,把它们加入GC Roots中一并扫描。
写屏障 -XX: +UseCondCardMark 决定是否开启卡表更新的条件判断

写屏障可以看作在虚拟机层面对“引用类型字段赋值”这个动作的AOP切面

  • 写前屏障
  • 写后屏障
    写后屏障更新卡表
  • 伪共享问题现代中央处理器的缓存系统中是以缓存行(Cache Line)为单位存储的,当多线程修改互相独立的变量时,如果这些变量恰好共享同一个缓存行,就会彼此影响(写回、无效化或者同步)而导致性能降低。
并发的可达性分析

对象消失问题:把原本存活的对象错误标记成已消亡。

对象按照“是否访问过”这个条件标记成以下三种颜色
  • 白色: 表示对象尚未被垃圾收集器访问过。若在分析结束的阶段,仍然是白色的对象,即代表不可达。
  • 黑色: 表示对象已经被垃圾收集器访问过,且这个对象的所有引用都已经扫描过。
  • 灰色:表示对象已经被垃圾收集器访问过,但这个对象上至少存在一个引用还没有被扫描过。
对象消失的两个条件
  • 赋值器插入了一条或多条从黑色对象到白色对象的新引用;
  • 赋值器删除了全部从灰色对象到该白色对象的直接或间接引用。
对象消失问题的两个解决方案
  • 增量更新 黑色对象一旦新插入了指向白色对象的引用之后,就把它变回灰色对象。
  • 原始快照 无论引用关系删除与否,都会按照刚刚开始扫描那一刻的对象图快照来进行搜索。
    写屏障实现
经典垃圾收集器
图3-6展示了七种作用于不同分代的收集器,如果两个收集器之间存在连线,就说明它们可以搭配使用
图中收集器所处的区域,则表示它是属于新生代收集器抑或是老年代收集器。

在这里插入图片描述

Serial、 ParNew、Parallel Scavenge、Serial Old、Parallel Old
  • Serial收集器:它进行垃圾收集时,必须暂停其他所有工作线程,直到它收集结束。HotSpot虚拟机运行在客户端模式下的默认新生代收集器。简单而高效、内存消耗最小、没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。

  • ParNew erial收集器的多线程并行版本, 加粗除了Serial收集器外,目前只有它能与CMS收集器配合工作。

  • 可以使用-XX:ParallelGCThreads参数来限制垃圾收集的线程数
    在这里插入图片描述

  • Parallel Scavenge收集器“吞吐量优先收集器” CM S等收集器的关注点是尽可能地缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量。而高吞吐量则可以最高效率地利用处理器资源,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的分析任务。控制最大垃圾收集停顿时间的-XX:M axGCPauseM illis参数以及直接设置吞吐量大小的-XX:GCTimeRatio参数。

  • Serial Old是Serial收集器的老年代版本

  • Parallel Old是Parallel Scavenge收集器的老年代版本,支持多线程并发收集,基于标记-整理算法实现。“吞吐量优先”收集器终于有了比较名副其实的搭配组合,在注重吞吐量或者处理器资源较为稀缺的场合,都可以优先考虑Parallel Scavenge加Parallel Old收集器这个组合。

CMS Concurrent M ark Sweep [标记-清除算法]

目标:获取最短回收停顿时间
在这里插入图片描述

  • 初始标记 Stop The World 标记一下GC Roots能直接关联到的对象
  • 并发标记 从GC Roots的直接关联对象开始遍历整个对象图
  • 重新标记 Stop The World 修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录
  • 并发清除 清理删除掉标记阶段判断的已经死亡的对象,由于不需要移动存活对象,所以这个阶段也是可以与用户线程同时并发的。
优点:并发收集,低停顿
缺点:
CMS收集器对处理器资源非常敏感。
  • CM S默认启动的回收线程数是(处理器核心数量
    +3)/4 。 处理器核心数量不足四个时,CMS对用户程序的影响就可能变得很大。可能导致用户程序的执行速度忽然大幅降低。
  • “增量式并发收集器”的CM S收集器变种。单核处理器年代PC机操作系统靠抢占式多任务来模拟多核并行多任务的思想一样。
由于CMS收集器无法处理“浮动垃圾”

浮动垃圾: 出现在标记过程结束以后的垃圾对象。CM S无法在当次收集中处理掉它们,只好留待下一次垃圾收集
时再清理掉。
由于在垃圾收集阶段用户线程还需要持续运行,CM S收集器不能像其他收集器那样等待到老年代几乎完全被填满了再进行收集,必须预留一部分空间供并发收集时的程序运作使用。
要是CM S运行期间预留的内存无法满足程序分配新对象的需要,就会出现一次“并发失败”,这时候虚拟机将不得不启动后备预案:冻结用户线程的执行,临时启用Serial Old收集器来重新进行老年代的垃圾收集。

基于“标记-清除”算法实现的收集器,意味着收集结束时会有大量空间碎片产生。
Garbage First

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1234861.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于知识问答的上下文学习中的代码风格11.20

基于知识问答的上下文学习中的代码风格 摘要1 引言2 相关工作3 方法3.1 概述3.2 元函数设计3.3 推理 4 实验4.1 实验设置4.2 实施细节4.3 主要结果 摘要 现有的基于知识的问题分类方法通常依赖于复杂的训练技术和模型框架,在实际应用中存在诸多局限性。最近&#x…

优秀智慧园区案例 - 三亚市崖州湾科技城智慧园区,先进智慧园区建设方案经验

一、项目背景 三亚崖州湾科技城作为海南自贸港建设的重点园区,是重点推进的海南自贸港先导项目之一。崖州湾科技城全力抢抓有利时机,进一步拓宽发展思路,持续深化体制机制创新,牢牢把握“打造产学研城深度融合的聚集地”这一核心…

手把手带你在AutoDL上部署InternLM-Chat-7B Transformers

手把手带你在AutoDL上部署InternLM-Chat-7B Transformers 调用 项目地址:https://github.com/KMnO4-zx/self_llm.git 如果大家有其他模型想要部署教程,可以来仓库提交issue哦~ 也可以自己提交PR! InternLM-Chat-7B Transformers 部署调用 环…

Python爬虫技巧:百万级数据怎么爬取?

目录 前言 一、使用多线程/协程提高爬虫速度 1.1 使用多线程 1.2 使用协程 1.3 注意事项 二、使用代理IP解决目标网站限制爬虫的问题 三、使用分布式爬虫 四、其他一些小技巧 总结 前言 在实际的爬取过程中,我们经常会遇到一些需要大量爬取数据的情况&…

ConcurrentHashMap和HashMap的区别

HashMap相关知识点见主页博客:HashMap散列表的相关知识点-CSDN博客 目录 1、ConcurrentHashMap 2、ConcurrentHashMap和HashMap的区别 1、ConcurrentHashMap ConcurrentHashMap 是 Java 中的一个线程安全的哈希表实现,它是java.util.Map接口的一个具…

负载均衡Ribbon和Feign的使用与区别

Ribbon 的介绍 Spring Cloud Ribbon 是基于Netflix Ribbon 实现的一套客户端负载均衡的工具。主要功能是提供客户端的软件负载均衡和服务调用。Ribbon 客户端组件提供一系列完善的配置项如连接超时,重试等。简单的说,就是在配置文件中列出Load Balancer…

【python】Python生成GIF动图,多张图片转动态图,pillow

pip install pillow 示例代码: from PIL import Image, ImageSequence# 图片文件名列表 image_files [car.png, detected_map.png, base64_image_out.png]# 打开图片 images [Image.open(filename) for filename in image_files]# 设置输出 GIF 文件名 output_g…

深入理解JSON及其在Java中的应用

✅作者简介:大家好,我是Leo,热爱Java后端开发者,一个想要与大家共同进步的男人😉😉 🍎个人主页:Leo的博客 💞当前专栏:每天一个知识点 ✨特色专栏&#xff1a…

【docker】虚拟化和docker容器概念

基础了解 IAAS: 基础设施服务,(只提供基础设施,没有系统) **SAAS: ** 软件即服务,(提供基础设施和系统) PAAS: 平台即服务,(提供基…

哪个才是最适合你的 Web UI 自动化测试框架

最近,项目上出于系统性稳定性、减少测试工作量考虑,打算在 Web 前端引入 BDD。由于上一个项目写了一定的 Cucumber 代码(BDD 测试框架之一),这个框架选型的责任便落到了我的肩膀上了。 在我们进行框架选型的时候&#…

前端uniapp生成海报绘制canvas画布并且保存到相册【实战/带源码/最新】

目录 插件市场效果如下图注意使用my-share.vue插件文件如下图片hch-posterutilsindex.js draw-demo.vuehch-poster.vue 最后 插件市场 插件市场 效果如下图 注意 主要&#xff1a;使用my-share.vue和绘制canvas的hch-poster.vue这两个使用 使用my-share.vue <template&…

使用kafka_exporter监控Kafka

prometheus 监控 kafka 常见的有两种开源方案,一种是传统的部署 exporter 的方式,一种是通过 jmx 配置监控, 项目地址: kafka_exporter:https://github.com/danielqsj/kafka_exporterjmx_exporter:https://github.com/prometheus/jmx_exporter本文将采用kafka_exporter方…

win11,无法修改文件的只读属性,解决办法

在尝试更改文件或文件夹的权限时&#xff0c;您可能经常会遇到错误 - 无法枚举容器中的对象访问被拒绝。 虽然作为管理员&#xff0c;您可以更改访问权限&#xff0c;但有时即使是管理员也可能会遇到相同的错误消息。 这是一个常见错误&#xff0c;通常由不同论坛上的用户提出…

Web前端—移动Web第三天(移动Web基础、rem、less、综合案例—极速问诊)

版本说明 当前版本号[20231120]。 版本修改说明20231120初版 目录 文章目录 版本说明目录移动 Web 第三天01-移动 Web 基础谷歌模拟器屏幕分辨率视口二倍图适配方案 02-rem简介媒体查询rem 布局flexible.jsrem 移动适配 03-less注释运算嵌套变量导入导出禁止导出 04-综合案例…

【SA8295P 源码分析 (三)】132 - GMSL2 协议分析 之 GPIO/SPI/I2C/UART 等通迅控制协议带宽消耗计算

【SA8295P 源码分析】132 - GMSL2 协议分析 之 GPIO/SPI/I2C/UART 等通迅控制协议带宽消耗计算 一、GPIO 透传带宽消耗计算二、SPI 通迅带宽消耗计算三、I2C 通迅带宽消耗计算四、UART 通迅带宽消耗计算系列文章汇总见:《【SA8295P 源码分析 (三)】Camera 模块 文章链接汇总 -…

nvm管理node版本过程记录

写在前面 今天记录一下windows电脑安装nvm同时使用nvm管理node版本的&#xff0c;为什么写windows版本的呢&#xff1f;因为mac版本的基本上是不需要进行记录的&#xff0c;相对windows的安装是简单很多的&#xff0c;行了废话不多说&#xff0c;我们直接开始 安装nvm nvm下载…

日志技术logback

一&#xff0c;日志概括 二&#xff0c;日志技术的特点 三&#xff0c;日志技术的体系 三&#xff0c;入门 四&#xff0c;案例 package XinZheng;import org.slf4j.Logger; import org.slf4j.LoggerFactory;public class Main58 {//1,创建一个Logger日志对象public static fi…

PIL如何批量给图片添加文字水印?

PIL如何批量给图片添加文字水印&#xff1f; 1 简单引入2 关于PIL3 本文涉及的PIL的几个类4 实现原理5 实现过程5.1 原始图片5.2 导入相关模块5.3 初始化数据5.4 水印字体设置5.5 打开原始图片并新建存储对象5.6 计算图片和水印的大小5.7 选择性设置水印文字5.8 绘制文字并设置…

Vite - 配置 - 自动修改 index.html 中的title

需求描述 在Vue3项目的开发过程中&#xff0c;我们为了能区分正式环境和测试环境&#xff0c; 通常会进行环境配置文件的区分&#xff0c; 例如&#xff0c;开发环境一个配置文件、生产环境一个配置文件。因此&#xff0c;我们就希望 在项目的index.html 的 title 标签中&…

普冉PY32系列(十) 基于PY32F002A的6+1通道遥控小车I - 综述篇

目录 普冉PY32系列(一) PY32F0系列32位Cortex M0 MCU简介普冉PY32系列(二) Ubuntu GCC Toolchain和VSCode开发环境普冉PY32系列(三) PY32F002A资源实测 - 这个型号不简单普冉PY32系列(四) PY32F002A/003/030的时钟设置普冉PY32系列(五) 使用JLink RTT代替串口输出日志普冉PY32…