Java高阶私房菜-JVM垃圾回收机制及算法原理探究

news2024/11/20 14:26:34

目录

垃圾回收机制

什么是垃圾回收机制

JVM的自动垃圾回收机制

垃圾回收机制的关键知识点

初步了解判断方法-引用计数法

GCRoot和可达性分析算法

什么是可达性分析算法

什么是GC Root

对象回收的关键知识点

标记对象可回收就一定会被回收吗?

可达性分析算法为什么可以解决循环引用造成的内存泄漏问题?

​编辑

垃圾回收算法

标记-清除算法原理

标记-复制算法原理

标记-整理-压缩算法原理

几种算法对比


        JVM迄今为止都是程序员老生常谈的话题,实话说我每一次研究探索完后都会忘一次,但好在每次探究都有新的见解,再加上JDK每迭代更新一版都会有新的特性和改良,对此,我们就当温故知新,增进新的理解,弥补不足,在这里我不讲大而全的知识,也不会讲老旧的知识点,主要围绕在工作中实际遇到现象进行探索,究其根本,夯实基础。本文主要讲述什么是垃圾回收机制,以及核心的几种垃圾回收算法,逐步深入浅出讲解由来和应用场景。

垃圾回收机制

什么是垃圾回收机制

        垃圾回收机制(Garbage Collection, 简称GC) 指自动管理动态分配的内存空间的机制,自动回收不再使用的内存,以避免内存泄漏和内存溢出的问题。

        最早是在1960年代提出的,程序员需要手动管理内存的分配和释放,这往往会导致内存泄漏和内存溢出等问题,同时也增加了程序员的工作量,特别是C++/C语言开发的时候,Java语言是最早实现垃圾回收机制的语言之一,其他编程语言,如C#、Python和Ruby等,也都提供了垃圾回收机制。

JVM的自动垃圾回收机制

        指Java虚拟机在运行Java程序时,自动回收不再使用的对象所占用的内存空间的过程。Java程序中的对象,一旦不再被引用会被标记为垃圾对象,JVM会在适当的时候自动回收这些垃圾对象所占用的内存空间。

其优点在于

  • 减少了开发人员的工作量,不需要手动管理内存;

  • 动态地管理内存,根据应用程序的需要进行分配和回收,提高了内存利用率;

  • 避免内存泄漏和野指针等问题,增加程序的稳定性和可靠;

缺点在于

  • 垃圾回收会占用一定的系统资源,可能会影响程序的性能;

  • 垃圾回收过程中会停止程序的执行,可能会导致程序出现卡顿等问题;

  • 不一定能够完全解决内存泄漏等问题,需要在编写代码时注意内存管理和编码规范;

垃圾回收机制的关键知识点

        垃圾回收机制需要判断哪些对象需要回收?即如何判读判断对象存活。其方法包括了有引用计数法可达性分析算法(JVM采用)。

        如何针对性进行回收?其收集死亡对象方法主要有三种,有标记-清除算法、标记-复制算法和标记-整理算法。每个中算法所针对的场景都不一样,没有最优解,只有最合适。

        了解垃圾回收算法和垃圾收集器的关系?两者没有可比性,是承先启后的关系,垃圾回收算法是垃圾回收的方法论,而垃圾收集器是算法的落地实现

初步了解判断方法-引用计数法

        简而言之就是跟踪每个对象被引用的次数,当引用次数为0时,就可以将该对象回收。在JVM中,每个对象都有一个引用计数器,当对象被引用时,引用计数器+1,当对象被取消引用时,引用计数器-1,当引用计数器为0时,该对象就可以被回收。

        其优点在于实现简单,回收垃圾的效率高。但缺点也显而易见循环引用无法回收。如果两个对象互相引用,它们的引用计数器永远不会为0,因此无法真正被回收,而且引用计数器开销大,每个对象都需要一个引用计数器,如果对象很多,开销就会很大。

什么是循环引用

public class Main {
    public static void main(String[] args) {
        A a = new A();
        B b = new B();
        a.setB(b);
        b.setA(a);
        a = null;
        b = null;
        System.gc();
    }
}

class A {
    private B b;

    public void setB(B b) {
        this.b = b;
    }
}

class B {
    private A a;

    public void setA(A a) {
        this.a = a;
    }
}

        类A和类B相互引用,每个对象都持有对方的引用,形成了一个循环引用的环,当Main方法执行完毕后,a和b对象都置为null。由于它们相互引用,它们的引用计数器都不为0,无法被垃圾回收器回收,导致内存泄漏,但是上面代码却不会发生内存泄漏,因为多数jvm没有采用这个引用计数器方案,而是采用可达性分析算法

GCRoot和可达性分析算法

什么是可达性分析算法

        简而言之就是从一些“GC Roots”对象开始,通过搜索引用链的方式,找到所有可达对象。如果一个对象没有任何引用链与GC Roots相连,那么它就被判定为不可用的,是可以被回收的垃圾对象。

什么是GC Root

        指一些被JVM认为是存活的对象,它们是垃圾回收算法的起点,可以理解为由堆外指向堆内的引用, 本身是没有存储位置,都是字节码加载运行过程中加入 JVM 中的一些普通引用。通俗的例子可以是一个树形结构,树的根节点就是GC Roots,是垃圾回收器的起点,如果一个节点没有任何子节点与根节点相连,那这个节点就被认为是不可达的,可以被回收器回收。

        举个例子,将GC Roots比喻成一座城市,城市中有很多建筑物,这些建筑物就是内存中的对象,GC Roots就像城市的卫生局、消防局等,它们直接或间接地与城市中的建筑物相连,从这些机构出发,通过道路、桥梁等连接,最终能够到达所有的建筑物,如果一个建筑物没有与这些机构相连,那么它就被认为是废弃的,可以被清理掉。

JVM中的GC Roots对象包括以下几种:

        1)虚拟机栈(栈帧中的本地变量表)中引用的对象。

        2)方法区中类静态属性引用的对象。JDK 1.7 开始静态变量的存储从方法区移动到堆中,比如你定义了一个static 的集合对象,那里面添加的对象就是可以被GC Root可达的

        3)方法区中常量引用的对象。字符串常量池从 JDK 1.7 开始由方法区移动到堆中,本地方法栈中JNI(即一般说的Native方法)引用的对象。

小技巧:由于GC Roots采用栈方式存放变量和指针,如果一个指针它保存了堆内存里面的对象,但是自己又不能存放在堆内存里面,那么它就是一个GC Roots。

代码举例

public class GCTest {
    public static void main(String[] args) {
        Product product = new Product("CSDN AI工具");
        product = null;
    }
}

//product 是栈帧中的本地变量,指向了 title = springboot 这个 Product 对象
//当product = null; 由于此时 当product 充当了 GC Root 的作用,当product 与原来指向 当product 对象断开了连接
// 所以这个 new Product("CSDN AI工具") 对象会被回收

对象回收的关键知识点

标记对象可回收就一定会被回收吗?

        不一定会回收,对象的finalize方法给了对象一次最后一次存活的机会。当对象不可达(可回收)并发生 GC 时,会先判断对象是否执行了 finalize 方法,如果未执行则会先执行 finalize 方法。前对象与 GC Roots 关联,执行 finalize 方法之后,GC 会再次判断对象是否可达,如果不可达,则会被回收,如果可达,则不回收!需要注意的是 finalize 方法只会被执行一次,如果第一次执行 finalize 方法,对象变成了可达,则不会回收,但如果对象再次被 GC,则会忽略 finalize 方法,对象会被直接回收掉!

可达性分析算法为什么可以解决循环引用造成的内存泄漏问题?

        当两个或多个对象相互引用时,它们的引用链会形成一个环,但是由于这个环中的对象与GC Roots没有任何引用链相连,所以JVM会将这些对象判定为不可用的,从而回收它们。如下图所示。

垃圾回收算法

标记-清除算法原理

         是一种常见的垃圾回收算法,它的基本思路是分为两个阶段:标记阶段清除阶段

        在标记阶段,垃圾回收器会从一些GC Roots对象开始,遍历整个对象图,标记所有被引用的对象。被标记的对象会被打上标记,表示这些对象是“活”的对象,需要保留下来,未被标记的对象就是垃圾对象,可以被回收。

        在清除阶段,垃圾回收器会对所有未被标记的对象进行回收。        

        其优点在于可以回收不连续的内存空间。其缺点也较为明显,标记和清除两个步骤,都需要垃圾回收器遍历整个对象图,耗费时间较长,会产生内存碎片,当频繁进行垃圾回收时,内存碎片会越来越多导致可用内存空间不足,从而影响程序的性能和稳定性。

        该算法应用场景应用在实际应用中,标记清除法一般用于不需要频繁进行垃圾回收的场景,比如在Java堆中大对象的分配和回收。其实后续的收集算法大多都是以标记-清除算法为基础,对其缺点进行改进。

标记-复制算法原理

        是一种常见的垃圾回收算法,它的基本思路是将Java堆分为两个区域:一个活动区域一个空闲区域。在垃圾回收过程中,首先标记所有被引用的对象,然后将所有被标记的对象复制到空闲区域中,最后交换两个区域的角色,完成垃圾回收。

详细实现步骤:

        1)将Java堆分为两个区域:一个活动区域一个空闲区域。初始时,所有对象都分配在活动区域中;

        2)从GC Roots对象开始,遍历整个对象图,标记所有被引用的对象;

        3)对所有被标记存活的对象进行遍历,将它们复制到空闲区域中,并更新所有指向它们的引用,使它们指向新的地址;

        4)对所有未被标记的对象进行回收,将它们所占用的内存空间释放;

        5)交换活动区域和空闲区域的角色,空闲区域变为新的活动区域,原来的活动区域变为空闲区域;

        6)当空闲区域的内存空间不足时,进行一次垃圾回收,重复以上步骤。

        其优点在于,如果内存中的垃圾对象较多,需要复制的对象就较少,则效率高,清理后,内存碎片少。其缺点也不少,虽然标记复制算法的效率较高,但是预留一半的内存区域用来存放存活的对象,占用额外的内存空间。如果出现存活对象数量比较多的时候,需要复制较多的对象效率低,假如是在老年代区域,99%的对象都是存活的,则性能低,所以老年代不适合这个算法。

        该算法应用场景应用在新生代的垃圾回收,因此需要对新生代的对象进行分代管理,虚拟机多数采用这个算法,对新生代进行内存管理,因为多数这个新生代区域的存活对象数量少。国外有公司统计过多数业务,98%撑不过一次GC,所以不用1:1比例分配新生代的空间。

        这么分配的原因在于,当发生GC时, 将Eden和Survivor中存活对象一次性复制到另外一块Survivor空间上, 然后清理掉Eden和已用过的那块Survivor空间,每次新生代中可用内存空间为整个新生代容量的90% (Eden的80% + Survivor的 10%) ,只有一个Survivor空间, 即10%的新生代是会被浪费而已。

标记-整理-压缩算法原理

        从根节点开始对所有可达对象做一次标记,但之后并不简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端,然后清理边界外的垃圾,避免了碎片的产生,也不需要两块相同的内存空间,因此性价比比较高。

        其优点在于,解决了标记清除算法的碎片化的问题。和对比标记-复制算法来看,该算法不用浪费额外的空间,因为前者算法需要预留一部分空闲区域用于复制。和对比标记-清除算法来看,前者是一种非移动式的回收算法,而该算法是移动式的回收,且解决了内存碎片化的问题。

        其缺点就是效率相比于标记复制算法低一些,在整理存活对象时,因对象位置的变动,需要调整该虚拟机栈中的引用地址。

         该算法应用场景应用在老年代的内存回收,它在标记-清除算法的基础上做了部分优化。 

几种算法对比

        标记-复制算法适合在存活对象少、垃圾对象多的场景,即新生代空间,朝生夕灭的场景

        标记-整理算法适合在存活对象多、垃圾对象少的场景,即老年代空间,都是历经多次GC,依旧存活的对象。

        而标记-清除算法属于基础算法,在处理时会有碎片化空间,效率低下,较少使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1629012.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

线程池处理任务的流程、步骤

线程池处理任务的流程 如果当前运行的线程数小于核心线程数,那么就会新建一个线程来执行任务。如果当前运行的线程数等于或大于核心线程数,但是小于最大线程数,那么就把该任务放入到任务队列里等待执行。如果向任务队列投放任务失败&#xf…

web-traffic-generator:一款功能强大的HTTP和HTTPs流量混淆工具

关于web-traffic-generator web-traffic-generator是一款功能强大的HTTP和HTTPs流量混淆工具,该工具基于纯Python开发,可以帮助广大研究人员在HTTP或HTTPs网络流量中提添加噪声,以此来实现流量混淆的目的。 本质上来说,web-traff…

为什么堆排序的时间复杂度是O(N*logN)?

目录 前言: 堆排序(以排升序为例) 步骤(用大根堆,倒这排,排升序): 1.先把要排列的数组建立成大根堆 2.堆顶元素(82)和最后一个元素交换(2&…

Docker之常见FAQ记录清单

一、前言 本文记录Docker使用过程中遇见的问题,供后续回顾参考。 关联资源:网络Docker博客、官方FAQ、文档、Docker 从入门到实践、中文社区、riptutorial 二、问题及处理记录 2.1、docker容器内没有vi,nano等编辑器 1)如果宿主机本地有&a…

ESP8266刷入WI-PWN制作wifi杀手的过程、准备材料、报错解决、烧录固件等

文章目录 ESP8266---介绍1. 技术规格:2. 软件支持:3. 特性:4. 应用领域: ESP8266---材料准备1.硬件设备1.1(micro-usb)梯形安卓数据线(必须要可以传数据)1.2(ESP8266&…

docker启动的mysql8中文乱码问题和无法输入中文

问题描述: 1.中文显示乱码 2.无法输入中文 中文乱码临时方案: show variables like ‘character%’; SET NAMES utf8mb4; SET CHARACTER SET utf8mb4; 中文乱码永久方案: vim /etc/my.cnf[client] default-character-setutf8mb4[mysql]…

笔试强训未见过题(个人向)

1.游游的水果大礼包 题目 解析 我们设卖出价值为c,卖出x个一号礼包,y个二号礼包。则caxby,那么就可以一一枚举,x的最大值为min(a/2,b),则y就为min(a-2*min,…

《Kafka 3.x.x 入门到精通》

Kafka 3.x.x 入门到精通 Kafka是一个由Scala和Java语言开发的,经典高吞吐量的分布式消息发布和订阅系统,也是大数据技术领域中用作数据交换的核心组件之一。以高吞吐,低延迟,高伸缩,高可靠性,高并发&#x…

AIGC学习步骤

目录 AIGC学习步骤 步骤一:理解基本概念 步骤二:学习资源 步骤三:深入研究 步骤四:联系专家 步骤五:实践应用 步骤六:持续学习 AIGC学习步骤 我们先来说说什么是AIGC? 生成式人工智能—…

数组和指针经典笔试题讲解

目录 创作不易,如对您有帮助,还望一键三连,谢谢!!! 1.sizeof和strlen的对比 1.1sizeof 1.2strlen 1.3sizeof和strlen对比 2.数组笔试题讲解 数组名的理解 2.1一维数组 2.2字符数组 题目一&#x…

快速进入Windows中的特殊文件夹

目录 一. 进入方式二. startup ⇒ 开机自启三. fonts ⇒ 电脑字体四. sendto ⇒ 发送到五. programs ⇒ 开始菜单应用六. appsfolder ⇒ 电脑中安装的所有应用七. appdata ⇒ 应用程序的数据八. desktop ⇒ 桌面文件夹九. ConnectionsFolder ⇒ 网络连接 一. 进入方式 ⏹文件管…

将数组中最大的数放在最后一位,最小的数放在第一位

#include <stdio.h> int main() {void input(int number[]);void output(int number[]);void swapmaxmin(int number[]);int number[10];input(number);//swapmaxmin(number);output(number);return 0; }//往一个数组里输入 void input(int number[]) {int i;for(i0;i<…

微信小程序的开发

1.了解项目的基本组成结构 pages 用来存放所有小程序的页面 utils 用来存放工具性质的模块(例如:格式化时间的自定义模块) app.js 小程序项目的入口文件 app.json 小程序项目的全局配置文件 app.wxss 小程序项目的全局样式文件 project.config.json 项目的配置文件 sitem…

直播任我行,智享AI自动直播手机塑造直播新风潮,引领行业“风口”

直播任我行&#xff01;智享AI自动直播手机塑造直播新风潮&#xff0c;引领行业“风口”&#xff01; 直播作为一种受欢迎的互联网传播方式&#xff0c;如今在帮助商家推广产品并获得更多收益方面发挥着重要作用。 在直播电商领域&#xff0c;主播是连接品牌和用户之间的关键纽…

K8S 哲学 - deployment -- kubectl【create 、 rollout 、edit、scale、set】

kubectl create kubectl rollout kubectl edit kubectl set kubectl scale 1、创建与配置文件解析 2、deploy 滚动更新 &#xff1a;template 里面的内容改变触发滚动更新 编辑该 deploy 的 配置文件 &#xff0c;加入一个 label 不会触发滚动更新 改变 nginx镜…

Python 面向对象——6.封装

本章学习链接如下&#xff1a; Python 面向对象——1.基本概念 Python 面向对象——2.类与对象实例属性补充解释&#xff0c;self的作用等 Python 面向对象——3.实例方法&#xff0c;类方法与静态方法 Python 面向对象——4.继承 Python 面向对象——5.多态 1. 封装的基…

cJSON的使用

文章目录 一、CJSON初识二、CJSON解析器基础三、CJSON解析数据JSON解析基础CJSON解析数组数据CJSON解析嵌套数据 五、创建JSON数据 一、CJSON初识 JSON (JavaScript Object Notation)是一种轻量级的数据交换格式&#xff0c;常用于在网络之间传输数据。它是一种文本格式&#…

OpenCV C++实现区域面积筛选以及统计区域个数

目录 1、背景介绍 2、代码实现 2.1 获取原图 2.1.1 区域图像imread 2.1.2 具体实现 2.2 获取图像大小 2.3 阈值分割 2.3.1 阈值分割threshold 2.3.2 具体实现 2.4 区域面积筛选 2.4.1 获取轮廓findContours 2.4.2 获取轮廓面积contourArea 2.4.3 填充区域fil…

JEECG/SpringBoot集成flowable流程框架

IDEA安装Flowable BPMN visualizer插件 pom.xml中引入flowable相关依赖 <dependency><groupId>org.flowable</groupId><artifactId>flowable-spring-boot-starter</artifactId><version>6.7.2</version></dependency><depe…

kotlin 编写一个简单的天气预报app (七)使用material design

一、优化思路 对之前的天气预报的app进行了优化&#xff0c;原先的天气预报程序逻辑是这样的。 使用text和button组合了一个输入城市&#xff0c;并请求openweathermap对应数据&#xff0c;并显示的功能。 但是搜索城市的时候&#xff0c;可能会有错误&#xff0c;比如大小写…