【Java EE初阶三十】JVM的简单学习

news2025/1/6 18:42:41

1. JVM 内存区域划分

        
        一个运行起来的 Java 进程,就是一个 JVM 虚拟机,需要从操作系统申请一大块内存,就会把这个内存,划分成不同的区域,每个区域都有不同的作用.
        JVM 申请了一大块内存之后,也会划分成不同的内存区域,下面来详细讲解一下各个区域:

1、方法区

        (jdk1.7 及其之前)/ 元数据区 (jdk1.8 开始)
        这里存储的内容,就是类对象。.class 文件加载到内存之后,就成了类对象。

2、堆
        这里存储的内容,就是代码中 new 的对象(该区域是占据空间最大的区域)

3、栈
        这里存储的内容,就是代码执行过程中,方法之间的调用关系,如下图所示:

        4. 程序计数器
        是一个比较小的空间,主要就是存放一个"地址",表示下一条要执行的指令在内存中的哪个地方(方法区里每个方法里面的指令, 都是以二进制的形式保存到对应的类对象中的),刚开始调用方法,程序计数器记录的就是方法的入口的地址,随着一条一条的执行指令,每执行一条,程序计数器的值都会自动更新,即去指向下一条指令;

        如果是一个顺序执行的代码,下一条指令就是把指令地址进行递增;

        如果是条件/循环代码,下一条指令就可能会跳转到一个比较远的地址;

        下面进行举例:

主要知识点如下图所示:

        本地方法:指的是使用 native 关键字修饰的方法.这个方法不是使用 java 实现,而是在jvm 内部通过 C++ 代码实现的,JVM 内部的 C++ 代码调用关系;

        虚拟机栈,以及程序计数器都是每个线程都有一份,JVM 进程中有 10 个线程就会有 10 个虚拟机栈,也会有 10 个程序计数器(每个线程各自有一个)

        堆区和元数据区,这俩东西在 JvM 进程中是只有一份的

        下面给你一个代码,问你某个变量是处于内存中的哪个区域中?

        一个变量处于哪个区域,和变量的形态密切相关,局部变量处于栈上。成员变量在堆上,静态变量在与数据区内;同时我们要知道变量处于哪个空间上,和变量是不是引用类型,是不是基本类型是没有关系的

        new 出来的对象在堆上,于此同时又创建了一个局部变量 Test t引用类型的变量,就把对象地址存储到t里面了,t里面存储的不是对象本身;

        一个 JvM 进程里,可能有多个线程.每个线程,有自己的程序计数器和栈空间,这些线程共用同一份堆和方法区;

2. jvm中类加载的过程

        java 代码会被编译成.class 文件(包含了一些字节码),java 程序要想运行起来,就需要让 jvm读取到这些.class 文件,并且把里面的内容,构造成类对象并保存到内存的方法区中.(所谓的"执行代码”,就是调用方法.就需要先知道每个方法编译后生成的指令都是啥)

        一般来说将整个类加载的过程分为5个部分:

2.1 加载

        找到 .class 文件,打开文件,读取文件内容;

        往往代码中,会给定某个类的,"全限定类名“,例如java.lang.String,java.util.ArrayList,jvm 就会根据这个类名,在一些指定的目录范围内查找.

2.2 .验证

        .class 文件是一个二进制的格式,(每一个字节,都是有某些特定含义的)就需要验证你当前读到的这个格式是否符合要求.

        下图就是.class文件需要遵循的格式:

2.3 准备 

        给类对象分配内存空间 (最终的目标就是要构造出 类对象)

        我们这一步只是分配内存空间,还没有初始化呢.此时这个空间上的内存的数值,就是全0 ,(此时如果尝试打印类的 static 成员,结果就是全0的);

2.4 解析

         针对类对象中包含的字符串常量进行处理, 进行一些初始化操作,java 代码中用到的字符串常量在编译之后,也会进入到 .class 文件中;下面通过对字符串s的解析进行进一步说明:

        于此同时,.class 文件的二进制指令中,也会有一个s这样的引用被创建出来,由于引用里面本质上保存的是一个变量的地址,在 .class 文件中,这是文件不涉及到内存地址,因此住 .class 文件中,s 的初始化语句,即先会被设置成一个“文件偏移量”,通过偏移量,就能找到"test"这个字符串所在的位置;

        下面来简单说明一下文件偏移量:

        接下来,

这个过程,也叫做: 把"符号引用(文件偏移量)替换成“"直接引用)(内存地址)

2.5 初始化

        针对类对象进行初始化

        把类对象中需要的各个属性都设置好,同时还需要初始化好 static 成员变量,还需要执行静态代码块,以及还可能需要加载一下父类.

2.6 双亲委派模型

        双亲委派模型属于类加载中第一个步骤->"加载"过程中的一个环节,主要是根据负责根据全限定类名来找到 .class 文件.

        类加载器是 JVM 中的一个模块,JM 中中内置了下面如图所示的三个类加载器:

        如上图所示,这个父子关系并不是“继承"构成的,而是这几个 ClassLoader 里有一个 parent 这样的属性,指向了一个 父"类加载器";

        下面来详细描述一下类加载的过程(即找 .class 文件的过程):

1、给定一个类的全限定类名,形如 java.lang.String;

2、从 Application ClassLoader 作为入口,开始执行査找的逻辑

3、Application ClassLoader不会立即去扫描自己负责的目录(负责的是搜索项目当前目录和第三方库对应目录),而是把查找的任务,交给它的父亲,Extension ClassLoade

4、 Extension ClassLoader,也不会立即扫描自己负责的目录(负责的是 JDK 中一些扩展的库所对应的目录),而是把查找的任务交给它的父亲BootStrap ClassLoade;

5、Bootstrap ClassLoader,也不想立即扫描自己负责的目录(负责的是 标准库 的目录),也想把任务交给它的父亲,结果发现,自己没有父亲,因此 BootStrap ClassLoader 只能亲自负责扫描标准库的目录,如下所示:

        像java.lang.String.这种类,就能够在标准库中,找到对应的 .class 文件,就可以进行打开文件,读取文件......此时,查找 .class 文件的过程就结束了;但是,如果给定的类不是标准库的类,任务仍然会被交给孩子来执行;

6、没有扫描到就会回到 Extension ClassLoader.Extension ClassLoader 就会扫描负责的扩展库的目录.如果找到,就执行后续的类加载操作,此时查找过程结束还没有没找到,就会把任务交给他的孩子来执行.

7、没有扫描到, 就会回到 Application ClassLoade),Application ClassLoader 就会负责扫描当前项目和第三方库的目录.如果找到,就执行后续的类加载操作.如果没找到,就会抛出一个 ClassNotFoundException;

        综上所述,所谓的“双亲委派模型“,其实就是一个查找优先级的问题;简单的查找流程如下图所示:

        之所以搞这一套流程,主要的目的是为了确保标准库的类被加载的优先级最高,其次是扩展库,其次是自己写的类和第三方库;

3. GC 垃圾回收 

        C 语言中,像 malloc 这种, 就属于是"动态申请内存”(运行时),其实很多时候, 需要程序真正跑起来,才能确定内存的大小;

        在C 语言中, 使用 malloc 申请的内存,需要在用完之后, 通过 free 来释放。(此处如果不释放,就会产生"内存泄露”这样的问题)

        C++里,动态申请内存,变成 new,malloc 只是申请内存.new,能够申请内存,也能初始化(调用构造函数),在C++ 中,使用 new 申请的内存,用完之后, 通过 delete 来释放;

        在 Java 中, new 一个对象也就是"动态内存申请”;

        综上所述,相比之下, java 给出了一个方案,垃圾回收机制 (GC),让 JVM 自行判定,某个内存是否就不再使用了,如果这个内存后面确实不用了,JVM 就自动的把这个内存给回收掉,此时就不必让程序猿自己手动写代码回收;

        下面首先来了解一下GC机制的缺陷:

        1.系统开销,需要有一个或一些特定的线程,不停的扫描内存中的所有的对象, 看是否能够回收,此时是需要额外的内存和CPU 资源的.

        2.效率问题,这样的扫描线程,不一定能够及时的释放内存(扫描总是有一定周期的)一旦同一时刻,出现大量的对象都需要被回收,GC 产生的负担就会很大.甚至引起整个程序都卡顿.(STW 问题:即stop the world);

        GC 是垃圾回收,GC 回收的目标其实是内存中的对象,对于 Java 来说, 就是 new 出来的这些对象;栈里的局部变量,是跟随着栈帧的生命周期走的,(方法执行结束,栈帧销毁,该部分的内存自然释放);静态变量的生命周期就是整个程序,这个始终存在就意味着静态变量是无需释放的;因此真正需要 gc 释放的, 就是堆上的对象了.

        gc 可以理解成两个大的步骤:
1. 找到垃圾
2. 释放垃圾

3.1  找到垃圾

        在 GC 的领域中, 有两种主流的方案:

1)、引用计数 [Python, PHP]

        new 出来的对象,单独安排一块空间,来保存一个计数器,如下图所示:

        在Java 中,使用对象,必须要依靠引用,如果一个对象,没有引用指向了,就可以视为是垃圾了(引用计数就是0 )

        对于上述代码,出了 { }之后,t 和 t2 就都销毁了,即引用计数就要归0了,当对象的引用计数为 0,此时代码中就不可能访问到这个对象了,此时这个对象就可以视为是垃圾了;

        关于 java 不使用引用计数的分析,引用计数存在两个重要的问题:

        1、比较浪费内存.
        计数器最少需要2个字节,如果对象本身就很小,这个计数器占据的空间比例就很大;
比如对象本身就 2 个字节,计数器占据的空间就是 50%;如果对象本身 4个字节?计数器占据的空间就是 33% ;如果对象很少, 或者对象比较大, 都影响不大。但是如果对象小并且很多,计数器所占据的空间就十分巨大;

        2、引用计数机制,存在"循环引用”问题,如下面的一段代码所示:

 a,b及其引用的内存分布如下所示:

        此时,当前a和 b 两个引用已经销毁了,new 出来的这俩对象,已经无法被其他代码访问到了,但是他们的引用计数却是不为0的,所以这俩对象是不能被回收的;此时,第一个对象引用了第二个对象,第二个对象引用了第一个对象.

2)、可达性分析 【java】
        可达性分析本质上是时间换空间的手段;

        有一个/一组线程周期性的扫描我们代码中所有的对象,从一些特定的对象出发,尽可能的进行访问的遍历,把所有能够访问到的对象,都标记成“可达”,反之,经过扫描之后, 未被标记的对象,就是垃圾;

        不仅仅是所有的局部变量,还有常量池中引用的对象,还有方法区中的静态引用类型引用的变量,都统称为 GCRoots,当然,这里的遍历大概率是 N 叉树.主要就是看所访问的某个对象,里面有多少个引用类型的成员,并针对每个引用类型的成员都需要进一步的进行遍历;

        可达性分析都是周期性进行的,当前某个对象是否是垃圾,是随着代码的执行而发生改变,总之就是可达性分析比较消耗系统资源,开销比较大;

3.2 回收垃圾

3.2.1 标记清除

        该方式是比较简单粗暴的释放方式,下面黑色区域是被标记的要被清除的,

        把对应的对象,直接释放掉,就是标记清除的方案,但是这个方案其实非常不好,因为会产生很多的内存碎片,释放内存的主要目的是为了让别的代码能够申请到"连续”的内存空间,但是这样会导致我们能用的内存是断断续续的;随着时间的推移,内存碎片的情况就会越演越烈,如此就会导致后续内存申请举步维艰.

3.2.2 复制算法

        通过复制的方式,把有效的对象归类到一起.再统一释放剩下的空间;

        

        把内存分成两份,一次只用其中的一半,这个方案可以有效解决内存碎片的问题.但是缺点也很明显:
1、内存要浪费一半,利用率不高;
2、如果有效的对象非常多,拷贝开销就很大;

3.2.3 标记整理

        既能够解决内存碎片的问题,又能处理复制算法中利用率;

        类似于顺序表删除元素的搬运操作

3.2.4 分代回收

        实际上,JVM 采取的释放思路是上述基础思路结合体,分代回收,对象能活过的 GC 扫描轮次越多, 就是越老;

        伊甸区:

        刚 new 的新的对象放到伊甸区,从对象诞生,到第一轮可达性分析扫描,这个过程中
虽然时间不长(往往就是毫秒或秒)但是,在这个时间里,大部分的对象都会成为垃圾,

        释放过程如下所示:

1)、伊甸区 =>幸存区

         使用复制算法,每一轮 GC 扫描之后, 都把有效对象复制到幸存区中,伊甸区就可以整个释放了,由于经验规律,真正需要复制的对象不多,所以非常适合复制算法;

2)、GC 扫描线程也会扫描幸存区.
        就会把活过GC 扫描的对象(扫描过程中可达),拷贝到幸存区的另一个部分,幸存区之间的拷贝,每一轮会拷贝多个对象,每一轮也会淘汰掉一批对象(有些对象随着时间的推移,就成了垃圾)

3)、当这个对象已经在幸存区存活过很多轮 GC 扫描之后,JVM 就认为这个对象,短时间内应该是释放不掉了,就会把这个对象拷贝到老年代;

4)、进入老年代的对象, 虽然也会被 GC 扫描,但是老年代 GC 扫描的频率就会比新生代;

        分代回收,是 JVM 中主要的回收的思想方法.,但是在垃圾回收器具体实现的时候,可能还会有一些调整和优化.

ps:到这里java ee初阶的内容就结束了,感谢陪伴了很久的自己,尤其是在上完班后晚上敲写博客的自己,还是那句话,虽然多阻滞,花发再重荣!!!

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1499538.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【算法刷题】Day30

1. 汉诺塔问题 原题链接 题干: 算法原理: 利用递归算法 将x柱子上的一堆盘子,借助 y柱子,转移到z 柱子上面 递归函数流程: 当前问题规模为 n1 时,直接将 A 中的最上面盘子挪到 C 中并返回递归将 A 中最…

spm用于颅骨去除和配准

1. 颅骨去除 出现这个界面就一直等待即可: segment的结果文件中会出现四个文件夹label、mri、report、surf 在mri文件中,mwp1是分割出来的灰质图像,mwp2是分割出来的白质图像,这两图像均是bias correction和空间配准后的。p0**…

Keepalive 解决nginx 的高可用问题

一 说明 keepalived利用 VRRP Script 技术,可以调用外部的辅助脚本进行资源监控,并根据监控的结果实现优先动态调整,从而实现其它应用的高可用性功能 参考配置文件: /usr/share/doc/keepalived/keepalived.conf.vrrp.localche…

机器学习——分类问题、logistic分类算法

之前我们学习的线性回归算法,适用于预测值y为连续值的情况下,但是在分类问题中,预测值y是个离散值,所以线性回归算法不适用。在这篇文章中,主要以二分类问题为例,介绍分类算法————logistic回归算法&…

Docker容器化解决方案(容器生命周期管理)

容器生命周期管理 1.run 创建一个新的容器并运行一个命令 语法格式docker run [OPTIONS] IMAGE [COMMAND][ARG...] 备注:其实跟docker create一样的语法格式,只不过可以运行容器甚至进入容器内部COMMAND: 需要在容器内执行的命令docker run执行流程首先在指定镜像…

基于单片机的老人防丢系统设计

目 录 摘 要 I Abstract II 引 言 3 1 系统总体架构 6 1.1方案设计与选择 6 1.2 系统架构设计 6 1.3 系统器件选择 7 2 系统硬件设计 9 2.1 单片机外围电路设计 9 2.2 LCD1602液晶显示电路设计 12 2.3 短信模块电路设计 14 2.4 GPS模块电路设计 14 2.5 电源与按键控制电路设计…

创邻科技获评环紫金港创新生态圈智源创新企业

3月1日,由杭州城西科创大走廊管理委员会指导,中共杭州市西湖区委员会、西湖区人民政府主办的“环紫金港创新生态圈”行动推进大会暨2024年紫金港科技城经济高质量发展大会在杭州举办。凭借重要的生态位置和创新业务成果,创邻科技受邀参会并被…

WPF ListBox滚动条一直在最底部

需求:解压文件 显示解压进度 private void AppendProcessText(string content){//注意这两段代码的先后顺序listBox01.Items.Add(content);listBox01.ScrollIntoView(listBox01.Items[listBox01.Items.Count - 1]);}

CubeMX使用教程(2)——点亮LED

在上一章,我们完成了CubeMX的环境配置,这一章我们通过CubeMX来完成点亮LED的工作。 通过LED原理图可知,如果我们要点亮LD1(第一个灯),它对应开发板的PC8端口,因此我们应该在CubeMX中将PC8配置为…

Docker-完整项目的部署(保姆级教学)

目录 1 手动部署(白雪版) 1.1 创建网络 1.2 MySQL的部署 1.2.1 准备 1.2.2 部署 1.3 Java项目的部署 1.3.1 准备 1.3.1.1 将Java项目打成jar包 1.3.1.2 编写Dockerfile文件 1.3.2 部署 1.3.2.1 将jar包、Dockerfile文件放在linux同一个文件夹下 1.3.2.2 构建镜像 …

工业耐火砖的尺寸标准检测装置设计

目 录 摘 要 I Abstract II 引 言 1 1 控制系统设计 3 1.1 系统方案设计 3 1.2 系统工作原理 5 2 项目硬件设计 6 2.1 主控模块 6 2.2 检测模块 8 2.3 驱动模块 10 2.4 电源模块 11 2.5 按扭模块 13 2.6 指示灯模块 14 2.7 系统传送机构 14 2.8 总体设计 15 3 项目软件设计 17…

可以实现单个、两个、四个圆角的qml自定义控件

控件名: RadiusRectangle File: RadiusRectangle.qml import QtQuick 2.0Item {id: rootwidth: 100height: 100clip: trueproperty int itemRadius: 0property color itemColor: "red"property real itemOpacity: 1property int rightMargin: 0property int leftMar…

Finetuning Large Language Models: Sharon Zhou

Finetuning Large Language Models 课程地址:https://www.deeplearning.ai/short-courses/finetuning-large-language-models/ 本文是学习笔记。 Goal: Learn the fundamentals of finetuning a large language model (LLM). Understand how finetu…

143:vue+leaflet 在25833投影坐标下,加载一小块图像叠层数据

第143个 点击查看专栏目录 本示例是介绍如何在vue+leaflet, 自定义CRS,形成新的投影,这里是25833投影,并使用 L.Proj.imageOverlay的方法在地图上加载载一小块图像叠层数据。 直接复制下面的 vue+openlayers源代码,操作2分钟即可运行实现效果. 文章目录 示例效果配置方式…

Redis冲冲冲——redis数据类型及对应的数据结构

目录 引出redis数据类型及对应的数据结构Redis入门1.Redis是什么?2.Redis里面存Java对象 Redis进阶1.雪崩/ 击穿 / 穿透2.Redis高可用-主从哨兵3.持久化RDB和AOF4.Redis未授权访问漏洞5.Redis里面安装BloomFilte Redis的应用1.验证码2.Redis高并发抢购3.缓存预热用户…

Pycharm的Project Structure (项目结构)

文章目录 一、Sources二、Tests三、Exeluded四、Namespace packages五、Templates六、Resources 一、Sources 源代码根目录:包含项目的主要源代码,它会在这个目录下搜索代码,然后自动补全和只能提示都通过这里的代码提供。若项目运行自定义代…

基于ACM32 MCU的电动滑板车方案介绍

随着智能科技的快速发展,电动滑板车的驱动系统也得到了长足的发展。国内外的电动滑板车用电机驱动系统分为传统刷式电机和无刷电机两种类型。其中,传统的刷式电机已经逐渐被无刷电机所取代,无刷电机的性能和寿命都更出色,已成为电…

深度解读NCDA设计大赛中园林/景观设计命题

未来设计师全国高校数字艺术设计大赛(NCDA)又在火热进行中,各个命题单元也都在陆续的发出自己的参赛要求,不知道各位大学生们准备的怎么样了。相信大家一定在全网搜索往年 NCDA 的获奖作品,今天我就给大家整理了一些 N…

【Pytorch】进阶学习:基于矩阵乘法torch.matmul()实现全连接层

【Pytorch】进阶学习:基于矩阵乘法torch.matmul()实现全连接层 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&#x1f448…

在Jetson Xavier NX 开发板上使用VScode执行ROS程序详细过程

1.创建 ROS 工作空间ws 在home下打开终端输入下面指令 mkdir -p xxx_ws/src(必须得有 src) cd 自己命名_ws catkin_make2.启动 vscode cd 自己命名_ws code .3.vscode 中编译 ros 快捷键 ctrl shift B 调用编译,在上方弹窗位置选择:catkin_make:build 可以点击…