JVM探究
- 请谈谈你对JVM的理解?java8虚拟机和之前的变化、更新?
- 什么是OOM,栈溢出StackOverFlowError?怎么分析?
- JVM的常用调优参数有哪些?
- 内存快照如何 抓取,怎么分析Dump文件?知道吗?
- 谈谈JVM中,类加载器你的认识?(rt-jar ext application)
-
JVM的位置
-
JVM的体系结构
-
类加载器
-
双亲委派机制
-
沙箱安全机制
-
Native
-
PC寄存器
-
方法取
-
栈
-
三种JVM
-
堆
-
新生区、老年区
-
永久区
-
堆内存调优
-
GC
常用算法
-
JMM
-
总结
一、JVM的位置
JVM就是一个虚拟机软件,
操作系统也是一个软件
二、JVM的体系结构
Java栈、本地方法栈和程序计数器不会有垃圾。
JVM调优99%都是在调堆
三、类加载器
类加载器分类:会倒着一层一层往上找APP---->EXC---->BOOT(最终执行)
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序加载器
四、双亲委派机制
双亲委派机制:是安全的
java.lang文件夹下的东西一本不能动!
双亲委派机制的步骤:
- 类加载器收到类加载的请求
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
- 启动加载器检查是否能够加在当前这个类,能记载就结束,使用当前的加载器,否则,抛出异常,通知子加载器进行加载
- 重复步骤 3
classLoader获取不到出现null,因为 :java 调用不到~,C、C++
五、native、PC寄存器、方法区
native
:核心
JNI
本地方法接口:Java native Interface
凡是带了native
关键字的,说明java的作用范围达不到了,会去调用底层C语言的库!会进入本地方法栈。
JNI 作用:扩展 Java的使用,融合不同的编程语言为Java所用! 最初:C、C++
Java诞生的时候,C、C++横行,想要立足,必须要有调用C、C++的程序~
它在内存区域中专门开辟了一块标记区域:Native Method Stack,登记 native 方法
在最终执行的时候,加载本地方法库中的方法通过 JNI
程序计数器:Program Counter Register
每个线程都有一个程序计数器,是线程私有的们就是一个指针,指向方法区中的方法字节码(用来存储指向像一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计。
方法区 Method Aera
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造器函数、接口代码在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间。
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
static final Class 常量池
六、栈
栈:先进后出,后进先出
队列:先进先出(FIFO:First Input First Output)
为什么 main()先执行,最后结束~(因为方法放在栈中,最先入栈的最后出栈)
栈:别名“栈内存”,主管程序的运行,声明周期和线程同步;
线程结束,占内存也就释放,对于栈来说,不存在垃圾回收问题
一旦线程结束,栈就Over!
栈中存放的有:
8大基本类型
+对象引用
+实例的方法
8大基本类型:byte short int long float double char boolean
- 逻辑类型:boolean
- 整数类型:byte short int long
- 浮点类型:float double
- 字符类型:char
栈运行原理:栈帧(相当于一片一片的)
栈顶、栈底
黑色是栈,浅绿色是栈顶,黄色是栈底
父帧、子帧:
栈满了,会抛出 StackOverflowError
栈 + 堆 + 方法区:交互关系
七、三种JVM
使用 java -version 命令就可以查看
- Sun:HotSpot(99%)
- BEA:JRockit
- IBM:J9VM
我们学习都是: HotSpot
八、堆
堆:Heap,一个 JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放在堆中?类、方法、常量,变量~,保存我们所有引用类型的真实对象;
堆内存还要细分为三个区域:
- 新生区(伊甸园区)Young / New
- 养老区 old
- 永久区 Perm
GC垃圾回收主要是在新生区和养老区,更详细是伊甸园和养老区~
假设内存满了,OOM,堆内存不够!java.lang.OutOfMemoryError:Java heap space
在 JDK8以后,永久存储区改了一个名字(元空间)
新生区
- 是 类:诞生 和 成长的地方,甚至死亡;
- 伊甸园,所有的对象都是在 伊甸园区 new 出来的!
- 幸存者区(0,1)
永久区
这个区域常驻内存的。用来存放JDK自身携带的Class对象。Interface元数据,存储的是Java运行时的一些环境和类信息,这个区域不存在垃圾回收关闭VM虚拟机就会释放在这个区域的内存~
当一个启动类,加载了大量的第三方jar包。或者Tomcat部署了太多的应用,大量动态生成的反射类。在不断的被加载,直到内存满,就会出现OOM;
-
jkd1.6之前:永久代,常量池是在方法区;
-
jkd1.7 :永久代,但是慢慢的退化了,
去永久代
,常量池在堆中; -
jkd1.8之后:无永久代,常量池在元空间
jkd1.8之后的堆内存结构示意图:
元空间逻辑上存在,物理上不存在~(因为不会占用内存)
在一个项目中,突然出现了OOM故障,那么该如何排除~研究为什么出错?
- 能够看到代码第几行出错:内存快照分析工具,MAT,
Jprofiler
- Debug,一行行分析代码!:公司基本没有这样的条件去一行行debug
使用MAT,Jprofiler的作用:
- 分析Dump内存文件,快速定位内存泄露;
- 获得堆中的数据
- 获得大的对象
- …
设置最大内存和总内存的命令:
-Xms1024 -Xmx1024m -XX:+PrintGCDetails //打印GC垃圾回收信息
-Xms:设置初始化内存分配大小 默认 1/64
-Xmx:设置最大分配内存 默认 1/4
-Xms1m -Xmx8m -XX:+HeapOnOutOfMemoryError //oom Dump, 需要 Dump 错误的命令;命令含义:当堆Heap在报 OutOfMemoryError 时 Dump 下来
如何 排 OOM 错?
- 尝试扩大堆内存看结果
- 分析内存,看一下哪个地方出现了问题(使用Jproflie专业分析快照工具)
个人写的杂乱笔记:
package cs20230625;
/**
* @author: Arbicoral
* @create: 2023-06-25 19:24
* @Description: 跟着狂神的JVM
*
* 需要 Dump 错误的命令:-Xms1m -Xmx8m -XX:+HeapOnOutOfMemoryError //oom Dump
* 当堆Heap在报 OutOfMemoryError 时 Dump 下来
* -Xms:设置初始化内存分配大小 默认 1/64
* -Xmx:设置最大分配内存 默认 1/4
* -XX:+PrintGCDetails
*/
public class Demo {
public static void main(String[] args) {
long totalMemory = Runtime.getRuntime().totalMemory();
long maxMemory = Runtime.getRuntime().maxMemory();
System.out.println("max = " + maxMemory+"字节\t" + (maxMemory/(double)1024/1024) + "MB");
System.out.println("total = " + totalMemory+"字节\t" + (totalMemory/(double)1024/1024) + "MB");
//默认情况下:分配的总内存是 电脑内存的 1/4,而初始化内存 1/64
//OOM:
//1. 尝试扩大堆内存看结果
//2. 分析内存,看一下哪个地方出现了问题(使用Jproflie专业分析快照工具)
//-Xms1024 -Xmx1024m -XX:+PrintGCDetails //打印GC垃圾回收信息
}
}
九、GC垃圾回收
GC的作用区域:
JVM在进行 GC时,并不是对这三个区域统一回收。大部分时候,回收都是新生代~
-
新生代
-
幸存区(from,to)
-
老年区
GC两种类型:轻GC(普通的GC),重GC(全局GC 或 Full GC)
GC题目:
- JVM的内存模型和分区~详细到每个区放什么?
- 堆里面的分区有哪些? Eden, from , to, 老年区,永久区(元空间),说说他们的特点
- GC的算法有哪些?标记清除法,标记压缩,复制算法,引用计数器,怎么用的?
- 轻GC 和 重GC 分别在什么时候发生?
引用计数法
有一个专门负责计数的空间,当计数器发现对象引用为0就会被清理掉;
计数器本身也会有消耗(python用的就是这个)
复制算法
谁空谁是to
当一个对象经历了15次GC,都还没有死,就会进入养老区
-XX: -XX:MaxTenuringThreshold=999 通过这个参数可以设定进入老年代的时间
- 好处:没有内存碎片
- 坏处:浪费一半的空间;多了一半空间永远是空 to。假设对象100%存活(极端情况)
复制算法的最佳使用场景:对象存活度较低的时候;新生区
复制算法的流程图:
标记清除法
标记清除法,需要两次扫描,并且清除之后会有内存碎片。
- 优点:不需要额外的空间!
- 缺点:两次扫描,严重浪费时间,会产生内存碎片
标记压缩
再优化!
标记–>移动–>清除
标记清除压缩
先清除5次,这样内存碎片就很多,再压缩~
再压缩1次~
总结
内存效率: 复制算法 > 标记清除算法 > 标记清除压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记清除压缩算法 > 标记清除算法
内存利用率:标记清除压缩算法 = 标记清除算法 > 复制算法
思考一个问题:难道没有最优算法吗?
答案:没有。没有最好的算法,只有最合适的算法----->GC:粉黛收集算法
年轻代:
- 存活率低
- 复制算法!
老年代:
- 区域大:存活率高(不适合 用复制算法)
- 标记清除(当内存碎片不是太多时用标记清除) + 标记压缩混合实现
JMM
JMM:Java Memory Model Java内存模型
学习方法,先掌握总体路线、思路:
-
什么是JMM?
JMM是抽象的概念,并不真实存在,它描述的是一组规则或规范,通过这组规范定义了程序中各个变量(包括实例字段,静态字段和构成数组对象的元素)的访问方式。
-
它是干嘛的?:参考官方,其他人的博客,对应的视频!
作用:缓存一致性协议,用于定义数据读写的规则(遵守,找到这个规则)
解决共享对象可见性这个问题:
volatile
- 它该如何学习?
内存交互操作的8种方式:
- lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态。
- unlock(解锁):作用于主内存变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定
- read(读取):作用于主内存变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用
- load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
- use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
- assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
- store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作
- write(写入):作用于主内存的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中。
规则:
-
不允许一个线程无原因地把数据从工作央存同步到主内存中;
-
不允许一个线程丢弃最近assign的操作而不同步到主内存中;
-
不允许一个变量在主内存多过”诞生“,也不允许在工作内存直接使用未初始化(load或assign)的变量;
-
不允许一个变量在同一时刻有多个线程对其进行lock操作,仅允许一个线程Lock住并重复执行多次,多次lock需要相同次数的unlock操作,变量才会解锁。
-
一个变量被Lock,会将清空工作内存中的此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
-
不允许UnLock,一个没有lock的变量,也不允许unlock一个被其他线程Lock的对象;
-
一个变量被执行unlock操作之前必须先把该变量同步回主内存中(执行store、write操作)
JMM如何保证多线程环境下的线程同步问题呢?
使用volatile
关键字。
许一个线程无原因地把数据从工作央存同步到主内存中;
不允许一个线程丢弃最近assign的操作而不同步到主内存中;
不允许一个变量在主内存多过”诞生“,也不允许在工作内存直接使用未初始化(load或assign)的变量;
不允许一个变量在同一时刻有多个线程对其进行lock操作,仅允许一个线程Lock住并重复执行多次,多次lock需要相同次数的unlock操作,变量才会解锁。
一个变量被Lock,会将清空工作内存中的此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
不允许UnLock,一个没有lock的变量,也不允许unlock一个被其他线程Lock的对象;
一个变量被执行unlock操作之前必须先把该变量同步回主内存中(执行store、write操作)
JMM如何保证多线程环境下的线程同步问题呢?
使用volatile
关键字。
JMM部分参考JMM模型是什么?