内存结构
1、什么是 JVM ?
1)定义
Java Virtual Machine ,Java 程序的运行环境(Java 二进制字节码的运行环境)。
2)好处
一次编译,处处执行
自动的内存管理,垃圾回收机制
数组下标越界检查
3)比较
JVM、JRE、JDK 的关系如下图所示
4)学习路线
ClassLoader:Java 代码编译成二进制后,会经过类加载器,这样才能加载到 JVM 中运行。
Method Area:类是放在方法区中。
Heap:类的实例对象。
当类调用方法时,会用到 JVM Stack、PC Register、本地方法栈。
方法执行时的每行代码是有执行引擎中的解释器逐行执行,方法中的热点代码频繁调用的方法,由 JIT 编译器优化后执行,GC 会对堆中不用的对象进行回收。需要和操作系统打交道就需要使用到本地方法接口。
2、内存结构
1.8 之前
1.8之后
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LsYj4bSN-1681453963094)(https://guide-blog-images.oss-cn-shenzhen.aliyuncs.com/github/javaguide/java/jvm/java-runtime-data-areas-jdk1.8.png)]
1、程序计数器
1)定义
Program Counter Register 程序计数器(寄存器)
作用:是记录下一条 jvm 指令的执行地址行号。
特点:
是线程私有的
不会存在内存溢出
2)作用
解释器会解释指令为机器码交给 cpu 执行,程序计数器会记录下一条指令的地址行号,这样下一次解释器会从程序计数器拿到指令然后进行解释执行。
多线程的环境下,如果两个线程发生了上下文切换,那么程序计数器会记录线程下一行指令的地址行号,以便于接着往下执行。
2、虚拟机栈
1)定义
每个线程运行需要的内存空间,称为虚拟机栈
每个栈由多个栈帧(Frame)组成,对应着每次调用方法时所占用的内存
每个线程只能有一个活动栈帧,对应着当前正在执行的方法
问题辨析:垃圾回收是否涉及栈内存?
不会。栈内存是方法调用产生的,方法调用结束后会弹出栈。
栈内存分配越大越好吗?
不是。因为物理内存是一定的,栈内存越大,可以支持更多的递归调用,但是可执行的线程数就会越少。
方法的局部变量是否线程安全
-
如果方法内部的变量没有逃离方法的作用访问,它是线程安全的
局部变量 int i = 0;
-
是否为共享变量
static int i = 0;
每个线程访问后要把变量写回到static变量中,如果不加线程保护措施,回产生安全问题
-
如果是局部变量引用了对象,并逃离了方法的访问,那就要考虑线程安全问题。变量作为参数or返回值。
2)栈内存溢出
栈帧过大、过多、或者第三方类库操作,都有可能造成栈内存溢出 java.lang.stackOverflowError ,使用 -Xss256k 指定栈内存大小!
3)线程运行诊断
案例一:cpu 占用过多
解决方法:Linux 环境下运行某些程序的时候,可能导致 CPU 的占用过高,这时需要定位占用 CPU 过高的线程
top 命令,查看是哪个进程占用 CPU 过高
ps H -eo pid, tid(线程id), %cpu | grep 刚才通过 top 查到的进程号 通过 ps 命令进一步查看是哪个线程占用 CPU 过高
jstack 进程 id 通过查看进程中的线程的 nid ,刚才通过 ps 命令看到的 tid 来对比定位,注意 jstack 查找出的线程 id 是 16 进制的,需要转换。
3、本地方法栈
一些带有 native 关键字的方法就是需要 JAVA 去调用本地的C或者C++方法,因为 JAVA 有时候没法直接和操作系统底层交互,所以需要用到本地方法栈,服务于带 native 关键字的方法。
4、堆
在 JDK 7 版本及 JDK 7 版本之前,堆内存被通常分为下面三部分:
- 新生代内存(Young Generation)
- 老生代(Old Generation)
- 永久代(Permanent Generation)
下图所示的 Eden 区、两个 Survivor 区 S0 和 S1 都属于新生代,中间一层属于老年代,最下面一层属于永久代。
JDK 8 版本之后 PermGen(永久) 已被 Metaspace(元空间) 取代,元空间使用的是直接内存。
1)定义
Heap 堆
通过new关键字创建的对象都会被放在堆内存
特点
它是线程共享,堆内存中的对象都需要考虑线程安全问题
有垃圾回收机制
2)堆内存溢出
java.lang.OutofMemoryError :java heap space. 堆内存溢出
可以使用 -Xmx8m 来指定堆内存大小。
3)堆内存诊断
jps 工具
查看当前系统中有哪些 java 进程
jmap 工具
查看堆内存占用情况 jmap - heap 进程id
jconsole 工具
图形界面的,多功能的监测工具,可以连续监测
jvisualvm 工具
5、方法区
下面涉及了对象的访问定位
- Person 类的 .class 信息存放在方法区中
- person 变量存放在 Java 栈的局部变量表中
- 真正的 person 对象存放在 Java 堆中
- 在 person 对象中,有个指针指向方法区中的 person 类型数据,表明这个 person 对象是用方法区中的 Person 类 new 出来的
1)定义
Java 虚拟机有一个在所有 Java 虚拟机线程之间共享的方法区域。方法区域类似于用于传统语言的编译代码的存储区域,或者类似于操作系统进程中的“文本”段。它存储每个类的结构,例如运行时常量池、字段和方法数据,以及方法和构造函数的代码,包括特殊方法,用于类和实例初始化以及接口初始化方法区域是在虚拟机启动时创建的。
尽管方法区域在逻辑上是堆的一部分,但简单的实现可能不会选择垃圾收集或压缩它。此规范不强制指定方法区的位置或用于管理已编译代码的策略。
方法区域可以具有固定的大小,或者可以根据计算的需要进行扩展,并且如果不需要更大的方法区域,则可以收缩。方法区域的内存不需要是连续的!
2)组成
Hotspot 虚拟机 jdk 1.7 1.8 内存结构图
3)方法区内存溢出
1.8 之前会导致永久代内存溢出
使用 -XX:MaxPermSize=8m 指定永久代内存大小
1.8 之后会导致元空间内存溢出
使用 -XX:MaxMetaspaceSize=8m 指定元空间大小
4)运行时常量池
二进制字节码包含(类的基本信息,常量池,类方法定义,包含了虚拟机的指令)
首先看看常量池是什么,编译如下代码:
public class Test {
public static void main(String[] args) {
System.out.println("Hello World!");
}
}
然后使用 javap -v Test.class 命令反编译查看结果
每条指令都会对应常量池表中一个地址,常量池表中的地址可能对应着一个类名、方法名、参数类型等信息。
常量池:
就是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量信息
运行时常量池:
常量池是 *.class 文件中的一部分,当该类被加载以后,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
5)StringTable
常量池中的字符串仅是符号,只有在被用到时才会转化为对象
利用串池的机制,来避免重复创建字符串对象
字符串变量拼接的原理是StringBuilder
字符串常量拼接的原理是编译器优化
可以使用intern方法,主动将串池中还没有的字符串对象放入串池中
intern方法 1.8
调用字符串对象的 intern 方法,会将该字符串对象尝试放入到串池中
- 如果串池中没有该字符串对象,则放入成功
- 如果有该字符串对象,则放入失败
- 无论放入是否成功,都会返回串池中的字符串对象
注意:此时如果调用 intern 方法成功,堆内存与串池中的字符串对象是同一个对象;如果失败,则不是同一个对象
例子1下面的结果是?
public class Main {
public static void main(String[] args) {
String str = new String("a") + new String("b");
String st2 = str.intern();
String str3 = "ab";
System.out.println(str == st2);
System.out.println(str == str3);
}
}
public class Main {
public static void main(String[] args) {
// "a" "b" 被放入串池中,str 则存在于堆内存之中
String str = new String("a") + new String("b");
// 调用 str 的 intern 方法,这时串池中没有 "ab" ,则会将该字符串对象放入到串池中,此时堆内存与串池中的 "ab" 是同一个对象
String st2 = str.intern();
// 给 str3 赋值,因为此时串池中已有 "ab" ,则直接将串池中的内容返回
String str3 = "ab";
// 因为堆内存与串池中的 "ab" 是同一个对象,所以以下两条语句打印的都为 true
System.out.println(str == st2);
System.out.println(str == str3);
}
}
例子2
public class Main {
public static void main(String[] args) {
String str3 = "ab";
String str = new String("a") + new String("b");
String str2 = str.intern();
System.out.println(str == str2);
System.out.println(str == str3);
System.out.println(str2 == str3);
}
}
public class Main {
public static void main(String[] args) {
// 此处创建字符串对象 "ab" ,因为串池中还没有 "ab" ,所以将其放入串池中
String str3 = "ab";
// "a" "b" 被放入串池中,str 则存在于堆内存之中
String str = new String("a") + new String("b");
// 此时因为在创建 str3 时,"ab" 已存在与串池中,所以放入失败,但是会返回串池中的 "ab"
String str2 = str.intern();
// false
System.out.println(str == str2);
// false
System.out.println(str == str3);
// true
System.out.println(str2 == str3);
}
}
例子3
public static void main(String[] args) {
String s1 = "a";
String s2 = "b";
String s3 = "ab";
String s4 = s1 + s2; // new StringBuilder.append("a").append("b").toString() new String("ab")
String s5 = "a" + "b";
System.out.println(s3 == s4);
System.out.println(s3 == s5);
}
false // s4在堆上,s3在池内
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OF8gJNzB-1681453963095)(https://gitee.com/Gu-taicheng/image/raw/master/img/image-20220806170303658.png)]
true // s3 已经在池内,s5直接指向它 (javac 在编译期间的优化,结果在编译期间已经确定为ab)
StringTable特性
- 常量池中的字符串仅是符号,第一次用到时才变为对象
- 字符串变量拼接的原理是 StringBuilder (1.8)
- 字符串常量拼接的原理是编译期优化
- 可以使用 intern 方法,主动将串池中还没有的字符串对象放入串池
- 1.8 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有则放入串池, 会把串池中的对象返回
- 1.6 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有会把此对象复制一份(此时堆中的和串池中的已经不一样了),放入串池, 会把串池中的对象返回
jdk 1.6 时结果?
public class Test {
public static void main(String[] args) {
String s = new String("a") + new String("b");
String s2 = s.intern();
String x = "ab";
System.out.println(s2 == x);
System.out.println(s == x);
}
}
public class Test {
// 常量池中【a,b,ab】
public static void main(String[] args) {
// 堆中 new string a ,new string b,new string ab
String s = new String("a") + new String("b");
// 拷贝一份 放入串池
String s2 = s.intern();
String x = "ab";
// s2 是堆上复制的一份, 复制了一份s放入串池并赋给s2
System.out.println(s2 == x); // true
// s 是堆的,x 在池中
System.out.println(s == x); // false
}
}
6)StringTable 的位置
jdk1.6 StringTable 位置是在永久代中,1.8 StringTable 位置是在堆中。
7)StringTable 垃圾回收
-Xmx10m 指定堆内存大小
-XX:+PrintStringTableStatistics 打印字符串常量池信息
-XX:+PrintGCDetails
-verbose:gc 打印 gc 的次数,耗费时间等信息
8)StringTable 性能调优
因为StringTable是由HashTable实现的,所以可以适当增加HashTable桶的个数,来减少字符串放入串池所需要的时间
-XX:StringTableSize=桶个数(最少设置为 1009 以上)
考虑是否需要将字符串对象入池
可以通过 intern 方法减少重复入池
6、直接内存
1)定义
Direct Memory
- 常见于 NIO 操作时,用于数据缓冲区
- 分配回收成本较高,但读写性能高
- 不受 JVM 内存回收管理
2)使用直接内存的好处
文件读写流程:
因为 java 不能直接操作文件管理,需要切换到内核态,使用本地方法进行操作,然后读取磁盘文件,会在系统内存中创建一个缓冲区,将数据读到系统缓冲区, 然后在将系统缓冲区数据,复制到 java 堆内存中。缺点是数据存储了两份,在系统内存中有一份,java 堆中有一份,造成了不必要的复制。
使用了 DirectBuffer 文件读取流程
直接内存是操作系统和 Java 代码都可以访问的一块区域,无需将代码从系统内存复制到 Java 堆内存,从而提高了效率。
3)直接内存回收原理
直接内存的回收不是通过 JVM 的垃圾回收来释放的,而是通过unsafe.freeMemory 来手动释放。
直接内存的回收机制总结
使用了 Unsafe 类来完成直接内存的分配回收,回收需要主动调用freeMemory 方法
ByteBuffer 的实现内部使用了 Cleaner(虚引用)来检测 ByteBuffer 。
一旦ByteBuffer 被垃圾回收,那么会由 ReferenceHandler(守护线程) 来调用 Cleaner 的 clean 方法调用 freeMemory 来释放内存
一般用 jvm 调优时,会加上下面的参数:
-XX:+DisableExplicitGC // 静止显示的 GC
1
意思就是禁止我们手动的 GC,比如手动 System.gc() 无效,它是一种 full gc,会回收新生代、老年代,会造成程序执行的时间比较长。所以我们就通过 unsafe 对象调用 freeMemory 的方式释放内存。
死锁
常见面试题
- 百度
- 三面:说一下JVM内存模型吧,有哪些区?分别干什么的?
- 蚂蚁金服:
- Java8的内存分代改进
- JVM内存分哪几个区,每个区的作用是什么?
- 一面:JVM内存分布/内存结构?栈和堆的区别?堆的结构?为什么两个survivor区?
- 二面:Eden和survior的比例分配
- 小米:
- jvm内存分区,为什么要有新生代和老年代
- 字节跳动:
- 二面:Java的内存分区
- 二面:讲讲vm运行时数据库区
- 什么时候对象会进入老年代?
- 京东:
- JVM的内存结构,Eden和Survivor比例。
- JVM内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为Eden和survivor。
- 天猫:
- 一面:Jvm内存模型以及分区,需要详细到每个区放什么。
- 一面:JVM的内存模型,Java8做了什么改
- 拼多多:
- JVM内存分哪几个区,每个区的作用是什么?
- 美团:
- java内存分配
- jvm的永久代中会发生垃圾回收吗?
- 一面:jvm内存分区,为什么要有新生代和老年代?