1. JVM
由那些部分组成,运行流程是什么?
JVM
是什么
Java Virtual Machine
Java
程序的运行环境(java
二进制字节码的运行环境)
好处:
-
一次编写,到处运行
-
自动内存管理,垃圾回收机制
JVM
由哪些部分组成,运行流程是什么?
从图中可以看出JVM
的主要组成部分
ClassLoader
(类加载器)Runtime Data Area
(运行时数据区,内存分区)Execution Engine
(执行引擎)Native Method Library
(本地库接口)
运行流程:
(1)类加载器(ClassLoader
)把Java
代码转换为字节码
(2)运行时数据区(Runtime Data Area
)把字节码加载到内存中,而字节码文件只是JVM
的一套指令集规范,并不能直接交给底层系统去执行,而是有执行引擎运行
(3)执行引擎(Execution Engine
)将字节码翻译为底层系统指令,再交由CPU
执行去执行,此时需要调用其他语言的本地库接口(Native Method Library
)来实现整个程序的功能。
2. 什么是程序计数器?
程序计数器:线程私有的,内部保存的字节码的行号。用于记录正在执行的字节码指令的地址。
javap -verbose xx.class
打印堆栈大小,局部变量的数量和方法的参数。
java
虚拟机对于多线程是通过线程轮流切换并且分配线程执行时间。在任何的一个时间点上,一个处理器只会处理执行一个线程,如果当前被执行的这个线程它所分配的执行时间用完了【挂起】。处理器会切换到另外的一个线程上来进行执行。并且这个线程的执行时间用完了,接着处理器就会又来执行被挂起的这个线程。
那么现在有一个问题就是,当前处理器如何能够知道,对于这个被挂起的线程,它上一次执行到了哪里?那么这时就需要从程序计数器中来回去到当前的这个线程他上一次执行的行号,然后接着继续向下执行。
程序计数器是JVM
规范中唯一一个没有规定出现OOM
的区域,所以这个空间也不会进行GC
。
3. 你能给我详细的介绍Java
堆吗?
线程共享的区域:主要用来保存对象实例,数组等,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError
异常。
- 年轻代被划分为三部分,
Eden
区和两个大小严格相同的Survivor
区,根据JVM
的策略,在经过几次垃圾收集后,任然存活于Survivor
的对象将被移动到老年代区间。 - 老年代主要保存生命周期长的对象,一般是一些老的对象
- 元空间保存的类信息、静态变量、常量、编译后的代码
为了避免方法区出现OOM
,所以在java8
中将堆上的方法区【永久代】给移动到了本地内存上,重新开辟了一块空间,叫做元空间。那么现在就可以避免掉OOM
的出现了。
元空间(MetaSpace
)介绍
在HotSpot JVM
中,永久代(≈
方法区)中用于存放类和方法的元数据以及常量池,比如Class
和Method
。每当一个类初次被加载的时候,它的元数据都会放到永久代中。
永久代是有大小限制的,因此如果加载的类太多,很有可能导致永久代内存溢出,即OutOfMemoryError
,为此不得不对虚拟机做调优。
那么,Java 8
中PermGen
为什么被移出HotSpot JVM
了?
官网给出了解释:http://openjdk.java.net/jeps/122
This is part of the JRockit and Hotspot convergence effort. JRockit customers do not need to configure the permanent generation (since JRockit does not have a permanent generation) and are accustomed to not configuring the permanent generation.
移除永久代是为融合HotSpot JVM与 JRockit VM而做出的努力,因为JRockit没有永久代,不需要配置永久代。
1)由于PermGen
内存经常会溢出,引发OutOfMemoryError
,因此JVM
的开发者希望这一块内存可以更灵活地被管理,不要再经常出现这样的OOM
。
2)移除PermGen
可以促进HotSpot JVM
与JRockit VM
的融合,因为JRockit
没有永久代。
准确来说,Perm
区中的字符串常量池被移到了堆内存中是在Java7
之后,Java 8
时,PermGen
被元空间代替,其他内容比如类元信息、字段、静态属性、方法、常量等都移动到元空间区。比如java/lang/Object
类元信息、静态属性System.out
、整型常量等。
元空间的本质和永久代类似,都是对JVM
规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制。
4. 什么是虚拟机栈?
Java Virtual machine Stacks
(java
虚拟机栈)
-
每个线程运行时所需要的内存,称为虚拟机栈,先进后出
-
每个栈由多个栈帧(
frame
)组成,对应着每次方法调用时所占用的内存 -
每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法
-
垃圾回收是否涉及栈内存?
垃圾回收主要指就是堆内存,当栈帧弹栈以后,内存就会释放
-
栈内存分配越大越好吗?
未必,默认的栈内存通常为
1024k
栈帧过大会导致线程数变少,例如,机器总内存为
512m
,目前能活动的线程数则为512个,如果把栈内存改为2048k
,那么能活动的栈帧就会减半 -
方法内的局部变量是否线程安全?
-
如果方法内局部变量没有逃离方法的作用范围,它是线程安全的
-
如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
-
比如以下代码:
-
栈内存溢出情况
-
栈帧过多导致栈内存溢出,典型问题:递归调用
-
栈帧过大导致栈内存溢出
组成部分:堆、方法区、栈、本地方法栈、程序计数器
1、堆解决的是对象实例存储的问题,垃圾回收器管理的主要区域。
2、方法区可以认为是堆的一部分,用于存储已被虚拟机加载的信息,常量、静态变量、即时编译器编译后的代码。
3、栈解决的是程序运行的问题,栈里面存的是栈帧,栈帧里面存的是局部变量表、操作数栈、动态链接、方法出口等信息。
4、本地方法栈与栈功能相同,本地方法栈执行的是本地方法,一个Java
调用非Java
代码的接口。
5、程序计数器(PC
寄存器)程序计数器中存放的是当前线程所执行的字节码的行数。JVM
工作时就是通过改变这个计数器的值来选取下一个需要执行的字节码指令。
5. 能不能解释一下方法区?
5.1 概述
-
方法区(
Method Area
)是各个线程共享的内存区域 -
主要存储类的信息、运行时常量池
-
虚拟机启动的时候创建,关闭虚拟机时释放
-
如果方法区域中的内存无法满足分配请求,则会抛出
OutOfMemoryError: Metaspace
5.2 常量池
可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息
查看字节码结构(类的基本信息、常量池、方法定义)javap -v xx.class
比如下面是一个Application
类的main
方法执行,源码如下:
public class Application {
public static void main(String[] args) {
System.out.println("hello world");
}
}
找到类对应的class
文件存放目录,执行命令:javap -v Application.class
查看字节码结构
D:\code\jvm-demo\target\classes\com\dcxuexi\jvm>javap -v Application.class
Classfile /D:/code/jvm-demo/target/classes/com/dcxuexi/jvm/Application.class
Last modified 2023-07-06; size 564 bytes //最后修改的时间
MD5 checksum c1b64ed6491b9a16c2baab5061c64f88 //签名
Compiled from "Application.java" //从哪个源码编译
public class com.heima.jvm.Application //包名,类名
minor version: 0
major version: 52 //jdk版本
flags: ACC_PUBLIC, ACC_SUPER //修饰符
Constant pool: //常量池
#1 = Methodref #6.#20 // java/lang/Object."<init>":()V
#2 = Fieldref #21.#22 // java/lang/System.out:Ljava/io/PrintStream;
#3 = String #23 // hello world
#4 = Methodref #24.#25 // java/io/PrintStream.println:(Ljava/lang/String;)V
#5 = Class #26 // com/dcxuexi/jvm/Application
#6 = Class #27 // java/lang/Object
#7 = Utf8 <init>
#8 = Utf8 ()V
#9 = Utf8 Code
#10 = Utf8 LineNumberTable
#11 = Utf8 LocalVariableTable
#12 = Utf8 this
#13 = Utf8 Lcom/dcxuexi/jvm/Application;
#14 = Utf8 main
#15 = Utf8 ([Ljava/lang/String;)V
#16 = Utf8 args
#17 = Utf8 [Ljava/lang/String;
#18 = Utf8 SourceFile
#19 = Utf8 Application.java
#20 = NameAndType #7:#8 // "<init>":()V
#21 = Class #28 // java/lang/System
#22 = NameAndType #29:#30 // out:Ljava/io/PrintStream;
#23 = Utf8 hello world
#24 = Class #31 // java/io/PrintStream
#25 = NameAndType #32:#33 // println:(Ljava/lang/String;)V
#26 = Utf8 com/dcxuexi/jvm/Application
#27 = Utf8 java/lang/Object
#28 = Utf8 java/lang/System
#29 = Utf8 out
#30 = Utf8 Ljava/io/PrintStream;
#31 = Utf8 java/io/PrintStream
#32 = Utf8 println
#33 = Utf8 (Ljava/lang/String;)V
{
public com.heima.jvm.Application(); //构造方法
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 3: 0
LocalVariableTable:
Start Length Slot Name Signature
0 5 0 this Lcom/dcxuexi/jvm/Application;
public static void main(java.lang.String[]); //main方法
descriptor: ([Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=1, args_size=1
0: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3 // String hello world
5: invokevirtual #4 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
LineNumberTable:
line 7: 0
line 8: 8
LocalVariableTable:
Start Length Slot Name Signature
0 9 0 args [Ljava/lang/String;
}
SourceFile: "Application.java"
下图,左侧是main
方法的指令信息,右侧constant pool
是常量池
main
方法按照指令执行的时候,需要到常量池中查表翻译找到具体的类和方法地址去执行
5.3 运行时常量池
常量池是*.class
文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
6. 你听过直接内存吗?
不受JVM
内存回收管理,是虚拟机的系统内存,常见于NIO
操作时,用于数据缓冲区,分配回收成本较高,但读写性能高,不受JVM
内存回收管理
举例:
需求,在本地电脑中的一个较大的文件(超过100m
)从一个磁盘挪到另外一个磁盘
代码如下:
/**
* 演示 ByteBuffer 作用
*/
public class Demo1_9 {
static final String FROM = "E:\\youtube\\Getting Started with Spring Boot-sbPSjI4tt10.mp4";
static final String TO = "E:\\a.mp4";
static final int _1Mb = 1024 * 1024;
public static void main(String[] args) {
io(); // io 用时:1535.586957 1766.963399 1359.240226
directBuffer(); // directBuffer 用时:479.295165 702.291454 562.56592
}
private static void directBuffer() {
long start = System.nanoTime();
try (FileChannel from = new FileInputStream(FROM).getChannel();
FileChannel to = new FileOutputStream(TO).getChannel();
) {
ByteBuffer bb = ByteBuffer.allocateDirect(_1Mb);
while (true) {
int len = from.read(bb);
if (len == -1) {
break;
}
bb.flip();
to.write(bb);
bb.clear();
}
} catch (IOException e) {
e.printStackTrace();
}
long end = System.nanoTime();
System.out.println("directBuffer 用时:" + (end - start) / 1000_000.0);
}
private static void io() {
long start = System.nanoTime();
try (FileInputStream from = new FileInputStream(FROM);
FileOutputStream to = new FileOutputStream(TO);
) {
byte[] buf = new byte[_1Mb];
while (true) {
int len = from.read(buf);
if (len == -1) {
break;
}
to.write(buf, 0, len);
}
} catch (IOException e) {
e.printStackTrace();
}
long end = System.nanoTime();
System.out.println("io 用时:" + (end - start) / 1000_000.0);
}
}
可以发现,使用传统的IO
的时间要比NIO
操作的时间长了很多了,也就说NIO
的读性能更好。
这个是跟我们的JVM
的直接内存是有一定关系,如下图,是传统阻塞IO
的数据传输流程
下图是NIO
传输数据的流程,在这个里面主要使用到了一个直接内存,不需要在堆中开辟空间进行数据的拷贝,jvm
可以直接操作直接内存,从而使数据读写传输更快。
7. 堆栈的区别是什么?
1、栈内存一般会用来存储局部变量和方法调用,但堆内存是用来存储Java
对象和数组的的。堆会GC
垃圾回收,而栈不会。
2、栈内存是线程私有的,而堆内存是线程共有的。
3、两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常。
栈空间不足:java.lang.StackOverFlowError
。
堆空间不足:java.lang.OutOfMemoryError
。
8. 面试现场
8.1 JVM
由那些部分组成,运行流程是什么?
在JVM
中共有四大部分,分别是ClassLoader
(类加载器)、Runtime Data Area
(运行时数据区,内存分区)、Execution Engine
(执行引擎)、Native Method Library
(本地库接口)
它们的运行流程是:
第一,类加载器(ClassLoader
)把Java
代码转换为字节码
第二,运行时数据区(Runtime Data Area
)把字节码加载到内存中,而字节码文件只是JVM
的一套指令集规范,并不能直接交给底层系统去执行,而是有执行引擎运行
第三,执行引擎(Execution Engine
)将字节码翻译为底层系统指令,再交由CPU
执行去执行,此时需要调用其他语言的本地库接口(Native Method Library
)来实现整个程序的功能。
8.2 你能详细说一下JVM
运行时数据区吗?
运行时数据区包含了堆、方法区、栈、本地方法栈、程序计数器这几部分,每个功能作用不一样。
- 堆解决的是对象实例存储的问题,垃圾回收器管理的主要区域。
- 方法区可以认为是堆的一部分,用于存储已被虚拟机加载的信息,常量、静态变量、即时编译器编译后的代码。
- 栈解决的是程序运行的问题,栈里面存的是栈帧,栈帧里面存的是局部变量表、操作数栈、动态链接、方法出口等信息。
- 本地方法栈与栈功能相同,本地方法栈执行的是本地方法,一个
Java
调用非Java
代码的接口。 - 程序计数器(
PC
寄存器)程序计数器中存放的是当前线程所执行的字节码的行数。JVM
工作时就是通过改变这个计数器的值来选取下一个需要执行的字节码指令。
8.3 你再详细介绍一下程序计数器的作用?
嗯,是这样~~
java
虚拟机对于多线程是通过线程轮流切换并且分配线程执行时间。在任何的一个时间点上,一个处理器只会处理执行一个线程,如果当前被执行的这个线程它所分配的执行时间用完了【挂起】。处理器会切换到另外的一个线程上来进行执行。并且这个线程的执行时间用完了,接着处理器就会又来执行被挂起的这个线程。这时候程序计数器就起到了关键作用,程序计数器在来回切换的线程中记录他上一次执行的行号,然后接着继续向下执行。
8.4 你能给我详细的介绍Java
堆吗?
Java
中的堆术语线程共享的区域。主要用来保存对象实例,数组等,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError
异常。
在JAVA8
中堆内会存在年轻代、老年代
1)Young
区被划分为三部分,Eden
区和两个大小严格相同的Survivor
区,其中,Survivor
区间中,某一时刻只有其中一个是被使用的,另外一个留做垃圾收集时复制对象用。在Eden
区变满的时候, GC
就会将存活的对象移到空闲的Survivor
区间中,根据JVM
的策略,在经过几次垃圾收集后,任然存活于Survivor
的对象将被移动到Tenured
区间。
2)Tenured
区主要保存生命周期长的对象,一般是一些老的对象,当一些对象在Young
复制转移一定的次数以后,对象就会被转移到Tenured
区。
8.5 能不能解释一下方法区?
与虚拟机栈类似。本地方法栈是为虚拟机执行本地方法时提供服务的。不需要进行GC
。本地方法一般是由其他语言编写。
8.6 你听过直接内存吗?
它又叫做堆外内存,线程共享的区域,在Java 8
之前有个永久代的概念,实际上指的是HotSpot
虚拟机上的永久代,它用永久代实现了JVM
规范定义的方法区功能,主要存储类的信息,常量,静态变量,即时编译器编译后代码等,这部分由于是在堆中实现的,受GC
的管理,不过由于永久代有-XX:MaxPermSize
的上限,所以如果大量动态生成类(将类信息放入永久代),很容易造成OOM
,有人说可以把永久代设置得足够大,但很难确定一个合适的大小,受类数量,常量数量的多少影响很大。
所以在Java 8
中就把方法区的实现移到了本地内存中的元空间中,这样方法区就不受JVM
的控制了,也就不会进行GC
,也因此提升了性能。
8.7 什么是虚拟机栈?
虚拟机栈是描述的是方法执行时的内存模型,是线程私有的,生命周期与线程相同,每个方法被执行的同时会创建栈桢。保存执行方法时的局部变量、动态连接信息、方法返回地址信息等等。方法开始执行的时候会进栈,方法执行完会出栈【相当于清空了数据】,所以这块区域不需要进行GC
。
8.8 能说一下堆栈的区别是什么吗?
嗯,好的,有这几个区别
第一,栈内存一般会用来存储局部变量和方法调用,但堆内存是用来存储Java对象和数组的的。堆会GC
垃圾回收,而栈不会。
第二、栈内存是线程私有的,而堆内存是线程共有的。
第三、两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常。
栈空间不足:java.lang.StackOverFlowError
。
堆空间不足:java.lang.OutOfMemoryError
。