JVM(Java Virtual Machine)Java程序的运行环境(java二进制字节码的运行环境)
在JVM中共有四大部分,分别是ClassLoader(类加载器)、Runtime DataArea(运行时数据区,内存分区)、Execution Engine(执行引擎)、Native Method Library(本地库接口)
一、JVM基础
(1)程序计数器
程序计数器:线程私有的,内部保存的字节码的行号。用于记录正在执行的字节码指令的地址。程序计数器在来回切换的线程中记录他上一次执行的行号,然后接着继续向下执行。
javap -v xx.class # 打印堆栈大小,局部变量的数量和方法的参数。
(2)堆内存
线程共享的区域:主要用来保存对象实例,数组等,当堆中没有内存空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError异常。
堆内存的组成:
-
年轻代被划分为三部分,Eden区和两个大小严格相同的Survivor区
-
老年代主要保存生命周期长的对象,一般是一些老的对象
1.7中有一个永久代,存储的是类信息、静态变量、常量、编译后的代码。
1.8移除了永久代,把数据存储到了本地内存的元空间中,防止内存溢出。
(3)虚拟机栈
Java Virtual machine Stacks (java 虚拟机栈)
-
每个线程运行时所需要的内存,称为虚拟机栈,先进后出
-
每个栈由多个栈帧(frame)组成,对应着每次方法调用时所占用的内存
-
每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法
垃圾回收是否涉及栈内存?
垃圾回收主要指就是堆内存,当栈帧弹栈以后,内存就会释放。
(4)局部变量是否线程安全
-
如果方法内局部变量没有逃离方法的作用范围,它是线程安全的
-
如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
(5)栈内存溢出
栈帧过多导致栈内存溢出,典型问题:递归调用。
栈帧过大导致栈内存溢出。
(6)堆栈的区别
-
栈内存一般会用来存储局部变量和方法调用,但堆内存是用来存储Java对象和数组的。堆会GC垃圾回收,而栈不会。
-
栈内存是线程私有的,而堆内存是线程共有的。
-
两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常。
-
栈空间不足:java.lang.StackOverFlowError。
-
堆空间不足:java.lang.OutOfMemoryError。
-
(7)方法区
方法区:
-
方法区(Method Area)是各个线程共享的内存区域
-
主要存储类的信息、运行时常量池(可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息) 当类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址.
-
虚拟机启动的时候创建,关闭虚拟机时释放
-
如果方法区域中的内存无法满足分配请求,则会抛出OutOfMemoryError: Metaspace
(8)直接内存
直接内存:并不属于JVM中的内存结构,不由JVM进行管理。是虚拟机的系统内存,常见于 NIO 操作时,用于数据缓冲区,它分配回收成本较高,但读写性能高。
二、类加载器
(1)类加载器的种类
类加载器:JVM只会运行二进制文件,类加载器的作用就是将字节码文件加载到JVM中,从而让Java程序能够启动起来。
启动类加载器(BootStrap ClassLoader):加载JAVA_HOME/jre/lib目录下的库
扩展类加载器(ExtClassLoader):主要加载JAVA_HOME/jre/lib/ext目录中的类
应用类加载器(AppClassLoader):用于加载classPath下的类
自定义类加载器(CustomizeClassLoader):自定义类继承ClassLoader,实现自定义类加载规则。
(2)双亲委派模型
双亲委派模型:加载某一个类,先委托上一级的加载器进行加载,如果上级加载器也有上级,则会继续向上委托,如果该类委托上级没有被加载,子加载器尝试加载该类。
JVM采用双亲委派机制的好处:
-
通过双亲委派机制可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性。
-
为了安全,保证类库API不会被修改
(3)类装载
类装载的执行过程:类从加载到虚拟机中开始,直到卸载为止,它的整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中,验证、准备和解析这三个部分统称为连接(linking)
-
加载: 查找和导入class文件
-
验证: 保证加载类的准确性
-
准备: 为类变量分配内存并设置类变量初始值
-
解析: 把类中的符号引用转换为直接引用
-
初始化: 对类的静态变量,静态代码块执行初始化操作
-
使用: JVM 开始从入口方法开始执行用户的程序代码
-
卸载: 当用户程序代码执行完毕后,JVM便开始销毁创建的Class对象。
三、垃圾回收
(1)强引用、软引用、弱引用、虚对象
强引用:这是最常见的引用类型。即使在内存空间不足,JVM宁愿抛出OutOfMemory错误,也不会去回收这种对象。只有所有 GC Roots 对象都不通过【强引用】引用该对象,该对象才能被垃圾回收。
软引用::软引用是为了增强内存的灵活性。软引用是用来描述一些可能还有用但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次出发垃圾回收。
弱引用:弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些。无论当前系统内存空间足够与否,只要垃圾回收机制运行,那些被弱引用关联的对象必定会被回收。仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
虚引用:虚引用是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。唯一的用处就是能在这个对象被收集器回收时收到一个系统通知。必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放直接内存
(2)垃圾回收时机
简单一句就是:如果一个或多个对象没有任何的引用指向它了,那么这个对象现在就是垃圾,如果定位了垃圾,则有可能会被垃圾回收器回收。如果要定位什么是垃圾,有两种方式来确定,第一个是引用计数法,第二个是可达性分析算法
(3)JVM垃圾定位算法
引用计数法: 一个对象被引用了一次,在当前的对象头上递增一次引用次数,如果这个对象的引用次数为0,代表这个对象可回收
当对象间出现了循环引用的话,则引用计数法就会失效。
可达性分析算法: 现在的虚拟机采用的都是通过可达性分析算法来确定哪些内容是垃圾。
X,Y这两个节点是可回收的。Java 虚拟机中的垃圾回收器采用可达性分析来探索所有存活的对象扫描堆中的对象,看是否能够沿着 GC Root 对象 为起点的引用链找到该对象,找不到,表示可以回收。
哪些对象可以作为 GC Root ?
-
虚拟机栈(栈帧中的本地变量表)中引用的对象
-
方法区中类静态属性引用的对象
-
方法区中常量引用的对象
-
本地方法栈中 JNI(即一般说的 Native 方法)引用的对象
(4)JVM垃圾回收算法
标记清除算法: 是将垃圾回收分为2个阶段,分别是标记和清除。
-
根据可达性分析算法得出的垃圾进行标记
-
对这些标记为可回收的内容进行垃圾回收
优点:标记和清除速度较快
缺点:碎片化较为严重,内存不连贯的
复制算法: 将原有的内存空间一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾的回收; 无碎片,内存使用率低
标记整理算法: 标记清除算法一样,将存活对象都向内存另一端移动,然后清理边界以外的垃圾,无碎片,对象需要移动,效率低
(5)JVM分代回收
1、堆的区域划分
-
堆被分为了两份:新生代和老年代【1:2】
-
对于新生代,内部又被分为了三个区域。Eden区,幸存者区survivor(分成from和to)【8:1:1】
2、对象回收分代回收策略
-
新创建的对象,都会先分配到eden区
-
当eden内存不足,标记eden与 from(现阶段没有)的存活对象
-
将存活对象采用复制算法复制到to中,复制完毕后,eden和 from 内存都得到释放
-
经过一段时间后eden的内存又出现不足,标记eden区域to区存活的对象,将其复制到from区
-
当幸存区对象熬过几次回收(最多15次),晋升到老年代(幸存区内存不足或大对象会提前晋升)
MinorGC、 Mixed GC 、 FullGC的区别是什么?
-
MinorGC【young GC】发生在新生代的垃圾回收,暂停时间短(STW)
-
Mixed GC 新生代 + 老年代部分区域的垃圾回收,G1 收集器特有
-
FullGC: 新生代 + 老年代完整垃圾回收,暂停时间长(STW),应尽力避免
(6)垃圾回收器种类
在jvm中,实现了多种垃圾收集器,包括:
-
串行垃圾收集器
Serial和Serial Old串行垃圾收集器,是指使用单线程进行垃圾回收,堆内存较小,适合个人电脑。Serial 作用于新生代,采用复制算法
Serial Old 作用于老年代,采用标记-整理算法垃圾回收时,只有一个线程在工作,并且java应用中的所有线程都要暂停(STW),等待垃圾回收的完成。
-
并行垃圾收集器
Parallel New和Parallel Old是一个并行垃圾回收器,JDK8默认使用此垃圾回收器
Parallel New作用于新生代,采用复制算法。Parallel Old作用于老年代,采用标记整理算法
垃圾回收时,多个线程在工作,并且java应用中的所有线程都要暂停(STW),等待垃圾回收的完成。
-
CMS(并发)垃圾收集器
CMS全称 Concurrent Mark Sweep,是一款并发的、使用标记清除算法的垃圾回收器,该回收器是针对老年代垃圾回收的,是一款以获取最短回收停顿时间为目标的收集器,停顿时间短,用户体验就好。其最大特点是在进行垃圾回收时,应用仍然能正常运行。
-
G1垃圾收集器
G1垃圾收集器,作用在新生代和老年代,应用于新生代和老年代,在JDK9之后默认使用G1
(7)G1垃圾回收器
-
应用于新生代和老年代,在JDK9之后默认使用G1
-
划分成多个区域,每个区域都可以充当 eden,survivor,old, humongous,其中 humongous 专为大对象准备
-
采用复制算法
-
响应时间与吞吐量兼顾
-
分成三个阶段:新生代回收、并发标记、混合收集
-
如果并发失败(即回收速度赶不上创建新对象速度),会触发 Full GC
四、JVM实践
(1)JVM调优参数
JVM调优参数可以可以在那里设置?
1.war包部署在tomcat中设置
修改TOMCAT_HOME/bin/catalina.sh文件
2.jar包部署在启动参数设置
通常在linux系统下直接加参数启动springboot项目
nohup java -Xms512m -Xmx1024m -jar xxxx.jar --spring.profiles.active=prod &
nohup : 用于在系统后台不挂断地运行命令,退出终端不会影响程序的运行参数
& :让命令在后台执行,终端退出后命令仍旧执行。
对于JVM调优,主要就是调整年轻代、老年代、元空间的内存空间大小及使用的垃圾回收器类型。
-
设置堆空间大小
-
虚拟机栈的设置
-
年轻代中Eden区和两个Survivor区的大小比例
-
年轻代晋升老年代阈值
-
设置垃圾回收收集器
(2)调优工具
命令工具
-
jps 进程状态信息
-
jstack 查看java进程内线程的堆栈信息
-
jmap 查看堆转信息
-
jhat 堆转储快照分析工具
-
jstat JVM统计监测工具
可视化工具
-
jconsole 用于对jvm的内存,线程,类 的监控
-
VisualVM 能够监控线程,内存情况
(3)内存泄漏
内存泄漏通常是指堆内存,通常是指一些大对象不被回收的情况。
java内存泄露的排查思路:
-
获取堆内存快照dump
-
VisualVM去分析dump文件
-
通过查看堆信息的情况,定位内存溢出问题
排查思路:
-
通过jmap或设置jvm参数获取堆内存快照dump
-
通过工具, VisualVM去分析dump文件,VisualVM可以加载离线的dump文件
-
通过查看堆信息的情况,可以大概定位内存溢出是哪行代码出了问题
-
找到对应的代码,通过阅读上下文的情况,进行修复即可
(4)CPU飙高排查方案与思路
1.使用top命令查看占用cpu的情况
输入命令: top
2.通过top命令查看后,可以查看是哪一个进程占用cpu较高(上图是2671)
3.使用ps命令查看进程中的线程信息
ps H -eo pid,tid,%cpu | grep 2671
4.使用jstack命令查看进程中哪些线程出现了问题,最终定位问题