系列文章目录
第一章 Java核心篇之JVM探秘:内存模型与管理初探
第二章 Java核心篇之JVM探秘:对象创建与内存分配机制
第三章 Java核心篇之JVM探秘:垃圾回收算法与垃圾收集器
第四章 Java核心篇之JVM调优实战:Arthas工具使用及GC日志分析
目录
前言
一、Arthas工具概述
二、Arthas使用
(1)测试程序
(2)启动Arthas
基础命令
dashboard
thread
jad
ognl
其他常用命令
trace
watch
(3)总结
三、GC日志详解
(1)GC日志收集
CMS收集器的GC日志打印命令
G1收集器的GC日志打印命令
(2)GC日志分析工具
jvm的分配情况以及峰值
调整策略:
关键性能指标
分析:
调整策略:
交互式图表
GC统计信息
对象的一些统计信息 编辑
内存泄漏信息
GC的原因信息
编辑 四、JVM参数汇总查看命令
总结
前言
在Java开发领域,性能调优和故障排查是每一个工程师不可或缺的技能。随着系统复杂度的增加,传统的日志分析和单元测试往往难以满足深入诊断的需求。Arthas,作为阿里巴巴开源的一款强大的Java诊断工具,为开发者提供了在生产环境下的应用诊断能力,成为Java调优和问题排查的利器。本文将深入探讨Arthas的使用技巧,以及如何分析GC日志以优化JVM性能。
虽然之前也有说过JDK自带的调优工具jvisualvm也可以帮助我们去调优,个人原因觉得这个工具没有Arths好用,并且在我安装的JDK17中的bin目录下没有发现这个工具,所以我们拿Arthas来分析调优
一、Arthas工具概述
Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。
官网地址:简介 | arthas (aliyun.com)
这里就不对工具的简介和安装做详细说明了,官网上都有详细步骤,我们直接进入正题
二、Arthas使用
(1)测试程序
为了方便理解,并且方便后续的功能介绍,这里给大家提供一个测试程序
import java.util.ArrayList;
import java.util.List;
public class Main {
private static final List<String> list = new ArrayList<>();
public static void main(String[] args) {
addList();
cpu();
blockEnd();
}
// 模拟无限添加数据
private static void addList(){
new Thread(() -> {
int flag = 0;
while (true) {
list.add(flag++ + "test");
try {
Thread.sleep(100);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
}
}).start();
}
// 模拟cpu占用过高
public static void cpu() {
new Thread(() -> {
while (true) {
}
}).start();
}
// 模拟死锁
private static void blockEnd() {
try {
Thread.sleep(10000);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
Object obj1 = new Object();
Object obj2 = new Object();
Thread thread1 = new Thread(() -> {
synchronized (obj1) {
System.out.println(Thread.currentThread() + "拿到对象1");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
System.out.println(Thread.currentThread() + "等待对象2");
synchronized (obj2) {
System.out.println(Thread.currentThread() + "拿到对象2");
}
}
});
Thread thread2 = new Thread(() -> {
synchronized (obj2) {
System.out.println(Thread.currentThread() + "拿到对象2");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
System.out.println(Thread.currentThread() + "等待对象1");
synchronized (obj1) {
System.out.println(Thread.currentThread() + "拿到对象1");
}
}
});
thread1.start();
thread2.start();
}
}
(2)启动Arthas
- 进入下载的Arthas目录下运行cmd启动jar包
java -Dfile.encoding=utf-8 -jar arthas-boot.jar
- 输入我们启动的程序编号4,进入arthas开始操作
基础命令
dashboard
- 输入dashboard查看整个进程的运行情况:线程、内存、GC、运行环境信息
我这里由于线程区内容较多,一页展示不完整,所以全屏运行了一次,方便大家看到上述程序的效果。
那如果线程太多,全屏也看不到该怎么办呢
thread
- 输入thread可以查看线程的详细情况
- thread -b可以查看死锁
- thread 加线程ID可以查看线程的堆栈信息
jad
- 输入jad可以反编译
如果线上的代码是没有经过加密的文件的话,这样是可以方便我们排查线上代码的问题
ognl
- 使用ognl命令可以查看线上系统变量的值
- 使用ognl命令可以查看修改线上系统变量的值
到这的时候大家是不是觉得比较神奇,这就是我为什么选择arthas的原因之一
其他常用命令
上边给大家介绍的命令是本次测试程序能体现出来的命令,下边再给大家介绍几个其他我觉得不错并且实用的命令
trace
- trace 根据调用耗时过滤
$ trace demo.MathGame run '#cost > 10'
Press Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 41 ms.
`---ts=2018-12-04 01:12:02;thread_name=main;id=1;is_daemon=false;priority=5;TCCL=sun.misc.Launcher$AppClassLoader@3d4eac69
`---[12.033735ms] demo.MathGame:run()
+---[0.006783ms] java.util.Random:nextInt()
+---[11.852594ms] demo.MathGame:primeFactors()
`---[0.05447ms] demo.MathGame:print()
它能方便的帮助你定位和发现因 RT 高而导致的性能问题缺陷,但其每次只能跟踪一级方法的调用链路。
watch
- watch观察函数调用入口的参数和返回值
$ watch demo.MathGame primeFactors "{params,returnObj}" -x 2 -b
Press Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 50 ms.
ts=2018-12-03 19:23:23; [cost=0.0353ms] result=@ArrayList[
@Object[][
@Integer[-1077465243],
],
null,
]
让你能方便的观察到指定函数的调用情况。能观察到的范围为:返回值
、抛出异常
、入参
,通过编写 OGNL 表达式进行对应变量的查看。
(3)总结
上述这些命令是我觉得比较常用的一些,并且做出了示例,但是每个命令还有很多功能本文没有介绍,大家可以通过Arthas的官网进行学习
三、GC日志详解
GC(Garbage Collection)是JVM的重要组成部分,负责自动回收不再使用的对象,释放内存空间。然而,不当的GC策略或配置会导致应用性能下降,甚至出现卡顿现象。深入分析GC日志,可以揭示GC行为,帮助我们优化JVM配置。
(1)GC日志收集
CMS收集器的GC日志打印命令
java -XX:+UseConcMarkSweepGC
-XX:+PrintGCDetails
-XX:+PrintGCDateStamps
-XX:+PrintGCTimeStamps
-XX:+PrintAdaptiveSizePolicy
-XX:+PrintTenuringDistribution
-XX:+PrintGCApplicationStoppedTime
-XX:+PrintGCApplicationConcurrentTime
-Xlog:gc*,gc+age*,gc+region*,gc+cause*,gc+task*,gc+phase*,gc+promotion*,gc+finalizer*,gc+concurrent*,gc+cm*:file=myapp-cms-gc.log:ut:filecount=10:filesize=10M
-jar myapp.jar
在上面的命令中,-XX:+UseConcMarkSweepGC
指定使用CMS收集器。-Xlog
参数是JDK 9引入的,用于替换之前的-XX:+Print...
系列参数,可以更灵活地控制日志输出的格式和内容。
G1收集器的GC日志打印命令
java -XX:+UseG1GC
-XX:+PrintGCDetails
-XX:+PrintGCDateStamps
-XX:+PrintGCTimeStamps
-XX:+PrintAdaptiveSizePolicy
-XX:+PrintTenuringDistribution
-XX:+PrintGCApplicationStoppedTime
-XX:+PrintGCApplicationConcurrentTime
-Xlog:gc*,gc+age*,gc+region*,gc+cause*,gc+task*,gc+phase*,gc+promotion*,gc+finalizer*,gc+concurrent*,gc+cm*:file=myapp-g1-gc.log:ut:filecount=10:filesize=10M
-jar myapp.jar
在上面的命令中,-XX:+UseG1GC
指定使用G1收集器。G1收集器的日志中包含了更多的区域(region)信息,因为G1是基于区域的垃圾收集器,它将堆划分为多个相同大小的区域进行管理。
注意,在JDK 9及以后的版本中,推荐使用-Xlog
参数来控制日志输出,它提供了更高级别的日志管理和灵活性。上面的命令中包含了多个gc*
和其它子参数,这些可以详细记录GC过程中的各种事件,如年龄提升、区域活动、任务执行、阶段划分、晋升统计、终结器队列等。
这将把GC日志输出到指定的文件中,便于后续分析。
这是我截取的部分日志,红框中显示的是项目的参数。这里不仅配置了打印GC日志,还有相关的VM内存参数。
(2)GC日志分析工具
这里给大家推荐gceasy,登录之后上传gc日志即可,耐心等待(等待时间可能会比较长)
为了方便描述,一下的图片是从两个不同的GC日志中截取的,大家不要关注数据的细节
官网地址:Universal JVM GC analyzer - Java Garbage collection log analysis made easy
jvm的分配情况以及峰值
调整策略:
- 是否要修改JVM内存的相关配置
- 是否需要调整各个堆区的占比
- 是否需要修改元空间的配置
关键性能指标
分析:
-
吞吐量: 提高吞吐量通常意味着减少GC的频率和缩短GC的停顿时间。所以越高越好
-
平均耗时:低的GC平均耗时对于交互式应用和有严格响应时间要求的服务至关重要,因为它直接影响用户体验和系统的整体响应能力。所以越小越好
-
最大耗时:GC最大耗时是指在一段时间内,所有GC停顿时间中最长的一次停顿时间。即使平均耗时很低,一次长时间的GC停顿也可能严重影响用户体验。所以也是越小越好
调整策略:
在内存调优的过程中,存在“不可能三角”的现象,即在吞吐量(Throughput)、延迟(Latency)和CPU消耗(CPU Utilization)这三个优化指标之间很难同时达到最优。这种权衡关系可以用另一种方式来表述:
-
追求高吞吐量与低延迟:这意味着系统尽可能多地执行用户代码,同时保持GC停顿时间短暂,但这往往会增加CPU的负担,因为频繁而快速的GC操作需要更多的处理器资源。
-
追求高吞吐量与低CPU消耗:在这种情况下,系统会倾向于减少GC操作的频率和强度,以降低CPU的使用率。然而,这可能会导致GC停顿时间变长,即延迟增加,因为GC操作一旦发生,就可能需要处理更多的垃圾回收工作。
-
追求低延迟与低CPU消耗:如果目标是最小化GC停顿时间和CPU使用,那么可能会牺牲吞吐量,因为为了保持低延迟和低CPU消耗,系统可能需要采用更为保守的GC策略,这可能导致GC操作更加频繁但每次处理的垃圾较少,从而减少了应用程序执行用户代码的时间比例。
简而言之,如果你希望获得较好的吞吐量和较低的延迟,那么CPU消耗可能会上升;如果你想要较高的吞吐量和较低的CPU消耗,那么延迟可能会增加;如果你追求较低的延迟和较低的CPU消耗,那么吞吐量可能会受到影响。因此,在进行内存调优时,理解这些权衡是非常重要的,需要根据具体的业务场景和性能需求来作出最佳决策。
交互式图表
- Heap after GC:GC之后堆的使用信息
- Heap before GC:GC之前堆的使用信息
- GC Duration:GC持续时间
- Pause GC Duration:暂停GC持续时间
- Reclaimed Bytes:GC回收垃圾对象的内存大小
- Young Gen:年轻代堆的使用信息
- Old Gen:老年代堆的使用信息
- Meta Space:元空间的使用信息
- A & P:每次进行GC时堆内存的分配和晋升信息。
GC统计信息
对象的一些统计信息
内存泄漏信息
GC的原因信息
四、JVM参数汇总查看命令
- java -XX:+PrintFlagsInitial 表示打印出所有参数选项的默认值
- java -XX:+PrintFlagsFinal 表示打印出所有参数选项在运行程序时生效的值
总结
本文深入介绍了Arthas工具的使用方法和GC日志分析技巧,旨在为Java开发者提供一套全面的JVM调优实战指南。希望读者能够通过实践,不断提升自己的技能,为构建高性能、高可用的Java应用贡献力shushu