Java核心篇之JVM调优实战:Arthas工具使用及GC日志分析

news2024/11/13 14:26:24

系列文章目录

第一章 Java核心篇之JVM探秘:内存模型与管理初探

第二章 Java核心篇之JVM探秘:对象创建与内存分配机制

第三章 Java核心篇之JVM探秘:垃圾回收算法与垃圾收集器

第四章 Java核心篇之JVM调优实战:Arthas工具使用及GC日志分析


目录

前言

一、Arthas工具概述

二、Arthas使用

(1)测试程序

 (2)启动Arthas

基础命令

dashboard

thread

jad

ognl

其他常用命令

trace

watch

(3)总结

三、GC日志详解

(1)GC日志收集

CMS收集器的GC日志打印命令

G1收集器的GC日志打印命令

(2)GC日志分析工具

jvm的分配情况以及峰值

 调整策略:

关键性能指标

分析:

调整策略:

交互式图表

GC统计信息 

对象的一些统计信息  ​编辑

 内存泄漏信息

GC的原因信息 

​编辑 四、JVM参数汇总查看命令

总结


前言

        在Java开发领域,性能调优和故障排查是每一个工程师不可或缺的技能。随着系统复杂度的增加,传统的日志分析和单元测试往往难以满足深入诊断的需求。Arthas,作为阿里巴巴开源的一款强大的Java诊断工具,为开发者提供了在生产环境下的应用诊断能力,成为Java调优和问题排查的利器。本文将深入探讨Arthas的使用技巧,以及如何分析GC日志以优化JVM性能。

        虽然之前也有说过JDK自带的调优工具jvisualvm也可以帮助我们去调优,个人原因觉得这个工具没有Arths好用,并且在我安装的JDK17中的bin目录下没有发现这个工具,所以我们拿Arthas来分析调优


一、Arthas工具概述

        Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。

官网地址:简介 | arthas (aliyun.com)

这里就不对工具的简介和安装做详细说明了,官网上都有详细步骤,我们直接进入正题

二、Arthas使用

(1)测试程序

为了方便理解,并且方便后续的功能介绍,这里给大家提供一个测试程序

import java.util.ArrayList;
import java.util.List;

public class Main {

    private static final List<String> list = new ArrayList<>();
    public static void main(String[] args) {
        addList();
        cpu();
        blockEnd();
    }

    //  模拟无限添加数据
    private static void addList(){
        new Thread(() -> {
            int flag = 0;
            while (true) {
                list.add(flag++ + "test");
                try {
                    Thread.sleep(100);
                } catch (InterruptedException e) {
                    throw new RuntimeException(e);
                }
            }
        }).start();
    }

    //  模拟cpu占用过高
    public static void cpu() {
        new Thread(() -> {
            while (true) {

            }
        }).start();
    }

    //  模拟死锁
    private static void blockEnd() {
        try {
            Thread.sleep(10000);
        } catch (InterruptedException e) {
            throw new RuntimeException(e);
        }
        Object obj1 = new Object();
        Object obj2 = new Object();
        Thread thread1 = new Thread(() -> {
            synchronized (obj1) {
                System.out.println(Thread.currentThread() + "拿到对象1");
                try {
                    Thread.sleep(1000);
                } catch (InterruptedException e) {
                    throw new RuntimeException(e);
                }
                System.out.println(Thread.currentThread() + "等待对象2");
                synchronized (obj2) {
                    System.out.println(Thread.currentThread() + "拿到对象2");
                }
            }
        });
        Thread thread2 = new Thread(() -> {
            synchronized (obj2) {
                System.out.println(Thread.currentThread() + "拿到对象2");
                try {
                    Thread.sleep(1000);
                } catch (InterruptedException e) {
                    throw new RuntimeException(e);
                }
                System.out.println(Thread.currentThread() + "等待对象1");
                synchronized (obj1) {
                    System.out.println(Thread.currentThread() + "拿到对象1");
                }
            }
        });
        thread1.start();
        thread2.start();
    }
}

 (2)启动Arthas

  • 进入下载的Arthas目录下运行cmd启动jar包
java -Dfile.encoding=utf-8 -jar arthas-boot.jar

  •  输入我们启动的程序编号4,进入arthas开始操作

基础命令

dashboard
  • 输入dashboard查看整个进程的运行情况:线程、内存、GC、运行环境信息

我这里由于线程区内容较多,一页展示不完整,所以全屏运行了一次,方便大家看到上述程序的效果。

那如果线程太多,全屏也看不到该怎么办呢

thread
  • 输入thread可以查看线程的详细情况

  • thread -b可以查看死锁

  • thread 加线程ID可以查看线程的堆栈信息

 

jad
  • 输入jad可以反编译

如果线上的代码是没有经过加密的文件的话,这样是可以方便我们排查线上代码的问题

ognl
  • 使用ognl命令可以查看线上系统变量的值

  •  使用ognl命令可以查看修改线上系统变量的值

到这的时候大家是不是觉得比较神奇,这就是我为什么选择arthas的原因之一

其他常用命令

上边给大家介绍的命令是本次测试程序能体现出来的命令,下边再给大家介绍几个其他我觉得不错并且实用的命令

trace
  • trace 根据调用耗时过滤
$ trace demo.MathGame run '#cost > 10'
Press Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 41 ms.
`---ts=2018-12-04 01:12:02;thread_name=main;id=1;is_daemon=false;priority=5;TCCL=sun.misc.Launcher$AppClassLoader@3d4eac69
    `---[12.033735ms] demo.MathGame:run()
        +---[0.006783ms] java.util.Random:nextInt()
        +---[11.852594ms] demo.MathGame:primeFactors()
        `---[0.05447ms] demo.MathGame:print()

它能方便的帮助你定位和发现因 RT 高而导致的性能问题缺陷,但其每次只能跟踪一级方法的调用链路。

watch
  • watch观察函数调用入口的参数和返回值
$ watch demo.MathGame primeFactors "{params,returnObj}" -x 2 -b
Press Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 50 ms.
ts=2018-12-03 19:23:23; [cost=0.0353ms] result=@ArrayList[
    @Object[][
        @Integer[-1077465243],
    ],
    null,
]

让你能方便的观察到指定函数的调用情况。能观察到的范围为:返回值抛出异常入参,通过编写 OGNL 表达式进行对应变量的查看。

(3)总结

         上述这些命令是我觉得比较常用的一些,并且做出了示例,但是每个命令还有很多功能本文没有介绍,大家可以通过Arthas的官网进行学习

三、GC日志详解

        GC(Garbage Collection)是JVM的重要组成部分,负责自动回收不再使用的对象,释放内存空间。然而,不当的GC策略或配置会导致应用性能下降,甚至出现卡顿现象。深入分析GC日志,可以揭示GC行为,帮助我们优化JVM配置。

(1)GC日志收集

对于CMS和G1收集器的日志会有一点不一样
CMS收集器的GC日志打印命令
java -XX:+UseConcMarkSweepGC 
     -XX:+PrintGCDetails 
     -XX:+PrintGCDateStamps 
     -XX:+PrintGCTimeStamps 
     -XX:+PrintAdaptiveSizePolicy 
     -XX:+PrintTenuringDistribution 
     -XX:+PrintGCApplicationStoppedTime 
     -XX:+PrintGCApplicationConcurrentTime 
     -Xlog:gc*,gc+age*,gc+region*,gc+cause*,gc+task*,gc+phase*,gc+promotion*,gc+finalizer*,gc+concurrent*,gc+cm*:file=myapp-cms-gc.log:ut:filecount=10:filesize=10M
     -jar myapp.jar

在上面的命令中,-XX:+UseConcMarkSweepGC 指定使用CMS收集器。-Xlog 参数是JDK 9引入的,用于替换之前的-XX:+Print... 系列参数,可以更灵活地控制日志输出的格式和内容。 

G1收集器的GC日志打印命令
java -XX:+UseG1GC 
     -XX:+PrintGCDetails 
     -XX:+PrintGCDateStamps 
     -XX:+PrintGCTimeStamps 
     -XX:+PrintAdaptiveSizePolicy 
     -XX:+PrintTenuringDistribution 
     -XX:+PrintGCApplicationStoppedTime 
     -XX:+PrintGCApplicationConcurrentTime 
     -Xlog:gc*,gc+age*,gc+region*,gc+cause*,gc+task*,gc+phase*,gc+promotion*,gc+finalizer*,gc+concurrent*,gc+cm*:file=myapp-g1-gc.log:ut:filecount=10:filesize=10M
     -jar myapp.jar

在上面的命令中,-XX:+UseG1GC 指定使用G1收集器。G1收集器的日志中包含了更多的区域(region)信息,因为G1是基于区域的垃圾收集器,它将堆划分为多个相同大小的区域进行管理。

注意,在JDK 9及以后的版本中,推荐使用-Xlog参数来控制日志输出,它提供了更高级别的日志管理和灵活性。上面的命令中包含了多个gc*和其它子参数,这些可以详细记录GC过程中的各种事件,如年龄提升、区域活动、任务执行、阶段划分、晋升统计、终结器队列等。

这将把GC日志输出到指定的文件中,便于后续分析。 

这是我截取的部分日志,红框中显示的是项目的参数。这里不仅配置了打印GC日志,还有相关的VM内存参数。

(2)GC日志分析工具

这里给大家推荐gceasy,登录之后上传gc日志即可,耐心等待(等待时间可能会比较长)

为了方便描述,一下的图片是从两个不同的GC日志中截取的,大家不要关注数据的细节

官网地址:Universal JVM GC analyzer - Java Garbage collection log analysis made easy

jvm的分配情况以及峰值

 调整策略:
  • 是否要修改JVM内存的相关配置
  • 是否需要调整各个堆区的占比
  • 是否需要修改元空间的配置

关键性能指标

分析:
  • 吞吐量: 提高吞吐量通常意味着减少GC的频率和缩短GC的停顿时间。所以越高越好

  • 平均耗时:低的GC平均耗时对于交互式应用和有严格响应时间要求的服务至关重要,因为它直接影响用户体验和系统的整体响应能力。所以越小越好

  • 最大耗时:GC最大耗时是指在一段时间内,所有GC停顿时间中最长的一次停顿时间。即使平均耗时很低,一次长时间的GC停顿也可能严重影响用户体验。所以也是越小越好

调整策略:

在内存调优的过程中,存在“不可能三角”的现象,即在吞吐量(Throughput)、延迟(Latency)和CPU消耗(CPU Utilization)这三个优化指标之间很难同时达到最优。这种权衡关系可以用另一种方式来表述:

  • 追求高吞吐量与低延迟:这意味着系统尽可能多地执行用户代码,同时保持GC停顿时间短暂,但这往往会增加CPU的负担,因为频繁而快速的GC操作需要更多的处理器资源。

  • 追求高吞吐量与低CPU消耗:在这种情况下,系统会倾向于减少GC操作的频率和强度,以降低CPU的使用率。然而,这可能会导致GC停顿时间变长,即延迟增加,因为GC操作一旦发生,就可能需要处理更多的垃圾回收工作。

  • 追求低延迟与低CPU消耗:如果目标是最小化GC停顿时间和CPU使用,那么可能会牺牲吞吐量,因为为了保持低延迟和低CPU消耗,系统可能需要采用更为保守的GC策略,这可能导致GC操作更加频繁但每次处理的垃圾较少,从而减少了应用程序执行用户代码的时间比例。

        简而言之,如果你希望获得较好的吞吐量和较低的延迟,那么CPU消耗可能会上升;如果你想要较高的吞吐量和较低的CPU消耗,那么延迟可能会增加;如果你追求较低的延迟和较低的CPU消耗,那么吞吐量可能会受到影响。因此,在进行内存调优时,理解这些权衡是非常重要的,需要根据具体的业务场景和性能需求来作出最佳决策。

交互式图表

  • Heap after GC:GC之后堆的使用信息
  • Heap before GC:GC之前堆的使用信息
  • GC Duration:GC持续时间
  • Pause GC Duration:暂停GC持续时间
  • Reclaimed Bytes:GC回收垃圾对象的内存大小
  • Young Gen:年轻代堆的使用信息
  • Old Gen:老年代堆的使用信息
  • Meta Space:元空间的使用信息
  • A & P:每次进行GC时堆内存的分配和晋升信息。

GC统计信息 

对象的一些统计信息  

 内存泄漏信息

GC的原因信息 

 四、JVM参数汇总查看命令

  • java -XX:+PrintFlagsInitial 表示打印出所有参数选项的默认值
  • java -XX:+PrintFlagsFinal 表示打印出所有参数选项在运行程序时生效的值

总结

        本文深入介绍了Arthas工具的使用方法和GC日志分析技巧,旨在为Java开发者提供一套全面的JVM调优实战指南。希望读者能够通过实践,不断提升自己的技能,为构建高性能、高可用的Java应用贡献力shushu

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1925680.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

什么? CSS 将支持 if() 函数了?

CSS Working Group 简称 CSSWG, 在近期的会议中决定将 if() 添加到 CSS Values Module Level 5 中。 详情可见&#xff1a;css-meeting-bot 、[css-values] if() function 当我看到这个消息的时候&#xff0c;心中直呼这很逆天了&#xff0c;我们知道像 less 这些 css 这些预…

【深度学习】PyTorch深度学习笔记02-线性模型

1. 监督学习 2. 数据集的划分 3. 平均平方误差MSE 4. 线性模型Linear Model - y x * w 用穷举法确定线性模型的参数 import numpy as np import matplotlib.pyplot as pltx_data [1.0, 2.0, 3.0] y_data [2.0, 4.0, 6.0]def forward(x):return x * wdef loss(x, y):y_pred…

【原创】springboot+mysql图书共享交流平台设计与实现

个人主页&#xff1a;程序猿小小杨 个人简介&#xff1a;从事开发多年&#xff0c;Java、Php、Python、前端开发均有涉猎 博客内容&#xff1a;Java项目实战、项目演示、技术分享 文末有作者名片&#xff0c;希望和大家一起共同进步&#xff0c;你只管努力&#xff0c;剩下的交…

HTTP请求走私漏洞原理与利用手段分析

文章目录 前言Http请求走私1.1 漏洞诞生场景1.2 漏洞基本原理1.3 HTTP1.1与2.0 请求走私分类2.1 CL.TE类型实例2.2 TE.CL类型实例2.3 TE.TE混淆实例2.4 漏洞检测工具&#xff1f; 请求走私利用3.1 绕过前端安全控制3.2 揭示前端请求重写3.3 捕获他人请求内容3.4 走私构造反射XS…

用Java链接MySQL数据库的总结

✨个人主页&#xff1a; 不漫游-CSDN博客 前言 在日常开发中&#xff0c;使用Java连接MySQL数据库是一个常见的任务&#xff0c;涉及多个步骤。接着我就带着大家细细看来~ 一.下载.jar 包文件 1.什么是.jar 文件 通俗点讲就是一个压缩包&#xff0c;不过里面存放的都是由Java代…

实验2——基于NAT技术的实验(基于实验1)

目录 实验拓扑图​ 实验要求&#xff1a; 实验思路 基于NAT的简单知识点&#xff1a; 实验步骤 1. 给路由器R1配置IP 2.创建区域 2.1 电信&#xff1a; 2.2 移动&#xff1a; 3.办公区的NAT策略 3.1 服务器映射&#xff08;移动链路&#xff09;​编辑 3.2 写一条分公…

【算法/数列】等差数列子序列算术序列

概念&#xff1a; 等差数列&#xff1a;任意两项的差总等于同一个常数 子数组 &#xff1a;是数组中的一个连续序列。 子序列&#xff1a;是通过从原序列删除零个或多个元素并在不改变顺序的情况下排列其余元素而获得的序列 算术序列&#xff1a;是一个数字列表&#xff0c;其中…

HyperSD - 会画草图就能玩AI绘画,AI一键手绘,实时同步 本地一键整合包下载

字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD&#xff0c;是一项在图像处理和机器学习领域的重要进展。这项技术通过创新的方法提升了模型在不同推理步骤下的性能&#xff0c;同时保持了模型大小的精简。 基于这个算法模型&#xff0c;一个很实用的功能出现了&am…

Linux RTL8111/RTL8168 不能联网 / 最新版驱动下载安装

注&#xff1a; 机翻&#xff0c;未校对。 如何让 Realtek RTL8111/RTL8168 在 Linux 下工作 这篇文章于 2016 年 8 月在我原来的博客上发布。尽管如今 Linux 下的 RTL8111/RTL8168 网络接口的情况变得越来越稳定&#xff0c;但它们仍然会导致数据包丢失或网络连接不稳定等问题…

【错题集】ruby 和薯条(排序 + 二分 / 双指针)

牛客对应题目链接&#xff1a;ruby和薯条 (nowcoder.com) 一、分析题目 1、解法一&#xff1a;排序 二分。 先排序&#xff0c;然后枚举较⼤值&#xff0c;在 [1, i - 1] 区间找差值的左右端点即可。 2、解法二&#xff1a;排序 前缀和 双指针。 先排序&#xff1b; …

数据结构(Java):力扣Stack集合OJ题

1、括号匹配问题 . - 力扣&#xff08;LeetCode&#xff09; 1.1 思路分析 根据栈的先进后出原则&#xff0c;我们可以这样解决问题&#xff1a; 遍历字符串&#xff0c;遇见左括号就将左括号push入栈&#xff1b;遇见右括号就pop出栈&#xff0c;将出栈的元素和该右括号比较…

JDK14新特征最全详解

JDK 14一共发行了16个JEP(JDK Enhancement Proposals&#xff0c;JDK 增强提案)&#xff0c;筛选出JDK 14新特性。 - 343: 打包工具 (Incubator) - 345: G1的NUMA内存分配优化 - 349: JFR事件流 - 352: 非原子性的字节缓冲区映射 - 358: 友好的空指针异常 - 359: Records…

游戏的无边框模式是什么?有啥用?

现在很多游戏的显示设置中&#xff0c;都有个比较特殊的选项“无边框”。小伙伴们如果尝试过&#xff0c;就会发现这个效果和全屏几乎一毛一样&#xff0c;于是就很欢快地用了起来&#xff0c;不过大家也许会发现&#xff0c;怎么和全屏比起来&#xff0c;似乎有点不够爽快&…

单例模式Singleton

设计模式 23种设计模式 Singleton 所谓类的单例设计模式&#xff0c;就是采取一定的方法保证在整个的软件系统中&#xff0c;对某个类只能存在一个对象实例&#xff0c;并且该类只提供一个取得其对象实例的方法。 饿汉式 public class BankTest {public static void main(…

[图解]SysML和EA建模住宅安全系统-14-黑盒系统规约

1 00:00:02,320 --> 00:00:07,610 接下来&#xff0c;我们看下一步指定黑盒系统需求 2 00:00:08,790 --> 00:00:10,490 就是说&#xff0c;把这个系统 3 00:00:11,880 --> 00:00:15,810 我们的目标系统&#xff0c;ESS&#xff0c;看成黑盒 4 00:00:18,030 --> …

Kafka基础入门篇(深度好文)

Kafka简介 Kafka 是一个高吞吐量的分布式的基于发布/订阅模式的消息队列&#xff08;Message Queue&#xff09;&#xff0c;主要应用与大数据实时处理领域。 1. 以时间复杂度为O(1)的方式提供消息持久化能力。 2. 高吞吐率。&#xff08;Kafka 的吞吐量是MySQL 吞吐量的30…

数据结构初阶(C语言)-复杂度的介绍

在学习顺序表之前&#xff0c;我们需要先了解下什么是复杂度&#xff1a; 一&#xff0c;复杂度的概念 我们在进行代码的写作时&#xff0c;通常需要用到许多算法&#xff0c;而这些算法又有优劣之分&#xff0c;区分算法的优劣则是通过算法的时间复杂度和空间复杂度来决定。 …

【眼疾病识别】图像识别+深度学习技术+人工智能+卷积神经网络算法+计算机课设+Python+TensorFlow

一、项目介绍 眼疾识别系统&#xff0c;使用Python作为主要编程语言进行开发&#xff0c;基于深度学习等技术使用TensorFlow搭建ResNet50卷积神经网络算法&#xff0c;通过对眼疾图片4种数据集进行训练&#xff08;‘白内障’, ‘糖尿病性视网膜病变’, ‘青光眼’, ‘正常’&…

Python+wxauto=微信自动化?

Pythonwxauto微信自动化&#xff1f; 一、wxauto库简介 1.什么是wxauto库 wxauto是一个基于UIAutomation的开源Python微信自动化库。它旨在帮助用户通过编写Python脚本&#xff0c;轻松实现对微信客户端的自动化操作&#xff0c;从而提升效率并满足个性化需求。这一工具的出现&…