文章目录
- 简介
- 能做什么?
- 使用
- 下载并启动arthas
- 选择应用 java 进程
- 退出 arthas
- 常用
- 查看命令帮助
- 查看 dashboard
- 通过 thread 命令来获取到线程的栈
- 通过 jad 来反编译 Class
- watch 查看方法出入参、
- sc 搜索类: 查看已加载类所在的包
- monitor 方法执行监控
- trace 方法内调用链路和耗时
- 【stack】输出当前方法被调用的调用路径
- 【tt】记录方法调用入参和返回值
- 【jvm】查看jvm信息
- 【sysprop】查看当前JVM的系统属性
- 【vmoption】 查看,更新VM诊断相关的参数
- sysenv】查看当前JVM的环境属性
简介
官网:https://arthas.aliyun.com
Arthas 是一款线上监控诊断产品
,通过全局视角实时查看应用load、内存、gc、线程的状态信息
,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等
,大大提升线上问题排查效率。
能做什么?
Arthas 是 Alibaba 开源的 Java 诊断工具,深受开发者喜爱。
当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决:
- 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
- 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
- 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
- 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
- 是否有一个全局视角来查看系统的运行状况?
- 有什么办法可以监控到 JVM 的实时运行状态?
- 怎么快速定位应用的热点,生成火焰图?
- 怎样直接从 JVM 内查找某个类的实例?
使用
下载并启动arthas
下载arthas-boot.jar,然后用java-jar的方式启动(使用和目标进程一致的用户启动,否则可能 attach 失败):
curl -O https://arthas.aliyun.com/arthas-boot.jar
java -jar arthas-boot.jar
选择应用 java 进程
执行完java -jar arthas-boot.jar
命令后。会显示运营的java进程,如下:
* [1]: 35542
此时代表只有一个java进程,输入序号1
若有多个,输入自己要attach的目标对应的序号,再输入回车/enter。
Arthas 会 attach 到目标进程上,并输出日志:
[INFO] Try to attach process 35542
[INFO] Attach process 35542 success.
[INFO] arthas-client connect 127.0.0.1 3658
,---. ,------. ,--------.,--. ,--. ,---. ,---.
/ O \ | .--. ''--. .--'| '--' | / O \ ' .-'
| .-. || '--'.' | | | .--. || .-. |`. `-.
| | | || |\ \ | | | | | || | | |.-' |
`--' `--'`--' '--' `--' `--' `--'`--' `--'`-----'
wiki: https://arthas.aliyun.com/doc
version: 3.0.5.20181127201536
pid: 35542
time: 2018-11-28 19:16:24
退出 arthas
如果只是退出当前的连接
,可以用quit
或者exit
命令。Attach 到目标进程上的 arthas 还会继续运行,端口会保持开放,下次连接时可以直接连接上。
如果想完全退出 arthas
,可以执行stop
命令。
常用
查看命令帮助
哪个命令不会就输入 help 命令关键字
如:
help monitor
查看 dashboard
输入dashboard
,按回车/enter,会展示当前进程的信息,按ctrl+c可以中断执行。
$ dashboard
ID NAME GROUP PRIORI STATE %CPU TIME INTERRU DAEMON
17 pool-2-thread-1 system 5 WAITIN 67 0:0 false false
27 Timer-for-arthas-dashb system 10 RUNNAB 32 0:0 false true
11 AsyncAppender-Worker-a system 9 WAITIN 0 0:0 false true
9 Attach Listener system 9 RUNNAB 0 0:0 false true
3 Finalizer system 8 WAITIN 0 0:0 false true
2 Reference Handler system 10 WAITIN 0 0:0 false true
4 Signal Dispatcher system 9 RUNNAB 0 0:0 false true
26 as-command-execute-dae system 10 TIMED_ 0 0:0 false true
13 job-timeout system 9 TIMED_ 0 0:0 false true
1 main main 5 TIMED_ 0 0:0 false false
14 nioEventLoopGroup-2-1 system 10 RUNNAB 0 0:0 false false
18 nioEventLoopGroup-2-2 system 10 RUNNAB 0 0:0 false false
23 nioEventLoopGroup-2-3 system 10 RUNNAB 0 0:0 false false
15 nioEventLoopGroup-3-1 system 10 RUNNAB 0 0:0 false false
Memory used total max usage GC
heap 32M 155M 1820M 1.77% gc.ps_scavenge.count 4
ps_eden_space 14M 65M 672M 2.21% gc.ps_scavenge.time(m 166
ps_survivor_space 4M 5M 5M s)
ps_old_gen 12M 85M 1365M 0.91% gc.ps_marksweep.count 0
nonheap 20M 23M -1 gc.ps_marksweep.time( 0
code_cache 3M 5M 240M 1.32% ms)
Runtime
os.name Mac OS X
os.version 10.13.4
java.version 1.8.0_162
java.home /Library/Java/JavaVir
tualMachines/jdk1.8.0
_162.jdk/Contents/Hom
e/jre
通过 thread 命令来获取到线程的栈
如上一步通过dashboard命令获取到了线程对应的ID
那么 thread 11
会打印线程 ID 11的栈
# 打印当前最忙的3个线程
thread -n 3
# thread -all, 显示所有匹配的线程
thread -all
# thread -b, 找出当前阻塞其他线程的线程
thread -b
# 按状态查看进程
thread --state RUNNABLE
thread --state RUNNABLE -i 5000 -n 5
通过 jad 来反编译 Class
只查看调用栈还不够,发现调用栈有问题,具体代码哪里有问题,来反编译类看一下源码。
如下面反编译StringUtils
# 反编译StringUtils类
jad org.apache.commons.lang3.StringUtils
# 反编译StringUtils中的toString方法
jad org.apache.commons.lang3.StringUtils toString
watch 查看方法出入参、
看完源码发现某个方法可能有问题,看下方法出入参是否符合预期。
watch命令用于监控方法出入参、耗时等信息。
查看watch如何使用: help watch
USAGE: watch [-b] [-e] [–exclude-class-pattern ] [-x ] [-f] [-h] [-n ] [–listenerId ] [-E] [-M ] [-s] [-v] class-pattern method-pattern [express] [
condition-express]
# 查看toString方法入参
watch -x 1 *StringUtils toString params
# 查看toString方法返回结果
watch *StringUtils toString returnObj
# 查看toString方法所在对象的信息
watch -x 2 *StringUtils toString '{target}'
#查看toString方法的参数、返回值、方法
watch -x 2 *StringUtils toString '{params, target, returnObj}'
sc 搜索类: 查看已加载类所在的包
经常会遇到某个类中加载不到某个方法,但看代码明明是有这个方法的,为什么就是加载不到???此时找到类,
查看类在哪个包加载进来的。
sc -d *StringUtils
查看类属性定义
sc -d -f *StringUtils
monitor 方法执行监控
方法执行监控,monitor 命令是一个非实时返回命令。可查看接口调用次数、平均耗时、失败率等信息。
实时返回命令是输入之后立即返回,而非实时返回的命令,则是不断的等待目标 Java 进程返回信息,直到用户输入 Ctrl+C 为止。
服务端是以任务的形式在后台跑任务,植入的代码随着任务的中止而不会被执行,所以任务关闭后,不会对原有性能产生太大影响,而且原则上,任何Arthas命令不会引起原有业务逻辑的改变。
monitor [-b] [-c <value>] [--exclude-class-pattern <value>] [-h] [-n <value>] [--listenerId <value>] [-m <value>] [-E] [-v] class-pattern method-pattern [condition-express]
如:
monitor -c 5 org.apache.commons.lang3.StringUtils toString
trace 方法内调用链路和耗时
方法内部调用路径,并输出方法路径上的每个节点上耗时。trace 命令能主动搜索 class-pattern/method-pattern 对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路。在代码执行过程中,JVM可能出现停顿,比如GC,进入同步块等。
trace *StringUtils toString -n 1 '#cost > 10'
【stack】输出当前方法被调用的调用路径
很多时候我们都知道一个方法被执行,但这个方法被执行的路径非常多,或者你根本就不知道这个方法是从那里被执行了,此时你需要的是 stack 命令。
stack *StringUtils toString -n 1
【tt】记录方法调用入参和返回值
TimeTunnel方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测。
tt -t -n 3 *StringUtils toString
tt -l 检索调用记录
tt -i 查看调用出入参
tt -i 1000 -p 请求回放,按照之前记录的参数重新发起请求
【jvm】查看jvm信息
jvm
可查看jvm启动参数、gc回收器、内存管理器、内存使用启动
【sysprop】查看当前JVM的系统属性
sysprop
【vmoption】 查看,更新VM诊断相关的参数
vmoption
sysenv】查看当前JVM的环境属性
sysenv