一、介绍
rthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。
https://arthas.aliyun.com/
二、功能
Arthas(阿尔萨斯)能为你做什么?
1.这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
2.我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
3.遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
4.线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
5.是否有一个全局视角来查看系统的运行状况?
6.有什么办法可以监控到 JVM 的实时运行状态?
7.怎么快速定位应用的热点,生成火焰图?
8怎样直接从 JVM 内查找某个类的实例?
三、快速入门
1.下载Arthas的jar包,https://arthas.aliyun.com/arthas-boot.jar。
2.诊断目标服务所在机器命令行启动Arthas,java -jar arthas-boot.jar。
3.选择java进程,完成启动。
4.命令行输入dashboard,展示当前进程的信息。使用ctrl+c中断执行。
5.如果只是退出当前的连接,可以用quit或者exit命令。Attach 到目标进程上的 arthas 还会继续运行,端口会保持开放,下次连接时可以直接连接上。如果想完全退出 arthas,可以执行stop命令。
6.如果需要诊断docker里的java进程,使用以下命令:
docker exec -it ${containerId} /bin/bash -c “wget https://arthas.aliyun.com/arthas-boot.jar && java -jar arthas-boot.jar”
四、命令列表
1.JVM相关
dashboard - 当前系统的实时数据面板
logger - 查看和修改 logger
ognl - 执行 ognl 表达式ounter 信息
sysprop - 查看和修改 JVM 的系统属性
thread - 查看当前 JVM 的线程堆栈信息
vmoption - 查看和修改 JVM 里诊断相关的 option
vmtool - 从 jvm 里查询对象,执行 forceGc
2.class/classloader相关
jad - 反编译指定已加载类的源码
sc - 查看 JVM 已加载的类信息
sm - 查看已加载类的方法信息
3.monitor/watch/trace相关
monitor - 方法执行监控
trace - 方法内部调用路径,并输出方法路径上的每个节点上耗时
watch - 方法执行数据观测
4.profiler/火焰图
profiler - 使用async-profiler对应用采样,生成火焰图
5.后台异步任务
当线上出现偶发的问题,比如需要 watch 某个条件,而这个条件一天可能才会出现一次时,异步后台任务就派上用场了
①使用 > 将结果重写向到日志文件,使用 & 指定命令是后台运行,session 断开不影响任务执行(生命周期默认为 1 天)
②jobs - 列出所有 job
③kill - 强制终止任务
④fg - 将暂停的任务拉到前台执行
⑤bg - 将暂停的任务放到后台执行
6.基础命令
①base64、cat、echo、grep、history、pwd - 和 linux 里的 命令类似
②cls - 清空当前屏幕区域
③help - 查看命令帮助信息
④quit - 退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
⑤reset - 重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类
⑥stop - 关闭 Arthas 服务端,所有 Arthas 客户端全部退出
7.案例
https://github.com/alibaba/arthas/issues?q=label%3Auser-case