1.Arthas作用
Arthas是Alibaba开源的Java诊断工具。
作用:当遇到以下类似问题时,可以帮助我们解决:
1.这个类从哪个jar包加载的?为什么会报各种类相关的Exception?
2.我改的代码为什么没有执行到?难道是我没提交?看线上代码是不是我们修改后的?
3.遇到问题无法线上debug,难道只能通过加日志再重新发布吗?
4.线上遇到某个用户的数据处理有问题,但线上同样无法debug,线下无法重现。
5.是否有一个全局视角来查看系统的运行状况?
6.有什么办法可以监控到JVM的实时运行状态?
7.怎么快速定位应用的热点,生成火焰图?
2.运行环境要求
支持JDK6+,支持Linux、Windows、mac,采用命令行交互模式,同时提供丰富的Tab自动补全功能,进一步方便进行问题的定位和诊断。
3.快速安装和启动
下载arthas-boot.jar ,然后java -jar的方式启动
curl -O https://arthas.aliyun.com/arthas-boot.jar
java -jar arthas-boot.jar
启动后显示在运行的java进程 输入编号 回车
快速退出某个命令:Q或者Ctrl+C
退出Arthas: exit或者quit, 退出当前session,Arthas server还在目标进程中运行。
彻底退出: stop. 用完一定要stop哦,避免Arthas server依然运行占用系统资源。
4. trace命令定位代码耗时
性能测试过程中,经常会碰到接口请求耗时长,但是又不知道具体是哪个环节哪段代码耗时长。这个时候Arthas的trace命令的作用就体现出来了,可以方便快捷从方法表层顺着调用链路一步步往下追踪,最终找出具体耗时长的代码块,是性能测试优化的神器。
举例:假设某个接口耗时长,下面介绍如何使用Arthas一步一步定位到具体是哪段代码耗时长:
通过浏览器F12查看network,找到请求URL,然后查到后端代码中的Controller
右键点击save方法复制引用 , 得到完全的方法路径com.webber.cm.pms.controller.StoryNewController save
trace 包名类名 方法名
比如发现上图中的68.7% 耗时较长 可以继续追踪这个方法
trace com.webber.cm.service.StoryService save
一直这样进行下去,最后可能定位到SQL,也可能是你某一个方法。
定位到是这段SQL耗时比较长,可以针对性的优化SQL。当然上述举例是代码逻辑比较简单,所以最终反映是在SQL上耗时长。如果代码逻辑复杂,那可能定位到的就是前面某个代码方法的逻辑耗时长了,那就可以针对那个代码方法做优化。
trace默认监控次数是100次,超过100就会停止。比如针对某个接口做压测时,肯定不止一百次,需要修改次数。
trace 包名类名 方法名 -n 10000
5.Thread命令:查看线程
thread命令查看所有正在运行的线程
thread
如果发现某个线程CPU使用过高,通过thread加线程id输出该线程的栈信息:
thread id 可以查看该线程的信息
thread -n 3 查看CPU使用率top n线程的栈;
thread -b 找出当前阻塞其他线程的线程。
6.dashboard仪表板:查看当前系统的实时面板
命令:dashboard, 每5秒刷新一次面板
输入dashboard仪表板,按回车enter,会展示当前进程的信息,按ctrl+c 可以中断执行
1.第一部分是显示JVM中运行的所有线程:所在线程组,优先级,线程的状态,CPU占用率,是否是后台进程等;
2.第二部分显示的是JVM内存的使用情况;
3.第三部分是操作系统的一些信息和Java版本号。
7.watch命令
可以通过watch命令来查看方法的入参和返回值
watch com.xxxx.xxxxController 方法名 '{params,returnObj}' -x 2 -b -s,查看xxxxController的update方法的返回值:
-x 2是指定输出结果的属性遍历深度,默认为 1
-b方法调用前观察,用于返回方法入参
-s方法调用后观察,用于返回方法返回值
watch com.webber.cm.pms.controller.StoryNewController save '{params,returnObj}' -x 2
-x 2 可以看出入参对象中的各个属性值
8.jad反编译
jad反编译class文件
可以用来查看线上的java源代码