一.问题现象
Linux服务器(操作系统版本是centos7.9)上面部署了若干Java站点服务,突然收到运维的CPU异常g告警,到了影响业务的情况发生,经初步排查,未出现异常进程,排除挖矿病毒的原因。
二.排查思路
(1)找到最耗CPU的进程;
(2)找到最耗CPU的线程;
(3)查看堆栈,定位线程在干嘛,定位对应代码;
三.排查步骤
1.找到最耗CPU的进程
方法:使用top命令
-
执行top -c ,显示进程运行信息列表
-
键入P (大写p),进程按照CPU使用率排序
2.找到最耗CPU的线程
方法:使用top工具
-
top -Hp ,显示一个进程的线程运行信息列表
-
键入P (大写p),线程按照CPU使用率排序
-
top -Hp 30365
3.查看堆栈,定位线程在干嘛,定位对应代码
首先,将线程PID转化为16进制。
工具:printf
方法:printf "%x\n" 6080
如上图,6080对应的16进制是0x17c0
之所以要转化为16进制,是因为堆栈里,线程id是用16进制表示的
4.查看堆栈,找到线程在干嘛
工具:jstack
方法:jstack 30365 | grep '0x17c0' -C5 --color
最后,根据堆栈里的信息,找到对应的代码.