在实际的生产环境中,常常会遇到服务器CPU爆满的问题,这时候,正确的排查方法,有助于快速的定位问题。
1、找到最耗CPU的进程
使用top命令查看系统总体的CPU和内存使用情况,以及各个进程的资源使用情况。
2、找到最耗CPU的线程
执行top -Hp 63424,显示一个进程的线程运行信息列表,键入P (大写p),线程按照CPU使用率排序。
3、将线程PID转化为16进制
执行printf %x 63611,将线程PID转成16进制,即0xf87b。因为堆栈里,线程id是用16进制表示的,这一步也可以使用其方式转换。
4、查看线程的堆栈
这一步可以执行的命令有:pstack/jstack/grep,这里演示其中一种即可。执行
jstack 63424 | grep ‘f87b’ -C9 --color
打印进程堆栈,通过线程id,过滤得到线程堆栈。有时候系统并没有记录下日志,那这时候执行 jstack 63424
,直接观察线程的运行情况。
5、找到代码,分析原因
原因找到这里有一个死循环用于监听,导致该线程的一直占用一个CPU。