1、问题共同点
死锁问题和cpu使用率过高都是需要我们找出对应的问题线程。
死锁问题需要我们找出哪两个线程出现了死锁情况。
cpu使用率过高需要我们找出哪个或哪些线程占用了大量的cpu。
2、命令排查
2.1、查看机器上的Java进程
jcmd
或
jps
2.2、查看对应Java进程的线程级别的cpu使用情况
top -H -p 520748
如上我们可以看到PID是520762的线程使用cpu最多了,接下来我们来找出这个线程。
这里的线程PID是十进制的,对应的十六进制是0x7f23a。
2.3、查看目标进程的线程栈信息
jstack 520748 >> 202408242125.txt
把520748 这个进程的线程栈信息导出到202408242125.txt这个文件中。
2024-08-24 21:25:03
Full thread dump Java HotSpot(TM) 64-Bit Server VM (25.291-b10 mixed mode):
"Attach Listener" #1946 daemon prio=9 os_prio=0 tid=0x00007f9670011000 nid=0x1f0ca6 waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"nioEventLoopGroup-5-4" #101 prio=10 os_prio=0 tid=0x00007f96683e2000 nid=0xa37d0 runnable [0x00007f964aafa000]
java.lang.Thread.State: RUNNABLE
at sun.nio.ch.EPollArrayWrapper.epollWait(Native Method)
at sun.nio.ch.EPollArrayWrapper.poll(EPollArrayWrapper.java:269)
at sun.nio.ch.EPollSelectorImpl.doSelect(EPollSelectorImpl.java:93)
at sun.nio.ch.SelectorImpl.lockAndDoSelect(SelectorImpl.java:86)
- locked <0x00000000c7c690d0> (a io.netty.channel.nio.SelectedSelectionKeySet)
- locked <0x00000000c7cfff28> (a java.util.Collections$UnmodifiableSet)
- locked <0x00000000c7cffe50> (a sun.nio.ch.EPollSelectorImpl)
at sun.nio.ch.SelectorImpl.select(SelectorImpl.java:97)
at sun.nio.ch.SelectorImpl.select(SelectorImpl.java:101)
at io.netty.channel.nio.SelectedSelectionKeySetSelector.select(SelectedSelectionKeySetSelector.java:68)
at io.netty.channel.nio.NioEventLoop.select(NioEventLoop.java:810)
at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:457)
at io.netty.util.concurrent.SingleThreadEventExecutor$4.run(SingleThreadEventExecutor.java:989)
at io.netty.util.internal.ThreadExecutorMap$2.run(ThreadExecutorMap.java:74)
at io.netty.util.concurrent.FastThreadLocalRunnable.run(FastThreadLocalRunnable.java:30)
at java.lang.Thread.run(Thread.java:748)
文件里的nid就是线程id(16进制)。
在文件里搜索0x7f23a即可找到对应的线程信息
"C2 CompilerThread0" #5 daemon prio=9 os_prio=0 tid=0x00007f96a0142000 nid=0x7f23a waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
当然我们找到的这个线程使用cpu率并不高,只有2.3%。但是这种找到对应线程的模式是正确的。
2.4、死锁问题
死锁问题也需要我们导出对应进程的线程信息栈。去查找处于阻塞(BLOCKED)状态的线程
这个是线程的状态枚举:java.lang.Thread.State。