线上机器cpu负载200%告警排查

news2026/2/11 6:54:49

CPU告警排查思路，正常情况就是如下两种情况

执行任务的java线程本身存在bug，死循环或者操作本身耗cpu，导致cpu占用过高
jvm发生频繁gc，导致cpu过高

查看耗时较高的进程

top命令，并按大写P以cpu利用率排序，确定cpu占用最高的进程为 java进程

top -H -p [进程id]，注意：此时的PID为线程ID，如下图所示

计算java线程id的16进制值，用jstack看到的线程快照中，线程ID需要转换成小写十六进制值

可以借助在线转换工具：十进制转换 - 在线进制转换器
linux系统也可以使用如下命令转换 printf "%x\n" [线程ID]

printf "%x\n" 22304

使用Jstack查看线程快照

#grep的 -B n 前n行
#grep的 -C n 前后各n行
#grep的 -A n 后n行
jstack [进程ID] |grep [转换后的线程ID] -A 30

分析上图发现，查看完整堆栈定位代码位置，该线程进本都在执行

com.daojia.hub.util.CaseNodeParseUtil.addNodeToChildrenIfParentIdEqual(CaseNodeParseUtil.java:1363)

后续进一步分析，需要结合业务代码查看该部分是否存在耗时

查看GC情况

首先使用top查看当前内存的使用情况

查看gc次数，使用命令 jstat -gc [Java进程ID]：

结合上图可知YGC次数1232，FGC共468次

如果GC次数很多的情况，基本可以说明存在频繁GC导致cpu占用高的问题

GC参数说明

S0C：第一个幸存区的大小
S1C：第二个幸存区的大小
S0U：第一个幸存区的使用大小
S1U：第二个幸存区的使用大小
EC：伊甸园区的大小
EU：伊甸园区的使用大小
OC：老年代大小
OU：老年代使用大小
MC：方法区大小
MU：方法区使用大小
CCSC:压缩类空间大小
CCSU:压缩类空间使用大小
YGC：年轻代垃圾回收次数
YGCT：年轻代垃圾回收消耗时间
FGC：老年代垃圾回收次数
FGCT：老年代垃圾回收消耗时间
GCT：垃圾回收消耗总时间

使用命令dump 内存堆的存储快照，命令如下

jmap -dump:format=b,file=/tmp/mem.hprof [进程ID]

使用内存分析工具，如Eclipse Memory Analyzer等分析mem.hprof文件，分析内存哪部分占用大，存在内存泄露，导致空间无法释放。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1155151.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

线上机器cpu负载200%告警排查

CPU告警排查思路，正常情况就是如下两种情况

查看耗时较高的进程

使用Jstack查看线程快照

查看GC情况

使用命令dump 内存堆的存储快照，命令如下

相关文章

学习笔记3——JVM基础知识

Nginx 部署多个安全域名，多个服务【工作记录】

构建 hive 时间维表

MySQL（5）：排序与分页

设计师看后惊叹：当泥色走进室内空间的时候竟有此番效果

CCF CSP认证历年真题自练Day42

正点原子嵌入式linux驱动开发——Linux CAN驱动

axios中get/post请求方式

WebService接口方式和Restful接口这两者有什么区别和相同点

高防服务器与CDN防御怎么区分？

知识图谱实战应用30-知识图谱在反欺诈情报分析项目中的应用实践

纳米银簇银纳米团簇

idea自动编译以及修改代码后需要执行 mvn clean install 才生效

笔记软件推荐！亲测好用的8款笔记软件！

一篇文章让你弄懂Java中的方法

Web3公链之Cosmos生态的项目Celestia

SpringMVC Day 08 : 文件上传下载

32、github的使用小技巧

Android手机实时投屏利器scrcpy图文详解教程

QCustomPlot图像刷新原理