Tomcat进程占用CPU过高怎么办?

news2025/1/17 3:55:22

在性能优化这个主题里,前面我们聊过了Tomcat的内存问题和网络相关的问题,接下来我们看一下CPU的问题,CPU资源经常会成为系统性能的一个瓶颈,这其中的原因是多方面的,可能是内存泄漏导致频繁GC,进而引起CPU使用率过高;又可能是代码中的bug创建了大量的线程,导致CPU上下文切换开销。

今天我们就来聊聊Tomcat进程的CPU使用率过高怎么办,以及怎样一步一步找到问题的根因。

“Java进程CPU使用率高”的解决思路是什么?

通常我们所说的CPU使用率过高,这里面其实隐含着一个用来比较高与低的基准值,比如JVM在峰值负载下的平均CPU利用率为40%,如果CPU使用率飙到80%就可以被认为是不正常的。

典型的JVM进程包含多个Java线程,其中一些在等待工作,另一些则正在执行任务。在单个Java程序的情况下,线程数可以非常低,而对于处理大量并发事务的互联网后台来说,线程数可能会比较高。

对于CPU的问题,最重要的是找到是哪些线程在消耗CPU,通过线程栈定位到问题代码;如果没有找到个别线程的CPU使用率特别高,,我们要怀疑是不是线程上下文切换导致了CPU使用率过高。下面我们通过一个实例来学习CPU问题定位的过程。

定位高CPU使用率的线程和代码

1.写一个模拟程序来模拟CPU使用率过高的问题,这个程序会在线程池中创建4096个线程,代码如下:

@SpringBootApplication
@EnableScheduling
public class DemoApplication {

   //创建线程池,其中有4096个线程。
   private ExecutorService executor = Executors.newFixedThreadPool(4096);
   //全局变量,访问它需要加锁。
   private int count;
   
   //以固定的速率向线程池中加入任务
   @Scheduled(fixedRate = 10)
   public void lockContention() {
      IntStream.range(0, 1000000)
            .forEach(i -> executor.submit(this::incrementSync));
   }
   
   //具体任务,就是将count数加一
   private synchronized void incrementSync() {
      count = (count + 1) % 10000000;
   }
   
   public static void main(String[] args) {
      SpringApplication.run(DemoApplication.class, args);
   }

}

2.在Linux环境下启动程序:

java -Xss256k -jar demo-0.0.1-SNAPSHOT.jar

3.使用top命令,我们看到Java进程的CPU使用率达到了262.3%,注意进程ID是4361.

image

4.接着我们用更精细化的top命令查看这个Java进程中各线程使用CPU的情况:

#top -H -p 4361

image

从图上我们可以看到,有个叫“scheduling-1”的线程占用了较多的 CPU,达到了 42.5%。因此下一步我们要找出这个线程在做什么事情。

5.为了找到线程在做什么事情,我们需要用jstack命令生成线程快照,具体方法是:

jstack 4361

jstack 的输出比较大,你可以将输出写入文件:

jstack 4361 > 4361.log

然后我们打开 4361.log,定位到第 4 步中找到的名为“scheduling-1”的线程,发现它的线程栈如下:

image

从线程栈中我们看到了AbstractExecutorService.submit这个函数调用,说明它是 Spring Boot 启动的周期性任务线程,向线程池中提交任务,这个线程消耗了大量 CPU。

进一步分析上下文切换开销

一般来说,通过上面的过程,我们就能定位到大量消耗 CPU 的线程以及有问题的代码,比如死循环。但是对于这个实例的问题,你是否发现这样一个情况:Java 进程占用的 CPU 是 262.3%, 而“scheduling-1”线程只占用了 42.5% 的 CPU,那还有将近 220% 的 CPU 被谁占用了呢?

不知道你注意到没有,我们在第 4 步用top -H -p 4361命令看到的线程列表中还有许多名为“pool-1-thread-x”的线程,它们单个的 CPU 使用率不高,但是似乎数量比较多。你可能已经猜到,这些就是线程池中干活的线程。那剩下的 220% 的 CPU 是不是被这些线程消耗了呢?

要弄清楚这个问题,我们还需要看 jstack 的输出结果,主要是看这些线程池中的线程是不是真的在干活,还是在“休息”呢?
image

通过上面的图我们发现这些“pool-1-thread-x”线程基本都处于 WAITING 的状态,那什么是 WAITING 状态呢?或者说 Java 线程都有哪些状态呢?你可以通过下面的图来理解一下:
image

从图上我们看到“Blocking”和“Waiting”是两个不同的状态,我们要注意它们的区别:

  • Blocking 指的是一个线程因为等待临界区的锁(Lock 或者 synchronized 关键字)而被阻塞的状态,请你注意的是处于这个状态的线程还没有拿到锁。
  • Waiting 指的是一个线程拿到了锁,但是需要等待其他线程执行某些操作。比如调用了 Object.wait、Thread.join 或者 LockSupport.park 方法时,进入 Waiting 状态。前提是这个线程已经拿到锁了,并且在进入 Waiting 状态前,操作系统层面会自动释放锁,当等待条件满足,外部调用了 Object.notify 或者 LockSupport.unpark 方法,线程会重新竞争锁,成功获得锁后才能进入到 Runnable 状态继续执行。

回到我们的“pool-1-thread-x”线程,这些线程都处在“Waiting”状态,从线程栈我们看到,这些线程“等待”在 getTask 方法调用上,线程尝试从线程池的队列中取任务,但是队列为空,所以通过 LockSupport.park 调用进到了“Waiting”状态。那“pool-1-thread-x”线程有多少个呢?通过下面这个命令来统计一下,结果是 4096,正好跟线程池中的线程数相等。

image

你可能好奇了,那剩下的 220% 的 CPU 到底被谁消耗了呢?分析到这里,我们应该怀疑 CPU 的上下文切换开销了,因为我们看到 Java 进程中的线程数比较多。下面我们通过 vmstat 命令来查看一下操作系统层面的线程上下文切换活动:

image

如果你还不太熟悉 vmstat,可以在这里(https://linux.die.net/man/8/vmstat)学习如何使用 vmstat 和查看结果。其中 cs 那一栏表示线程上下文切换次数,in 表示 CPU 中断次数,我们发现这两个数字非常高,基本证实了我们的猜测,线程上下文切切换消耗了大量 CPU。那么问题来了,具体是哪个进程导致的呢?

我们停止 Spring Boot 测试程序,再次运行 vmstat 命令,会看到 in 和 cs 都大幅下降了,这样就证实了引起线程上下文切换开销的 Java 进程正是 4361。

image

学习来源:极客时间 《深入拆解Tomcat&Jetty》 学习笔记 Day09

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/178268.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux命令--查看发行版本/内核版本的方法

原文网址:Linux命令--查看发行版本/内核版本的方法_IT利刃出鞘的博客-CSDN博客 简介 本文介绍Linux查看发行版本和内核版本的方法。 查看发行版本 cat /etc/lsb_release 说明 这个命令适用于大部分linux发行版本(除了redhat和centos等) …

C 语言零基础入门教程(九)

C 函数 函数是一组一起执行一个任务的语句。每个 C 程序都至少有一个函数,即主函数 main() ,所有简单的程序都可以定义其他额外的函数。 您可以把代码划分到不同的函数中。如何划分代码到不同的函数中是由您来决定的,但在逻辑上,…

用Zybo调试CY7C68013A核心板的Slave FIFO模式

用Zybo调试CY7C68013A核心板简介CY7C68013A核心板CY7C68013程序设计硬件连接主要代码Zybo程序设计心得简介 最近在调试CY7C68013A核心板的Slave FIFO模式时,因为电路板的丝印bug,绕了一大圈。最终不但调试成功,也发现了用Zybo调试其它电路板…

C语言对数组元素进行排序

在实际开发中,有很多场景需要我们将数组元素按照从大到小(或者从小到大)的顺序排列,这样在查阅数据时会更加直观,例如:一个保存了班级学号的数组,排序后更容易分区好学生和坏学生;一…

教练,我想学设计之禅

欢迎来到PaQiuQiu的空间 本文为【教练,我想学设计之禅】,方便大家更好的阅读! <—写在前面—> 本专栏分四部分展开,设计模式与设计原则、算法与数据结构、架构设计以及实战为王。 设计模式介绍了经典的23种设计模式,设计原则重点阐述SOLID原则; 算法与数据结构详…

Linux常用命令——slabtop命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) slabtop 实时显示内核slab内存缓存信息 补充说明 slabtop命令以实时的方式显示内核“slab”缓冲区的细节信息。 语法 slabtop(选项)选项 --delayn, -d n&#xff1a;每n秒更新一次显示的信息&#xff0c;默…

使用树莓派3B、RTL-SDR、OpenWebRX搭建无线电监测站

方案介绍&#xff1a; OpenWebRX是一个国外开源项目&#xff0c;基于Python语言编写&#xff0c;配合SDR设备使用&#xff0c;能将SDR接收软件Web化&#xff0c;通过网络实现多用户远程访问&#xff0c;无需安装任何客户端软件&#xff0c;功能非常强大&#xff0c;支持&#x…

Python位置参数

位置参数&#xff0c;有时也称必备参数&#xff0c;指的是必须按照正确的顺序将实际参数传到函数中&#xff0c;换句话说&#xff0c;调用函数时传入实际参数的数量和位置都必须和定义函数时保持一致。实参和形参数量必须一致在调用函数&#xff0c;指定的实际参数的数量&#…

DaVinci:Camera Raw(CinemaDNG)

本文主要介绍 CinemaDNG Raw 格式素材相关的 Camera Raw 参数。解码质量Decode Quality解码质量决定了图像解拜耳之后所呈现的素质。默认为“使用项目设置” Use project setting&#xff0c;表示使用项目设置对话框中的“Camera RAW”解码质量设置。还可选择&#xff1a;全分辨…

离散系统的数字PID控制仿真-1

控制对象为&#xff1a;采样时间为1ms&#xff0c;采用z变换进行离散化&#xff0c;经过z变换后的离散化对象为&#xff1a;y(k)-den(2)y(k -1)- den(3)y(k -2)- den(4)y(k-3)num(2)u(k -1) num(3)u(k -2) num(4)u(k-3)设计离散PID控制器。其中&#xff0c;S为信号选择变量&…

【数据库概论】第四章 数据库安全性

第四章 数据库安全性 目录第四章 数据库安全性4.1 概述4.2 数据库安全性控制1.用户身份识别2.存取控制3.自主存取控制方法4.授权&#xff1a;授予与收回GRANT&#xff1a;授权语句REVOKE&#xff1a;收回权限3.创建数据库模式的权限4.数据库角色5.角色权限的回收6.强制存取控制…

贪心算法(greedy algorithm)

贪心算法什么是贪心算法[122. 买卖股票的最佳时机 II](https://leetcode.cn/problems/best-time-to-buy-and-sell-stock-ii/)代码[455. 分发饼干](https://leetcode.cn/problems/assign-cookies/)思路代码[435. 无重叠区间](https://leetcode.cn/problems/non-overlapping-inte…

SaaS是什么,目前主流的国内SAAS平台提供商有哪些?

SaaS是什么&#xff0c;目前主流的国内SAAS平台提供商有哪些&#xff1f;SaaS这个概念近两年可谓说是十分火热&#xff0c;尤其是后疫情时代。 但还是有很多人对SaaS这个名词云里雾里&#xff0c;被碎片化的信息裹挟&#xff0c;并没有真正意义上理解SaaS的概念。 这篇就综合…

87.【SpringBoot-01】

SpringBoot(一)、前面回顾1.什么是Spring2.Spring 是如何简化Java开发的(二)、什么是SpringBoot1.基本含义:2.Spring Boot的主要优点(三)、微服务1.什么是微服务2.单体应用架构3.微服务架构 (活字印刷)4.如何构建微服务(四)、第一个SpringBoot程序1.点击新建文件2.勾选web框架3…

通用的产品功能设计方法

通用的产品功能设计方法1.如何设计注册/登录功能1.1 注册功能设计1.2 登录功能的设计2.如何设计APP启动页功能和引导页功能2.1 启动页功能设计2.2 引导页功能设计3.如何设计非法信息输入校验功能3.1 非法文本信息的输入校验规则3.2 非法图片信息的输入校验规则3.3 非法附件信息…

《C++程序设计原理与实践》笔记 第11章 定制输入/输出

在本章中&#xff0c;我们重点关注如何使第10章中介绍的通用iostream框架适配特定的需求和偏好。 11.1 规则性和不规则性 C标准库的输入/输出部分——iostream库为文本的输入和输出提供了一个统一的、可扩展的框架。 到目前为止&#xff0c;我们将所有输入源视为等价的&…

Python Flask 实现 HTML 文件压缩,9 级压缩

本博客详细为你解释 Python Flask 框架下的 HTML 文件压缩内容&#xff0c;其第三方模块也可用在其他框架中。 本案例是基于 Python Flask 进行搭建&#xff0c;所以需要提前搭建一个 Flask 项目环境&#xff0c;有 app.py 文件和 templates/index.html 文件即可。 实现 HTML 文…

微服务架构编码构建

目录 一、约定 > 配置 > 编码 二、IDEA新建project工作空间 &#xff08;一&#xff09;微服务cloud整体聚合父工程Project &#xff08;二&#xff09;父工程POM &#xff08;三&#xff09;Maven工程落地细节复习 三、Rest微服务工程构建 &#xff08;一&#…

【蓝桥云课】进制

对于任意数制RRR的数nnn&#xff0c;都可以表达为n∑i0kaiRia0R0a1R1a2R2...akRkn\sum_{i0}^{k}a_{i}R^{i} a_{0}R^{0}a_{1}R^{1}a_{2}R^{2}...a_{k}R^{k}ni0∑k​ai​Ria0​R0a1​R1a2​R2...ak​Rk 一、十进制转RRR进制 方法&#xff1a;十进制数除RRR取余&#xff0c;余数…

kaggle竞赛 | 计算机视觉 | 数字图像基础操作

目录cv2基本操作图片哈希图像数据扩展无监督数据扩展方法监督式数据扩展方法cv2基本操作 import numpy as np import matplotlib.pyplot as plt import cv2img cv2.imread(cat.jpeg) plt.imshow(img)img cv2.imread(cat.jpeg) img cv2.cvtColor(img, cv2.COLOR_BGR2RGB) pl…