windbg常见问题--分析CPU高

news2025/1/24 22:36:50

项目场景:

某天工作时在运维群中收到服务器告警提示cpu基本满负荷了,这个服务已经都运行了快3个月了。

信息收集

对于cpu高问题,先在现场环境观察排除一些外在因素,

  • 程序的内存是否正常,比如有内存泄漏,物理内存不足导致高的换页操作
  • 比如文件IO是否正常,比如有异常的copy操作、硬盘坏道
  • 观察网络流量是否正常
  • 观察下任务管理器,是否有cpu过高的进程,比如后台杀毒
  • 通过processxp查看进行哪些线程cpu占用率高;通过导入pdb文件,也可查看是哪个函数耗时

对于生产环境高cpu的问题,我比较喜欢多采样的方式,通过分析多个时间点的dump找到线程执行的相识处,找到cpu耗时的函数。因此在短时间内我保存了大概10个dump,剩下的就是分析他们的共同点,找到耗cpu的函数。

原因分析:

dump下载,提取码q5kx

切换为x86模式

0:000> .load wow64exts
0:000> !sw
Switched to 32bit mode
0:000:x86> ~*kv

windbg打开dump文件,并设置好pdb文件,查看每个线程的执行时间

> ~*e?@$tid;.ttime
.......
Created: Wed Sep 20 06:03:24.274 2017 (UTC + 8:00)
Kernel:  0 days 0:00:56.187
User:    0 days 0:00:48.468
Evaluate expression: 3756 = 00000eac
Created: Wed Sep 20 06:03:24.274 2017 (UTC + 8:00)
Kernel:  0 days 1:50:47.906
User:    5 days 10:32:08.953
Evaluate expression: 1924 = 00000784
Created: Wed Sep 20 06:03:24.274 2017 (UTC + 8:00)
Kernel:  0 days 2:09:43.734
User:    5 days 18:12:02.671
Evaluate expression: 4964 = 00001364
Created: Wed Sep 20 06:03:24.274 2017 (UTC + 8:00)
Kernel:  0 days 1:50:15.734
User:    5 days 13:41:16.296
Evaluate expression: 2080 = 00000820
Created: Wed Sep 20 06:03:24.274 2017 (UTC + 8:00)
Kernel:  0 days 1:49:48.000
User:    5 days 11:29:27.156
Evaluate expression: 3456 = 00000d80
Created: Wed Sep 20 06:03:24.274 2017 (UTC + 8:00)
Kernel:  0 days 1:50:28.812
User:    5 days 10:26:11.093
Evaluate expression: 3632 = 00000e30
Created: Wed Sep 20 06:03:24.274 2017 (UTC + 8:00)
Kernel:  0 days 2:10:05.953
User:    5 days 18:17:44.187
Evaluate expression: 1216 = 000004c0
Created: Wed Sep 20 06:03:24.290 2017 (UTC + 8:00)
Kernel:  0 days 1:50:44.031
User:    5 days 13:33:37.000
Evaluate expression: 728 = 000002d8
Created: Wed Sep 20 06:03:24.290 2017 (UTC + 8:00)
Kernel:  0 days 1:49:10.500
User:    5 days 11:18:50.250
Evaluate expression: 3424 = 00000d60
Created: Wed Sep 20 06:03:24.290 2017 (UTC + 8:00)
Kernel:  0 days 1:24:44.234
User:    0 days 2:01:17.203
Evaluate expression: 2944 = 00000b80
................

可以找到有8个线程耗时比较多

进程使用的是消费者模型,总共有8个线程用于处理请求消息,因此这8个线程是高耗时的线程

对比多个dump的共同点

这里省略了其他dump,最终比对的结果,就是几乎每个dump都有一个线程在执行“CSockServer::OnPlayerLogon” 函数。
因此我们查看下OnPlayerLogon的详细信息,切换到9号线程,
> ~9s

在这里插入图片描述
通过查看 local 信息查看变量的值:
在这里插入图片描述
可以看到这个CMap的数量是70w左右。使用的是MFC的CMap难道SetAt性能不好? 由于是前人的历史代码,我对CMap基本不熟悉,所以就抱着这个疑问写了个demo进行验证,果然,在CMap达到40w左右时,SetAt性能急剧下降,到70w左右插入可能需要10秒的时间。

解决方案:

将CMap更换了std::map ,性能稳定。

总结

高CPU的问题,我没有特别好的解决方案,特别是在生产环境中长时间运行,一般还是通过观察和多采样进行分析,需要具体情况具体分析,有的问题可能通过查看线程耗时就能找到某个耗时的线程,有的情况就需要进行更加复杂的操作。

last

对于dump分析也可以留言,进行协助分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/894624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【SpringCloud】Gateway使用

文章目录 概述阻塞式处理模型和非阻塞处理模型概念阻塞式处理模型 三大核心概念 工作流程使用POMYML启动类配置路由通过编码进行配置动态路由常用的Route Predicate自定义全局过滤器自定义filter 官网 https://cloud.spring.io/spring-cloud-static/spring-cloud-gateway/2.2.1…

SpringBoot中Controller调用Controller (demo)

1. 使用spring上下文直接调用 import com.ruoyi.common.utils.spring.SpringUtils; import lombok.extern.slf4j.Slf4j; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController;Slf4j RestControlle…

aardio - 制作ico图标

代码如下: import win.ui; /*DSG{{*/ var winform win.form(text"aardio 制作ico图标 by 光庆";right687;bottom503) winform.add( add{cls"button";text"添加";left528;top8;right672;bottom48;z2}; button{cls"button"…

【Rust】Rust学习 第十六章无畏并发

安全且高效的处理并发编程是 Rust 的另一个主要目标。并发编程(Concurrent programming),代表程序的不同部分相互独立的执行,而 并行编程(parallel programming)代表程序不同部分于同时执行,这两…

Java虚拟机(JVM):堆溢出

一、概念 Java堆溢出(Java Heap Overflow)是指在Java程序中,当创建对象时,无法分配足够的内存空间来存储对象,导致堆内存溢出的情况。 Java堆是Java虚拟机中用于存储对象的一块内存区域。当程序创建对象时&#xff0c…

高忆管理:回购潮继续!32家科创板公司齐发公告,市场反弹信号?

科创板回购潮来袭。 8月17日晚间,32家科创板公司齐发回购公告,由实控人、董事长提议回购公司股份方案。金额由500万至4亿元不等。回购目的首要用于职工持股方案或许股权鼓励。 从公司事务来看,本次方案回购的公司有10家从事半导体芯片相关职…

1+X试点Web前端开发考证实训室建设方案

一 、系统概述 1X试点Web前端开发是计算机类专业重要的核心课程,课程所包含的教学内容多,实践性强,并且相关技术更新快。传统的课堂讲授模式以教师为中心,学生被动式接收,难以调动学生学习的积极性和主动性。混合式教学…

SSH命令详解

SSH(远程连接工具)连接原理:ssh服务是一个守护进程,系统后台监听客户端的连接,ssh服务端的进程名为sshd,负责实时监听客户端的请求(IP 22端口),包括公共秘钥等交换信息。…

【宝藏应用】AI绘图网站

序言 这是一个通过AI模型进行绘制图片的网站。 有图有真相 这些是我在上面找的AI生成的图片,感觉怎么样呢?是不是看起来接近真人的精修图片了? 地址 链接: LiblibAI

jenkins配置详解

1. 部署Jenkins 参考文档:Linux 2. Jenkins安装插件 参考文档:https://yuque.antfin-inc.com/antchain/uz9o3b/qgstlw 3. 目录初始化 mkdir -p /var/lib/jenkins/output chown -R jenkins:jenkins /var/lib/jenkinsmkdir -p /tmp/jenkins chown -R …

成瘾机制中微生物群的神秘角色

谷禾健康 成瘾是一种大脑疾病,受害者无法控制地对某种物质或行为产生强烈的依赖和渴求,尽管这种行为会产生有害的后果。成瘾包括一系列物质滥用障碍,例如药物、酒精、香烟,过度饮食。近年来,吸毒成瘾急剧上升&#xff…

前端开发怎么解决性能优化的问题? - 易智编译EaseEditing

前端性能优化是确保网站或应用在加载速度、响应性和用户体验等方面达到最佳状态的关键任务。以下是一些解决前端性能优化问题的方法: 压缩和合并代码: 压缩和合并CSS、JavaScript和HTML文件可以减少文件大小,加快加载速度。使用压缩工具&am…

AI 绘画Stable Diffusion 研究(十一)sd图生图功能详解-美女换装

免责声明: 本案例所用安装包免费提供,无任何盈利目的。 大家好,我是风雨无阻。 为了让大家更直观的了解图生图功能,明白图生图功能到底是干嘛的,能做什么事情?今天我们继续介绍图生图的实用案例-美女换装的制作。 对于…

香港ITA2023高峰论坛,Dtop环球嘉年华亚洲环球节点受邀出席

Web 3.0回归,建构黄金新起点。Web 3.0是数字技术与经济体系融合性的创新框架,是未来网络产业发展的趋势。为加速推进创新科技与文化艺术的融合发展,充分利用香港的国际化优势和开放的政策环境,汇聚全球资源,助力香港国际创新科技中心和中外文化艺术交流中心的进一步建设和发展,…

Mac电脑系统瘦身清理缓存软件CleanMyMac2023

在忙碌的现代生活中,保持身材苗条是许多人的追求。控制饮食和进行适当的运动当然是瘦身的关键,但你知道吗?你的Mac电脑也需要进行清理,以保持其最佳状态。其中一项重要的清理工作就是给Mac清理缓存。本文将向你介绍如何轻松给Mac清…

无涯教程-Perl - waitpid函数

描述 该函数等待ID为PID的子进程终止,返回已故进程的进程ID。如果PID不存在,则返回-1。进程的退出状态包含在$?中。 可以将标志设置为各种值,这些值等于waitpid()UNIX系统调用使用的值。 FLAGS的值为0应该在支持进程的所有操作系统上工作。 语法 以下是此函数的简单语法- …

MySQL 、Sql server 错误处理机制

sql server 错误处理机制 try 。。。catch sql ---Try Catch Syntax BEGIN TRY{<sql statements>} end TRY BEGIN Catch{<sql> statements} end catch [;]#### MySQL 程序错误处理机制 ** 定义条件 定义处理程序** 定义条件&#xff1a; >declare…

成集云 | 乐享问题邀请同步企微提醒 | 解决方案

源系统成集云目标系统 方案介绍 腾讯乐享是腾讯公司开发的一款企业社区化知识管理平台&#xff0c;它提供了包括知识库、问答、课堂、考试、活动、投票和论坛等核心应用。这个平台凝聚了腾讯10年的管理经验&#xff0c;可以满足政府、企业和学校在知识管理、学习培训、文化建…

Jmeter参数化类型

1.参数在多个请求报文中出现&#xff0c;执行一次需要使用同一个参数--随机生成(随机变更) 2.参数在请求报文中出现&#xff0c;执行过程需要使用同一个参数(--固定参数) 3.参数从指定几个固定中随机获取一个 4.参数从本地文件中获取 5.参数在多个请求报文中出现&#xff0c;每…

和鲸 ModelWhale 与中科可控多款服务器完成适配认证,赋能中国云生态

当前世界正处于新一轮技术革命及传统产业数字化转型的关键期&#xff0c;云计算作为重要的技术底座&#xff0c;其产业发展与产业规模对我国数字经济的高质量运行有着不可取代的推动作用。而随着我国数字上云、企业上云加快进入常规化阶段&#xff0c;云计算承载的业务应用越来…