国际阿里云:Windows系统ECS实例中CPU使用率较高问题的排查及解决方案!!

news2024/10/7 10:14:31

问题现象

Windows系统ECS实例中CPU使用率较高,即CPU使用率≥80%。

问题原因

CPU使用率较高可能有以下原因。

  • ECS实例遭到病毒木马入侵。

  • ECS实例中第三方杀毒软件运行。

  • ECS实例中应用程序异常、驱动异常、高I/O使用率或高中断处理的应用程序。

解决方案

步骤一:定位问题

通过微软工具(任务管理器、资源监视器等)抓取系统Full Memory Dump,来定位CPU使用率过高的问题。在流量大的情况下,您还可以使用Wireshark抓取一段时间的网络包,分析流量使用情况。

本文以资源监视器为例,介绍如何定位CPU使用率较高的问题。其他常见工具,请参见常见工具。

说明

Windows Server 2008以上系统,通常使用系统自带的资源监视器监控CPU。

  1. 通过VNC方式连接ECS实例。

    具体信息,请参见ECS实例连接方式概述。

  2. 在桌面底部单击开始菜单,选择运行。

  3. 在运行框中输入perfmon -res,单击确定。

    1

  4. 在资源监视器页面中,查看各进程是否有CPU使用率过高的现象。

    2

  5. 针对占用CPU资源较高的进程,查看对应的进程ID和进程的程序名。

  6. 定位进程ID后,结合任务管理器判断程序是否异常并定位程序的具体位置。

    1. 定位异常进程前,需要在任务管理器中依次单击查看(V) > 选择列(S)...。

      3

    2. 在弹出的框中选择PID(进程标识符),单击确定。

      4

    3. 在任务管理器的进程页面中,单击PID,通过排序,找到之前资源监视器查看到的异常进程。右键单击进程名称,选择打开文件位置,查看进程是否为恶意程序。

步骤二:分析处理

判断影响CPU使用率过高的进程属于正常进程或是异常进程,并按照下述相应步骤处理。

可能原因

具体操作

正常进程

一般情况下,当频繁访问业务,或由于Windows自身服务(更新服务等)都可能会占用较高网络流量和CPU 。

说明

  • Windows Server 2008或Windows Server 2012实例建议内存配置在2 GiB或者2 GiB以上。

  • 在使用Windows Server 2012的1 vCPU 1 GiB规格的实例时,Windows Update服务会自动更新,实例的CPU使用率也会突然升高,这是正常现象。

  • 检查后台是否有执行Windows Update的行为。

  • 建议在服务器上安装杀毒软件进行杀毒。如有安装杀毒软件,请检查CPU使用率较高时,杀毒软件是否在后台执行扫描操作。如果可能,请升级杀毒软件到最新版本,或者删除杀毒软件。

  • 检查该ECS内应用程序是否有大量的磁盘访问、网络访问行为或高计算需求。通过尝试增配实例规格的方式,使用更多核数或内存的规格来解决资源瓶颈问题。更多信息,请参见升降配方式概述。

  • 若自身服务器配置较高,再去升级配置已无太大意义。架构方面也并非是服务器配置越高就越好。此时,您需要尝试进行应用分离,通过不同的服务器去承载不同的应用,同时对相关程序进行优化。

    比如数据库完全通过RDS来承载,减轻服务器本身的资源消耗和服务器内部大量的调用。而程序优化方面,您可以根据自身的配置状况进行调整,具体的操作有调整连接数、缓存配置、Web和数据库调用时的各项参数等。

异常进程

对于CPU异常使用率过高的情况,可能是被恶意病毒、木马入侵导致的。有时三方恶意程序可能会利用操作系统的svchost.exe或者Tcpsvcs.exe来伪装,引起高CPU的占用。您需要手动对异常进程进行查杀。

说明

若您无法判断进程是否为病毒或木马,建议将进程名称在网上进行搜索后确认。另外,建议您进行进程删除操作前,创建快照完成备份。具体操作,请参见创建一个云盘快照。

  • 使用商业版杀毒软件,或使用微软免费安全工具Microsoft Safety Scanner,在安全模式下进行扫描杀毒。

  • 运行Windows Update来安装最新的微软安全补丁。

  • 使用MSconfig禁用所有非微软自带服务驱动,检查问题是否再次发生,具体操作请参考如何在Windows系统中执行干净启动。

  • 若服务器或站点遭受DDoS攻击或CC攻击等,短期内产生大量的访问需求。您可以登录云安全中心,查看云安全中心中的防护DDoS攻击是否调整好阈值,并核实是否开启CC防护。如果攻击没有触发到阈值,云安全中心没有清洗,可以联系售后协助开起清理。

常见工具

以下是关于Windows系统中定位CPU使用率过高问题工具的简要说明。

任务管理器

任务管理器可以直观查看应用程序列表,定位占用CPU较高的应用程序,如下是任务管理器页面。

在性能页面检查CPU使用率时,右键单击CPU使用率图示,单击将图形更改为 > 逻辑处理器。

如下图显示了4个逻辑CPU的使用率。

当单个进程的CPU使用率飙升至接近100%时,而其它进程的CPU使用率变化不大,则可能是网络I/O处理造成的。

资源监视器

资源监视器可以直观查看CPU使用率,还可以通过句柄和模块搜索对应的进程。

Process Explorer

Process Explorer是一款Microsoft Sysinternals工具,通过配置正确的Symbols,检查对应应用程序的线程调用的Call Stack,用以定位可能的问题驱动。下载Process Explorer工具,请参见Process Explorer。

如下图是Process Explorer工具使用页面。

性能监视器

性能监视器(Performance Monitor)是Microsoft专业收集各个组件性能计数器的工具。对于系统CPU资源消耗,有多个Counter来检查。

Performance有如下三个核心参数。

  • \Processor(_Total)\% Processor Time:CPU执行行非空闲线程的时间百分比。\Processor(_Total)\% Processor Time=\Processor(*)\% User Time+\Processor(*)\% Privileged Time

  • \Processor(*)\% User Time:表示处理器用于执行程序代码的时间消耗,可以确定哪个应用程序或函数调用消耗了较多的时间。

    User Time情况如下图所示。

  • \Processor(*)\% Privileged Time:应用程序在内核中执行系统调用(例如驱动、IRP,上下文切换等)操作的时间。如果操作系统花费多余30%的时间在Privileged Time,如下图所示,则说明实例正在进行高I/O吞吐相关的操作。

    % Privileged Time很高时,需要进一步检查% DPC Time% Interrupt Time以及Context Switches/sec的情况。

    • % DPC Time% Interrupt Time表示未知设备出现大量的操作或者很差的性能问题。更多详情,请参见Choose Your Own Adventure: High Deferred Procedure Calls (DPCs) or High Interrupts和Windows IT Pro Magazine: Examining xPerf。

    • Context Switch值很高时,说明内核在CPU上对进程或线程进行切换。更多详情,请参见The Case of the 2 Million Context Switches和Mark Russinovich’s The Case of the System Process CPU Spikes。

      Context Switches/sec值很高表示有大量的线程处于Ready状态,需要减少线程的数量解决问题。


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1193056.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OAuth2.0和1.0的区别

OAuth2.0的最大改变就是不需要临时token了,直接authorize生成授权code,用code就可以换取accesstoken了,同时accesstoken加入过期,刷新机制,为了安全,要求第三方的授权接口必须是https的。OAuth2.0不能向下兼…

基础课27——人工智能训练师人才画像

1.什么是人工智能训练师 根据《人工智能训练师》国家职业技能标准(2021年版),人工智能训练师是指“使用智能训练软件,在人工智能产品使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员”…

社区治理进化史!拓世法宝化身“虚拟社工”,点亮智能社区的每一个角落

时光流转、技术猛进,社区不再只是在制度层面作为城市治理的最小单元,更是在民生层面成为政府联系、服务群众的“神经末梢”。城市的脚步越来越匆忙,人们对于社区的服务期待也愈发高涨。面对日益复杂的社区治理和服务需求,我们迫切…

建设大型综合运维平台,对接集成多厂商网管系统

当前,云计算、大数据、人工智能等IT技术迅猛发展,企业的信息化步入了一个崭新的时代,企业规模不断壮大,业务不断拓展,企业信息化依赖的网络结构和IT技术越来越复杂。因建设时期等原因,企业网络中分布着不同…

Springboot SpringCloudAlibaba Nacos 项目搭建

依赖版本: spring-boot:2.3.12.RELEASE spring-cloud-alibaba:2.2.7.RELEASE spring-cloud:Hoxton.SR12 nacos:2.0.3 1.部署搭建Nacos注册中心 Linux Nacos 快速启动_nacos linux快速启动-CSDN博客 2.构建项目 源码地…

美国突传两件大事!大饼单日涨跌2500美元,以太走出“独立行情”!

​ 受「比特币ETF正式进入批准窗口期」利好消息刺激,比特币持续攀升,并最终于9日晚间23点突破38000美元关口,创下自2022年5月22日以来最高水平。 据了解,彭博ETF分析师James Seyffart发文称,比特币ETF正式进入批准窗…

mysql的sql_mode参数

msql修改了这个参数,首先mysql需要重新才能生效,还有就是java连接的springboot项目也需要重新启动。之前是遇到了下面的这个报错。只需要把sql_mode设置为空,重启mysql和服务就行 报错 In aggregated query without GROUP BY, expression #1…

网络安全(黑客)自学笔记1.0

前言 今天给大家分享一下,很多人上来就说想学习黑客,但是连方向都没搞清楚就开始学习,最终也只是会无疾而终!黑客是一个大的概念,里面包含了许多方向,不同的方向需要学习的内容也不一样。 算上从学校开始学…

NSS [HUBUCTF 2022 新生赛]checkin

NSS [HUBUCTF 2022 新生赛]checkin 判断条件是if ($data_unserialize[username]$username&&$data_unserialize[password]$password),满足则给我们flag。正常思路来说,我们要使序列化传入的username和password等于代码中的两个同名变量&#xff0…

高斯分布-最大似然估计公式白板推导

由上述推导得出结论: μ M L E 1 N ∑ i 1 N x i \mu_{MLE}\frac{1}{N}\sum\limits _{i1}^{N}x_{i} μMLE​N1​i1∑N​xi​ σ ^ 2 1 N − 1 ∑ i 1 N ( x i − μ ) 2 \hat{\sigma}^{2}\frac{1}{N-1}\sum\limits _{i1}^{N}(x_{i}-\mu)^{2} σ^2N−11​i1∑N…

数字滤波器分析---零极点分析

数字滤波器分析---零极点分析 zplane 函数绘制线性系统的极点和零点。 例如,在 -1/2 处为零且在 0.9e−j2π0.3 和 0.9ej2π0.3 处有一对复极点的简单滤波器为 zer -0.5; pol 0.9*exp(j*2*pi*[-0.3 0.3]); 要查看该滤波器的零极点图,您可以使用 z…

需求调研,是做好商业智能BI的第一步

商业智能BI,一个高大上的名字,一直被很多人认为是企业信息化中的“面子工程”。美其名曰“可视化大屏”,什么经营驾驶舱,什么管理仪表盘,都是花里胡哨的东西,老板不会看,企业不会用,…

Python 解决tkinter的Menu菜单command参数与bind方法共用触发事件

用普通函数作为媒介,使用event_generate()方法模拟触发bind()事件来创建一个模拟的event对象,并将其传递给绑定的事件处理函数。 运行结果 示例代码 import tkinter as tk# 菜单事件 def menuEvent(event):print(event.x, event.y)label.config(textf鼠…

Windows系统Python语言环境下通过SDK进行动作捕捉数据传输

NOKOV度量动作捕捉系统可以与市面上主流的操作系统和编程语言实现通信。可以在Windows系统Python语言环境下通过SDK进行动作捕捉数据传输。 一、形影软件设置 1、切换到后处理模式 2、加载一段刚体数据 3、打开软件设置 4、将网卡地址选择为10.1.1.198 5、勾选上"使用SD…

java项目之戒烟网站(ssm+vue)

项目简介 戒烟网站实现了以下功能: 用户可以对首页,用户分享,论坛交流,公告文章,个人中心,后台管理等功能进行操作。 管理员可以对网站所有功能进行管理,包括管理用户的基本信息。 &#x1f4…

快速开发一个简单实用的MES系统?

题主在一个光伏组件工厂做生产管理,但工厂竟然没有MES系统,于是想自己开发一个简单的MES系统。那么我们来看看题主对于开发MES系统的要求—— 对系统:每一个产品都有一个条形码,希望系统可以追踪生产计划下的产品的生产状态&…

k8s ingress基础

一、ingress 简介 在k8s集群中,service和pod的ip为内网ip,仅集群内部才可以访问。如果外部应用想要直接访问集群内的服务,就需要把外部请求通过负载均衡转发到service上,然后再由kube-proxy组件将其转发给后端pod。一般service可…

网络安全——

文章目录 网络安全TCP/IP与网络安全网络安全构成要素加密技术基础 网络安全 TCP/IP与网络安全 起初,TCP/IP只用于一个相对封闭的环境,之后才发展为并无太多限制、可以从远程访问更多资源的形式。因此,“安全”这个概念并没有引起人们太多的…

不想努力了,有没有不用努力就能考上硕士的方法

今年,硕士研究生考试报考人数再次刷新了纪录,高达474万人次。 这些年考研一直在扩招,但是录取率却越来越低,内卷血腥程度可想而知! 2020年研究生报考人数341万,录取人数99.05万,录取率29.05%。…

Vue 组件化编程 和 生命周期

目录 一、组件化编程 1.基本介绍 : 2.原理示意图 : 3.全局组件示例 : 4.局部组件示例 : 5.全局组件和局部组件的区别 : 二、生命周期 1.基本介绍 : 2.生命周期示意图 : 3.实例测试 : 一、组件化编程 1.基本介绍 : (1) 开发大型应用的时候,页面往往划分成…