在工作过程中难免会遇到死机的问题,排查起来并不是那么轻松,下面分享一下我排查死机问题的思路。
判断是软件还是硬件级别的故障
在死机时先尝试移动鼠标,按大小写切换键或数字键盘锁定键,看看光标是否可以移动,大小写灯或数字键盘灯是否可以开启和熄灭。
还可以尝试进入PE系统测试,如果发现进入PE系统依然死机,那很可能是硬件级别的故障。
一、硬件级别故障
如鼠标无法拖动,且大小写灯或数字键盘灯无法开启和熄灭,优先判定为硬件问题。最常见的就是主板内存条故障,可以尝试恢复BIOS出厂设置,升级BIOS版本,拔插内存条,更换内存条等。其中重置BIOS出厂设置是我运维经验中相对比较有效的一个方法,当然重置之前建议先检查和记录下BIOS有没有做什么改动,比如用户之前改动过硬盘模式,重置后可能还得改回去,否则可能会进不去系统。
二、软件级别故障
如大小写灯或数字键盘灯可以正常开启和熄灭,则优先判定为系统或软件问题。
先查看鼠标是否可以正常移动,按Ctrl+Alt+Delete是否有反应,如有反应则优先考虑系统非关键性组件、第三方软件等异常。
如无反应则优先考虑系统关键性组件异常,或者cpu内存硬盘资源耗尽等。
1)尝试复现问题
在解决问题时,最怕的就是问题不能稳定复现,排查起来就会很困难。所以优先尝试能不能将问题稳定复现出来,可以查看是不是在打开运行什么程序就会死机,寻找规律看看是不是在什么条件下就会触发死机
2)查看日志记录
到控制面板 > 系统与安全 > 安全与维护 > 查看可靠性历史记录,和开始菜单右键选择事件查看器,看看在死机的时间段有没有有帮助的错误信息记录
3)无法定位根源的问题,建议使用排除法
如果问题可以稳定复现,但无法确定根源所在的话,可以尝试退出杀毒软件,切换登录账号,进入安全模式等。切换登录账号可以帮助判断问题根源是不是属于用户配置文件下的异常,安全模式可以帮助判断问题根源是不是系统关键性文件下的异常。
4)最终解决方法:重装系统
确定是软件级别的问题后,如果一直无法定位问题根源,或者安全模式进去都有异常的话,可以权衡一下问题解决需要花费的时间和精力,有时可能重装系统能更快速彻底的眼前的解决问题。