windows10蓝屏原因自检记录

news2024/11/24 22:44:14

背景

跑训练的过程中电脑自动重启了,为了满足长期训练的需要,研究一下死机原因

查看系统日志

右键我的电脑——管理——系统工具——事件查看器——系统
检索级别为错误的内容,在死机时间附近查找相关日志,发现如下日志

在这里插入图片描述
计算机已经从检测错误后重新启动。检测错误: 0x00000133 (0x0000000000000001, 0x0000000000001e00, 0xfffff8031831c340, 0x0000000000000000)。已将转储的数据保存在: C:\Windows\Minidump\061324-7875-01.dmp。报告 ID: 511a8288-aae8-4d5b-b92f-88ad1f90439b。
搜索以上内容没有得到一个具体的答案。

dmp文件无法直接打开,查询相关软件,可使用以下两个方案进行解析:
WinDbg:这是一个强大的调试工具,适用于深入分析转储文件。它是 Windows 调试工具的一部分,可以从 Microsoft 的网站下载。
WhoCrashed:这是一款用户友好的工具,可以自动分析转储文件,并生成易于理解的报告,帮助用户识别导致崩溃的原因。

Windbg源自于windows官方,可以直接在Microsoft Store中下载安装,(3.6的超高评分),故选用WinDbg进行自检。

WinDbg配置

Windbg的使用可以参考以下链接
https://blog.csdn.net/VinWqx/article/details/111675839

https://www.cnblogs.com/ae6623/p/5029628.html

跟随教程 设置符号链接地址
在这里插入图片描述
将符号表地址:SRVC:\Symbolshttp://msdl.microsoft.com/download/symbols 粘贴在输入框中。
备注:当你想打开第二个dmp文件时,可能因为上一个分析记录未清除,导致无法直接分析下一个dmp文件,此时你可以使用快捷键【Shift+F5】来关闭上一个dmp分析记录。

自检

在命令行处输入!analyze -v
在这里插入图片描述

SYMBOL_NAME: nt!KeAccumulateTicks+231
MODULE_NAME: nt
IMAGE_NAME: ntkrnlmp.exe
IMAGE_VERSION: 10.0.22621.2134
STACK_COMMAND: .cxr; .ecxr ; kb
BUCKET_ID_FUNC_OFFSET: 231
FAILURE_BUCKET_ID: 0x133_ISR_nt!KeAccumulateTicks
OSPLATFORM_TYPE: x64
OSNAME: Windows 10
FAILURE_ID_HASH: {65350307-c3b9-f4b5-8829-4d27e9ff9b06}
Followup: MachineOwner


SYMBOL_NAME: nt!KeAccumulateTicks+231
这指定了发生崩溃的确切函数及其在函数中的偏移量。nt!KeAccumulateTicks是Windows内核中的函数,+231表示函数起始位置的偏移量。
MODULE_NAME: nt
发生故障的模块(或组件)。这里的nt代表Windows NT内核。
IMAGE_NAME: ntkrnlmp.exe
模块的镜像(可执行文件)名称。ntkrnlmp.exe是Windows NT内核的多处理器版本可执行文件。

根据以上信息,nt内核挂了,ntkrnlmp.exe引起的蓝屏重启,这个进程与硬件交互的必备进程,大概率是硬件挂了。硬件挂掉的原因大概率是因为散热问题,显卡长期使用散热不够导致了挂机。
另一个博主提到svchost.exe,命令行中输入!process
在这里插入图片描述

PROCESS ffffdf8c6a9b5080
进程对象地址:ffffdf8c6a9b5080。这是在内核中指向该进程对象的指针。
SessionId: none
会话ID:表示此进程不属于任何特定的用户会话。
Cid: 1060
进程ID(PID):1060。
Peb: 48c1c5000
进程环境块(PEB)地址:48c1c5000。
ParentCid: 0414
父进程ID:414。
DirBase: 217efe000
目录基地址:217efe000。
ObjectTable: ffffb6801079fac0
对象表地址:fffb6801079fac0。
HandleCount:
句柄计数:数据不可访问。
Image: svchost.exe
进程名称:svchost.exe。
VadRoot ffffdf8c83e453f0 Vads 813 Clone 0 Private 22074. Modified 407573. Locked 0.
虚拟地址描述符(VAD)根地址:ffffdf8c83e453f0,VAD数量:813,克隆数量:0,私有页面数量:22074,已修改页面数量:407573,被锁定页面数量:0。
DeviceMap ffffb68009461e80
设备映射地址:fffb68009461e80。
Token ffffb6801108d970
安全令牌地址:fffb6801108d970。
ReadMemory error: Cannot get nt!KeMaximumIncrement value.
读取内存错误:无法获取nt!KeMaximumIncrement值。
fffff78000000000: Unable to get shared data
无法获取共享数据:fffff78000000000。
ElapsedTime 00:00:00.000
已用时间:00:00:00.000。
UserTime 00:00:00.000
用户时间:00:00:00.000。
KernelTime 00:00:00.000
内核时间:00:00:00.000。
QuotaPoolUsage[PagedPool] 336672
配额池使用量(分页池):336672。
QuotaPoolUsage[NonPagedPool] 1164064
配额池使用量(非分页池):1164064。
Working Set Sizes (now,min,max) (8651, 50, 345) (34604KB, 200KB, 1380KB)
工作集大小(当前,最小,最大):(8651,50,345)页,(34604KB,200KB,1380KB)。
PeakWorkingSetSize 281914
峰值工作集大小:281914页。
VirtualSize 2103165 Mb
虚拟内存大小:2103165 MB。
PeakVirtualSize 2103178 Mb
峰值虚拟内存大小:2103178 MB。
PageFaultCount 2212576
页面错误计数:2212576。
MemoryPriority BACKGROUND
内存优先级:后台。
BasePriority 8
基本优先级:8。
CommitCharge 23648
提交的内存使用量:23648页。

根据以上内容,内存管理的时候出现了问题,大概率是爆内存了。
使用!vm查看内存调度情况
在这里插入图片描述

无法读取多个系统地址:
无法获取 nt!PspSessionIdBitmap、nt!MiVisibleState->SessionIdBitmap 等多个地址的数据,这可能表明系统内存结构存在严重损坏或读取内存的操作失败。
没有分页文件:
输出中显示“NO PAGING FILE”,这意味着系统没有启用分页文件。分页文件对于系统内存管理非常重要,尤其在物理内存不足时。
物理内存和系统PTE(页表条目)耗尽:
系统显示物理内存和可用页完全耗尽,且没有剩余的系统PTE。这会导致严重的内存管理问题,导致系统无法正常运行。
已提交的页面数接近极限:
输出中显示“Number of committed pages is near limit”,这表明系统的内存使用已经接近了可用内存的极限。

很好,确定问题了,是因为爆内存了,svchost.exe读内存爆了,ntkrnlmp.exe具体执行内存读取任务,来背了这个锅。

防范建议是:确保系统启用了分页文件,并且分页文件的大小足够大。可以在“系统属性” -> “高级系统设置” -> “性能” -> “设置” -> “高级” -> “虚拟内存”中检查和配置分页文件。

使用!poolused、!memusage等命令同样得到内存溢出的问题,自检完毕,内存溢出,需要使用更小的batch size进行训练。

整个事件最可疑的地方莫过于windows10偷偷地进行了自动更新,使用之前的禁用方法不生效,如果有新的禁用方法务必滴滴我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1819090.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【第六篇】SpringSecurity的权限管理

一、权限管理的实现 服务端的各种资源要被SpringSecurity的权限管理控制可以通过注解和标签两种方式来处理。 放开了相关的注解后在Controller中就可以使用相关的注解来控制了 JSR250注解 /*** JSR250*/ @Controller @RequestMapping("/user") public class UserC…

深度!千字长文拆解AI Agent ,浅谈国内AI Agent 现状

“现如今ChatGPT的热度逐渐褪去,而字节的扣子逐渐被越来越多的国人知晓,钉钉、百度、Dify等也纷纷涉足工作流功能,打开国内AI工作流to B市场。今天学姐将用通俗易懂的方式讲解AI Agent是什么,以及国内大厂做Agent的进展。大家不要…

机器人中roll/pitch/yaw angles 和Euler angles的区别

在机器人学和航空领域,roll、pitch、yaw angles(滚转角、俯仰角、偏航角)和Euler angles(欧拉角)是两个经常出现的概念,它们用于描述物体在三维空间中的姿态或方向。以下是对这两个概念的解释以及它们之间的…

DeepSpeed Monitoring Comm. Logging

Monitoring 支持多种后端:Tensorboard、WandB、Comet、CSV文件; TensorBoard例子: 自动监控:DeepSpeed自动把重要metric记录下来。只需在配置文件里enable相应的看板后端即可: {"tensorboard": {"enabl…

园区数字化运营管理平台的优势、价值有哪些?

​随着全球及我国数字经济的蓬勃发展,数字化转型已成为各行各业提升效率和竞争力的关键。园区作为区域经济发展的重要载体,数字化运营管理平台更是成为了推动园区经济高质量发展的重要工具。 随着园区数字化运营管理平台的而引入,为园区在运…

FISCO BCOS x GitLink,为国产开源技术生态注入新活力

作为中国领先的区块链底层平台之一,FISCO BCOS 自成立以来始终致力于推动国产开源区块链技术的应用和普及。近期,FISCO BCOS 将开源代码托管到CCF官方代码托管平台 GitLink (确实开源),为国产开源技术生态注入新活力。…

github 本地仓库上传及报错处理

一.本地文件上传 这里为上传部分,关于gitbash安装配置,读者可自行搜索,由于已经安装完成,未进行截图保存,这里便不做赘述。 1.登录git账号并创建一个仓库 点击仓库打开后会看到这个仓库的网址链接(这个链…

SAP 价格金额信息控制

1)migo / mb51/mb51/mb59 关于价格和金额的显示,需要权限控制,当权限对象F_BKPF_BUK,检查对应【公司代码】 和 ACTVT有03’的权限,如果没有03的权限,对应行的价格和金额显示为空 关于价格和金额的显示,需要权限控制&a…

java:【@ComponentScan】和【@SpringBootApplication】扫包范围的冲突

# 代码结构如下: 注意【com.chz.myBean.branch】和【com.chz.myBean.main】这两个包是没有生重叠的。 主程序【MyBeanTest1、MyBeanTest2、MyBeanTest3】这两个类是在包【com.chz.myBean.main】下 # 示例代码 【pom.xml】 org.springframework.boot spring-boot-…

vue页面和 iframe多页面无刷新方案和并行存在解决方案

面临问题 : back的后台以jsp嵌套iframe为主, 所以在前端框架要把iframe无刷新嵌套和vue页面进行并行使用,vue的keep-alive只能对虚拟dom树 vtree 进行缓存无法缓存iframe,所以要对iframe进行处理 tab标签的切换效果具体参考若依框架的tab切换,可以去若依看源码,若依源码没有实…

Prometheus——部署详解

目录 一、Prometheus Server端安装和相关配置 1.上传安装包并解压 2.配置系统启动文件 3.启动 二、部署Node Exporters监控系统指标 三、监控Mysql配置示例 1.Mysql服务器操作 2.Prometheus服务器操作 四、监控Nginx配置示例 1.在Nginx服务器操作 2.Prometheus服务器…

裂变客户秘籍:PLG SaaS企业如何把握未来增长机遇

在数字化浪潮下,SaaS(软件即服务)行业正以前所未有的速度发展。产品驱动增长(PLG)作为SaaS行业的一大趋势,已经成为众多企业获取用户、提升市场份额的重要策略。然而,面对日益激烈的市场竞争和不…

StarRocks详解

什么是StarRocks? StarRocks是新一代极速全场景MPP数据库(高并发数据库)。 StarRocks充分吸收关系型OLAP数据库和分布式存储系统在大数据时代的优秀研究成果。 1.可以在Spark和Flink里面处理数据,然后将处理完的数据写到StarRo…

连接·共享·成长:15大顶尖峰会热议AI,逾万商家聚焦实在Agent

在数字化浪潮的推动下,人工智能(AI)和机器人流程自动化(RPA)正成为行业创新和效率提升的强大引擎。作为自动化领域的领航者,实在智能不仅在AI技术革新上保持领先地位,更通过一系列行业活动&…

计算机SCI期刊,中科院3区,IF=5.6,审稿速度非常快

一、期刊名称 International Journal of Machine Learning and Cybernetics 二、期刊简介概况 期刊类型:SCI 学科领域:计算机科学 影响因子:5.6 中科院分区:3区 三、期刊征稿范围 控制论关注的是描述我们日常生活中无处不在…

2.6-5V/2.5A升9V12V18V方案 升压恒压IC 低功耗小家电芯片-H6391惠海

H6391升压恒压IC是一款适用于多种小家电和电子设备的电源管理升压恒压芯片。其设计特点有低功耗、高效率以及灵活配置等方面,以下是针对其特性的详细分析: 宽输入电压范围:H6391支持2.6-5V的输入电压范围,这使得它适合于由单节锂电…

App UI 风格,引领设计风向

App UI 风格,引领设计风向

PCE自动装机

服务端和客户端 pxe:c/s模式,允许客户端通过远程服务器(服务端)下载引导镜像,加载安装吻技安,实现自动化安装操作系统。 无人值守:安装选项不需要认为干预,可以自动化实现。 pxe优点: 1.规模…

Linux C语言:变量的作用域和生命周期(auto、register、static和extern)

一、变量存储类型-auto 1、auto变量的说明 变量在程序中使用时,必须预先说明它们的存储类型和数据类型。 变量说明的一般形式是&#xff1a; <存储类型> <数据类型 > <变量名> &#xff1b; <存储类型>是关键词auto、register、static和extern<…

光储充一体化充电站:能源革新的绿色引擎

在这个科技日新月异的时代&#xff0c;一场绿色能源的革命正悄然兴起。 光储充一体化充电站&#xff0c;作为这场革命中的璀璨明星&#xff0c;正以其独特的魅力&#xff0c;引领我们走向更加环保、高效的未来。 光储充一体化充电站&#xff0c;顾名思义&#xff0c;将光伏发电…