RuntimeError: CUDA error: an illegal memory access was encountered 解决思路

news2025/11/20 1:38:44

问题描述：

在跑编译正常通过，CPU上也正常运行的某项目时，在运行到某个epoch时，程序突然出现以下错误：

RuntimeError: CUDA error: an illegal memory access was encountered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

如下图所示
请添加图片描述

原因分析：

网络上有很多解决方案，但是实测都不太适用（因为出现这种bug的原因是多种的）：

[彻底解决]CUDA error: an illegal memory access was encountered(CUDA错误非法访问内存)
【debug】报错RuntimeError: CUDA error: an illegal memory access was encountered
如何解决一个诡异的pytorch的illegal memory access报错？ - 知乎
pytorch报错：CUDA error: an illegal memory access was encountered

有一个博客评论指出：这种错误会出现在自己编写的一些loss或指标函数上面，由于转化为了cpu运行numpy所出现的错误。这种情况与笔者遇到的问题是类似的，其在里面加time.sleep(1)可以解决；

另一篇博客指出：在外网的评论说可能是GPU硬件问题导致的错误。

综合起来并实测来看，可能是GPU负载过大访问冲突/越界导致的，并且受多种因素影响。

解决方案：

首先，一定要在CPU模式下，完全编译通过！很多情况是代码本身写错了，出现访问越界之类的情况。

在`.cpu().numpy()` 处出现报错

在模型训练代码相关位置里面添加延时函数 Thread.sleep(毫秒数) 或者 time.sleep(1) ，以延缓GPU压力；
减小dataloader里的 num_worker 数量，

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/994507.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

RuntimeError: CUDA error: an illegal memory access was encountered 解决思路

问题描述：

原因分析：

解决方案：

在`.cpu().numpy()` 处出现报错

相关文章

【STM32教程】第四章 STM32的外部中断EXTI

创建的源文件后缀不是.c，在一些编译器上不能编译

Java基础之static关键字

Jenkins 页面部分显示Http状态403 被禁止

01背包优化 —— 滚动数组

Maven打包错误：Please refer to XXXXX for the individual test results._zhizhiqiuya

【逐步剖C++】-第一章-C++类和对象（上）

时序预测 | MATLAB实现ARMA自回归移动平均模型时间序列预测

【pdf密码】PDF文件带有密码，该如何编辑文件？

使用React Hooks实现表格搜索功能

华为全光园区商业市场解决方案

txt实现日期计算器前端代码【搬代码】

上手SpringBoot

app源代码安全检测的重要性

LeetCode 297. Serialize and Deserialize Binary Tree【树,DFS,BFS,设计,二叉树,字符串】困难

LeetCode 428. Serialize and Deserialize N-ary Tree【树,BFS,DFS】困难

华为倒逼苹果？走出舒适圈积极创新，苹果推出首批CIS堆叠式手机

Spring-MVC的文件上传下载，及插件的使用(让项目开发更节省时间)

一种基于注意机制的快速、鲁棒的混合气体识别和浓度检测算法，配备了具有双损失函数的递归神经网络

987. 二叉树的垂序遍历

RuntimeError: CUDA error: an illegal memory access was encountered 解决思路

问题描述：

原因分析：

解决方案：

在.cpu().numpy() 处出现报错

相关文章

在`.cpu().numpy()` 处出现报错