点击目录可跳转
- 起因
- 原因
- 解决办法
起因
-
安装cudnn时,想进行验证操作,进入官方提供的
$HOME/cudnn_samples_v8/mnistCUDNN/
后,运行./mnistCUDNN
时,报了标题的错误。如下图:
-
顺便提一下,我是不知道为什么报错“pytorch版本和cuda版本不匹配”,然后不知道怎么办,就把显卡驱动、cuda、pytorch全都卸载了重装。现在说几个点,给同样遇到这个问题的朋友:
- 事后诸葛亮的说,我觉得可以先看一下pytorch版本,是cpu版的还是cuda版的,我很怀疑是我安某个东西的时候把pytorch版本给劳资换了;
- 因为cuda高版本可以向下兼容低版本pytorch,比如安的是pytorch+cuda11.8的话,但是cuda版本是12.2,这样是不会出现“版本不匹配”这个报错的;
- 我当时就是安了一个tensorboard,安之前好好的,安完代码就不能跑了。报错就如上边所说。回想起来可能是tensorboard的时候直接在终端升级了pytorch,但是在终端直接安的话,安的是cpu版本的。(官网安才是gpu版;
- 所以应该是,直接pytorch卸掉,去官网重新安一下gpu版的就可以了。版本也不用担心,cuda可以向下兼容。
-
说这个事情的目的就是,如果有兄弟也是因为报了什么错然后来重装的cuda,那么可以参考一下,我觉得cuda不用管。重装pytorch才是真的解决问题。
原因
-
我也是网上看的,有个帖子里,有个哥们报错信息类似,我这后边是
error_util.h:91
,他那后边是error_util.h:92
,我觉得异曲同工吧,然后方法就是那个帖子里找的(不过现在找不到那个帖子了; -
帖子并未给出真的切实可行的办法,更没有解释出原因;
-
但是有的人
reboot
重启系统就不报错了。我试了,不行,好多兄弟姐妹也去试了,有的人可以,有的人也不行;
-
上边那个就是重启解决,你不妨也重启一下试试行不行。
-
然后下边这哥们就是重启不管用的,和我一样,但是他提出了另一种办法:
-
他说"Rebooting or using sudo for the cudnn test is not working",等于说还有一种办法是
sudo ./mnistCUDNN
嘛。我试了一下,可以了。
-
不过具体是什么原因不知道,那可能是权限问题吧。不清楚。
解决办法
可详细看一下上一部分 # 原因 的内容
reboot
重启系统sudo ./mnistCUDNN