Unable to find a valid cuDNN algorithm to run convolution
今天在复习HumanNerf的时候发现了这个报错,
import torch
print(torch.cuda.is_available())
使用上面的代码发现GPU是可以用的,可自己的torch版本对应。
后面继续看帖子,总结有这么几个
1GPU内存不够(但我之前遇到的GPU内存不够的报错,应该这样 ----- allocated 3.88/4.00 -----memory --不够 类似这样,和这个差挺多)
2修改 num_work or batchsize (应该会有效果,但我项目里没这2个参数)
后面自己结合上面的观点,推导了,大概就是项目配置文件里面对GPU的要求和我自己本机不太对应(我电脑就1个3050ti)
去项目配置文件翻了下,
在这里, 原来是4个worker,想起来论文里作者是不是用4个GPU训练?
我改成了1,就可以运行了
可以运行。
总结:每个人遇到问题的报错不一样,但他们的解决方法是类似的,比如这里思维就是 去配置文件里面找一找,有没有与本机GPU情况不符的配置代码,改下就可以