关于torch.load()更改了cuda位置还是cuda内存不够的问题

news2025/10/20 10:48:59

关于torch.load()变了cuda位置还是cuda内存不够的问题

问题背景：在一次任务中，由于需要使用cuda进行代码运行，但是分明修改了cuda到一个空闲的卡位置，但是依然抱错cuda out of memory的问题

在任务中，最开始原始代码是采用以下方式尽心模型load的（指定了cuda to device的位置是空闲的卡2）：
在这里插入图片描述
但是依然抱错cuda out of memory，分析如下：

model.load_state_dict(torch.load(FLAGS.restore))
print(f"Model loaded from {FLAGS.restore}")
model.to(FLAGS.device)

从上面的代码可以看出，其实model是先load到默认路径，然后再转换到了指定的device的位置，这样就在第一次load的时候，如果默认位置的cuda被占用，就会导致out of memory的问题

建议好的习惯：
model.load_state_dict(torch.load(FLAGS.restore, map_location=‘cuda:2’))
在model load 的时候直接map_location到指定位置，例如你可以在config文件中设置cuda卡配置：

model.load_state_dict(torch.load(FLAGS.restore, map_location=FLAGS.device))

这样则免除了load到默认卡的这一步。

respect！！！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/750374.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！