哈喽小伙伴们大家好呀,很长时间没有更新啦,最近在研究一个问题,就是AttributeError: 'xxx' object has no attribute 'module'
今天终于是解决了,所以来记录分享一下:
我这里出现的问题是:
因为我的数据比较大,所以我在服务器上运行程序,但是我在本机上调通了,到服务器上面就出现这个错误,也是因为我对项目进行了更改,我更改了一个完整的网络
下面我就来说一下出现这个问题的原因:
程序中使用了nn.DataParallel,但是
PyTorch 中使用 nn.DataParallel
或 nn.parallel.DistributedDataParallel
这样的模型并行技术会导致这个问题,因为它们会将模型包装在另一个模块中,而代码可能在不同的环境下运行
我的修改包括两部分内:
针对代码中, AL_module
是一个模型,直接使用 AL_module
来进行前向传播,无需使用 .module
# 在 train 函数中,将下面这行代码修改:
logits, state = AL_module(net.module.al_input, lab_mask)
# 改为:
logits, state = AL_module(net.al_input, lab_mask)
还有一个原因是:
这种情况通常出现在使用模型并行技术(如 nn.DataParallel
或 nn.parallel.DistributedDataParallel
)时,这些技术会在模型外部包装一个额外的模块,从而导致属性访问时出现差异