文章目录
- 一、介绍
- 二、编译DCNv4
- 2.1 下载源码
- 2.2 编译DCNv4
- 三、报错提示
- 3.1 Cuda is not available
- 3.2 需要Microsoft Visual C++ 14.0
一、介绍
论文链接:[https://arxiv.org/pdf/2401.06197.pdf]
(https://arxiv.org/pdf/2401.06197.pdf)
在这篇文章中介绍了一种高效和有效的算子DCNv4,它是专为广泛的视觉应用而设计的。DCNv4解决了其前身DCNv3的限制,且有两个关键的增强功能:
- (1) 去除了空间聚合中的softmax归一化,以增强其动态性和表达能力;
- (2) 优化存储器访问以最小化冗余操作以加速。这些改进显著加快了收敛速度,并大幅提高了处理速度,DCNv 4实现了三倍以上的前向速度。
这些改进使DCNv4相比DCNv3具有显著更快的收敛速度和大幅提高的处理速度,DCNv4的前向计算速度超过了其前身的三倍。DCNv4在各种任务中表现卓越,包括图像分类、实例和语义分割,尤其在图像生成方面。
将其与诸如潜在扩散模型中的U-Net等生成模型相结合时,DCNv4的表现优于其基线,表明它在提升生成模型方面具有潜力。在实际应用中,将DCNv3替换为DCNv4到InternImage模型中以创建FlashInternImage,带来了高达80%的速度提升和更好的性能,无需进一步修改。
DCNv4在速度和效率上的改进,加上其在各种视觉任务中出色的性能,展示了其作为未来视觉模型基础构建模块的潜力。
二、编译DCNv4
2.1 下载源码
源码下载链接:https://github.com/OpenGVLab/DCNv4
源码下载完成后,解压后如下图所示:
2.2 编译DCNv4
(1)使用cd命令进入DCNv4_op文件夹
(2)在该文件夹下执行以下命令:
python setup.py build install
等待一段时间后,若出现下述提升证明编译成功:
三、报错提示
3.1 Cuda is not available
在进行编译时,需要再cuda环境中进行。
验证pytorch cuda可用:
- 在Anaconda Prompt激活虚拟环境后,输入 python进入python控制台
- 接着输入下述指令,显示True即代表cuda可用:
>>> import torch
>>> torch.cuda.is_available()
True
3.2 需要Microsoft Visual C++ 14.0
安装过程中,也出现了下述错误,提示需要Microsoft Visual C++ 14.0。
最终只能点击下述链接下载。下载完成,双击.exe文件,点击安装,等待10分钟左右即可完成安装。
Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools