简介:1.该教程提供大量的首发改进的方式,降低上手难度,多种结构改进,助力寻找创新点!
2.本篇文章对Pointnet++特征提取模块进行改进,加入
WTConv2d,提升性能。
3.专栏持续更新,紧随最新的研究内容。
目录
1.理论介绍
2.修改步骤
2.1 步骤一
2.2 步骤二
2.3 步骤三
1.理论介绍
近年来,人们一直试图增加卷积神经网络(cnn)的核大小,以模拟视觉变形者(ViTs)的全局接受场自注意块。然而,这种方法在达到全局接受场之前很快就达到了上限和饱和。在这项工作中,我们证明了通过利用小波变换(WT),实际上可以在不受过度参数化影响的情况下获得非常大的接受域,例如,对于k × k的接受域,所提出的方法中可训练参数的数量仅随k呈对数增长。所提出的层,称为WTConv,可以用作现有架构中的临时替代品,产生有效的多频响应。并随着接受野的大小优雅地缩放。我们展示了在ConvNeXt和MobileNetV2架构中用于图像分类的WTConv层的有效性,以及用于下游任务的骨干,并展示了它产生额外的属性,例如对图像损坏的鲁棒性和对纹理形状的响应增加