金字塔的三种主要结构
FPN: Feature Pyramid Networks for Object Detection (CVPR 2017)
PANet: Path Aggregation Network for Instance Segmentation (CVPR 2018)
BiFPN: EfficientDet: Scalable and Efficient Object Detection (CVPR 2020)
Deep High-Resolution Representation Learning for Human Pose Estimation(CVPR 2019)
同分辨率的层直接复制;需要升分辨率的使用双线性上采样,并用 1x1卷积将通道数统一;需要降分辨率的使用步长为3的卷积。然后直接将特征图相加。
Learning Spatial Fusion for Single-Shot Object Detection (CoRR 2019)
在FPN的基础上加了一个自适应特征融合模块(ASFF)。上采样:首先用1*1的卷积进行通道变换,然后进行上采样。1/2比例下采样:使用步长为2的3*3的卷积同时对通道和分辨率进行变换; 1/4比例下采样:先使用步长为2的3*3的卷积同时对通道和分辨率进行变换,然后再使用步长为2的最大池化下采样。权重α,β,γ是通过卷积学习到的。
Construct Effective Geometry Aware Feature Pyramid Network for Multi-Scale Object Detection (AAAI 2022)
增加了特征增强模块FA。
Dynamic Feature Pyramid Networks for Detection (ICME 2022)
GAW为生成权重模块,主要包含平均池化,全连接层以及sigmoid激活函数。主要思想和CondConv一样,用不同的权重乘上固定的卷积核。