视觉小目标检测论文速读
本文主要针对三篇文章典型文章。
一. SuperYOLO
Super Resolution Assisted Object Detection in Multimodal Remote Sensing Imagery
1. 主要工作:
- 首先
去掉Focus模块取
保持HR特征, 避免分辨率下降,有效克服小目标空间损失的减少。 - 利用
像素级多模态融合(RGB+IR)
来提取信息,以增强RSI中小对象的更合适和有效的特征。 - 设计了一个简单灵活的
SR(Super Resolution)
分支,用于学习HR特征表示,只用在训练阶段。它可以区分来自广阔背景的小目标低分辨率(LR)输入。SR分支在推理阶段被丢弃
2. 算法细节:
- Backbone:以
YOLOv5s
作为baseline
- SR分支结构:Encode-Decoder model, 结合文理信息与语义信息。
二. SLICING AIDED HYPER INFERENCE AND FINE-TUNING FOR SMALL OBJECT DETECTION
参考:https://blog.csdn.net/weixin_54546190/article/details/124307316
1. 主要工作:
提出了一个通用解决方案,基于切片辅助的推理
和高分图像中小目标障碍物微调
。
2. 算法细节:
- 切片辅助的微调: 实际是
数据增强
一张原始图片,切M×N patches, resize 宽度为800-1333,+ pretrained model->fine-tuned model - 切片辅助的推理
一张原始图片,切成有重叠的M×N patches
(如下图), resize 放大, 每一张分别forward;
(可选FI)原始图片的 inference;
合并起来,再postprocess
三. Anchor Retouching via Model Interaction for Robust Object Detection in Aerial Images
1. 前言
anchor-free
: 小目标检测效果好,大目标有问题
anchor-based
: 大目标检测效果好,小目标有问题
2. 主要工作:
RoI Trans + DEA
DEA Head: 构造Sample discriminator
, 样本筛选。作用是生成更多的小目标的正向样本,提高训练时样本质量,如下图对样本分布做了统计。
3. 算法细节:
DEA HEAD = DEA(anchor-free,Fcos) + Faster-RCNN(anchor-based)
Sampler discriminator 伪代码