1. 概述
DETR: End-to-End Object Detection with Transformers, DETR 是 Facebook 团队于 2020
年提出的基于 Transformer 的端到端目标检测,是Transformer在目标检测的开山之作 – DEtection TRansformer
。
相比于传统的Faster-rcnn,yolo系列,DETR有以下几个优点
:1).无需NMS
后处理
2).无需设定anchor
3).高效并行预测。整个由网络实现端到端的目标检测实现,大大简化了目标检测的 pipeline。 DETR在COCO 数据集上效果与 Faster RCNN 相当,在大目标上效果比 Faster RCNN 好,且可以很容易地将 DETR 迁移到其他任务例如全景分割。
Transformer VS RNN
Transformer 比 RNN 更好,因为做到了并行化
,不需要受到之前结果的影响。DETR把目标检测任务也变成一个 Set Prediction
任务,即一口气预测一个集合,而不是按照 RNN 一样一个一个预测。所以 DETR 最大的贡献,在于它提出了目标检测的新范式(新理解)—Set Prediction。论文的主要改进和实验结果总结如下图所示&