贡献:
1.有效且强大的模型,常规GPU(1080ti or 2080ti)可得到实时、高质量的检测结果。
2.在训练中,验证 Bag-of-Freebies 和 Bag-of-Specials 方法
3.提出了两种数据增强手段,马赛克和自对抗训练(SAT)
4.修改了最先进的方法,更有效且适合单GPU训练。
views:
1.简单说就是一个拼接怪,把大家提出的模块和提高检测的手段用到了一起,进行了丰富的实验
2.值得一提的是对整个目标检测常用的手段和发展进行了总结,本文的亮点恰恰是在Related Work,而Method只提了下采用什么模块。
ideas:
可以在后续的检测算法用采用其中的一部分功能。
摘要:一些通用功能可以提高网络的性能的,认为包括:Weighted-Residual-connection(WRC) 加权残差连接、Cross-Stage-Partial-connections (CSP) 跨阶段部分连接, Cross mini-Batch Normalization (CmBN) 跨小批量标准化, Self-adversarial-training (SAT) 自对抗训练 and Mish-activation Mish激活。我们使用以上新功能和 Mosaic data augmentation 马赛克数据增强、DropBlock 正则化 、CIOU Loss 来实现最新结果。
1.Introduction
指出目标检测算法应有较好的实时性,并且可以在单个常规GPU上进行训练和推理。
目的是设计快速的生成系统和优化并行计算。常规GPU可得到实时、高质量的检测结果。
2.Related Work(本文亮点)
2.1 Object detection models
现代检测器通常包括两部分,一个是在ImageNet上预训练的 backbone,另一个是用来预测对象类别和边界框的 head 。还有一些在backbone和head之间插入的层,称为neck。
2.2 Bag of freebies
通常检测算法是线下训练,针对训练采用的技巧和策略,在推理是无代价,称为“免费赠品”。主要包括:数据增强,处理语义分布不平衡、边界框回归。
2.3 Bag of specials
一些插入的模型或post-processing,称为“特价品”,可以花费少量代价提高网络的性能。
3.Method
介绍了yolov4采用了上面的哪些结构,提出了创新的马赛克增强和自对抗训练,篇幅一页的样子。
4.conclusion
SOTA性能,验证了许多tricks,可为后续工作作为参考。