深度学习论文: YOLOv6 v3.0: A Full-Scale Reloading及其PyTorch实现
YOLOv6 v3.0: A Full-Scale Reloading
PDF: https://arxiv.org/pdf/2301.05586.pdf
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks
1 概述
通过扩展的骨干网络(Backbone)和颈部(Head)设计,YOLOv6 3.0 最终实时实现了 YOLO 家族的 SOTA。
2 YOLOv6 v3.0
2-1 Network Design
将 SPPF 模块简化为类似 CSP 的版本,称为 SimCSSPPPF 模块,增强了特征表示能力。其中RepBlock用于小型模型,CSPStackRepBlock用于大型模型,并相应地调整宽度和深度。
2-2 Anchor-Aided Training
相较于基于anchor-free的范式,基于anchor-base 的范式在小模型上可以获得更好的性能。因此提出了一种 anchor-aided 的锚定辅助训练(AAT)策略,以在不影响推理效率的情况下享受到 Anchor-based 和 Anchor-free 范式的优势。Anchor-Aided Training同时用于分类和回归头。
2-3 Self-distillation
采用了一种新的自蒸馏策略来提高 YOLOv6 小模型的性能,其中 DFL 的较重分支在训练期间被用作增强的辅助回归分支,并在推理时被移除以避免显着的速度下降。
DFL 的引入需要回归分支的额外参数,这会显着影响小模型的推理速度。因此,YOLOv6 专门为小型模型设计了解耦局部蒸馏 (DLD),在不降低速度的情况下提高性能。