摘要
PP-HGNetV2(High Performance GPU Network V2) 是百度飞桨视觉团队自研的 PP-HGNet 的下一代版本,其在 PP-HGNet 的基础上,做了进一步优化和改进,最终在 NVIDIA GPU 设备上,将 “Accuracy-Latency Balance” 做到了极致,精度大幅超过了其他同样推理速度的模型。其在单标签分类、多标签分类、目标检测、语义分割等任务中,均有较强的表现。PP-HGNetV2 与常见的模型在精度-预测耗时的比较如下图所示。
模型细节
PP-HGNetV2 在 PP-HGNet 上的具体改进点如下:
- 改进了 PPHGNet 网络 stem 部分,堆叠更多的 2x2 卷积核以学习更丰富的局部特征,使用更小的通道数以提升大分辨率任务如目标检测、语义分割等的推理速度;
- 替换了 PP-HGNet 中靠后 stage 的较冗余的标准卷积层为 PW + DW5x5 组合,在获得更大感受野的同时网络的参数量更少,且精度可以进一步提升;
- 增加了 LearnableAffineBlock 模块,其可以在增加极少参数量的同时大幅提升较小模型的精度,且对推理时间无损;
- 重构了 PP-HGNet 网络的 stage 分布,使其涵盖了从 B0-B6 不同量级的模型,从而满足不同任务的需求。
代码可在这个链接找到:代码地址
本文在 YOLOv10 中的主干网络替换成 PP-HGNetV2,代码已经整理好了,跟着文章复制粘贴,即可直接运行
目录
- 摘要
- 模型细节
- 🎓一、YOLOv10原始版本代码下载
-
- 🍀🍀1.yolov10模型结构图
- 🍀🍀2.环境配置
- 🎓二、HGNetV2代码
-
- 🍀🍀1.整理好代码如下:
- 🍀🍀2.打印模型结构和理解YOLOv10结构