YOLO v9 是目前表现最佳的目标检测器之一,被视为现有 YOLO 变体(如 YOLO v5、YOLOX 和 YOLO v8)的改进版本。
YOLOv9 在实时目标检测领域取得了重大进展,引入了诸如可编程梯度信息(PGI)和通用高效层聚合网络(GELAN)等开创性技术。该模型在效率、准确性和适应性方面均表现出色,在 MS COCO 数据集上树立了新的基准。YOLOv9 项目由独立的开源团队开发,是在 Ultralytics YOLOv5 提供的强大代码库基础上进行构建,展示了 AI 研究社区的协作精神。
一、YOLOv9 简介
在追求最佳实时目标检测的道路上,YOLOv9 凭借其创新的方法脱颖而出,克服了深度神经网络中固有的信息丢失挑战。通过集成 PGI(可编程梯度信息)和多功能 GELAN(通用高效层聚合网络)架构,YOLOv9 不仅增强了模型的学习能力,还确保了在整个检测过程中保留关键信息,从而实现了卓越的准确性和性能。
YOLOv9 的核心创新
YOLOv9 的进步深深植根于解决深度神经网络中信息丢失挑战的问题上。其设计以信息瓶颈原理和可逆函数的创新使用为核心,确保 YOLOv9 保持高效性和准确性。
二、YOLO v9 目标检测器的特性:
与其前身相比,YOLO v9 目标检测器的关键特性如下:
提升准确性:YOLO v9 预计将在目标检测方面提供比其前代版本更高的准确性。这一改进可以带来更加精确和可靠的检测结果。
更快的速度和更高的效率:YOLO v9 可能进行了优化,使其能够在保持高准确性的同时实现更快的处理速度。这对于实时应用或计算资源有限的情况至关重要。
增强的目标分类能力:YOLO v9 可能在目标分类能力方面进行了改进,从而能够更精确、更详细地分类检测到的目标。
三、各种 YOLO v9 模型及性能:
Yolov9t:专为速度和效率优化的轻量级预训练 YOLO v9 模型。
Yolov9s:小型预训练 YOLO v9 模型,在速度和准确性之间取得平衡,适用于需要实时性能和良好检测质量的应用。
Yolov9m:中型预训练 YOLO v9 模型,以适中的计算需求提供更高的准确性。
Yolov9c:紧凑型预训练 YOLO v9 模型,以计算强度为代价,为高端系统提供最高的检测准确性。
Yolov9e:扩展型 YOLOv9 模型是最准确的,但需要大量的计算资源,非常适合于优先考虑检测性能的高端系统。
四、YOLOv8 与 YOLOv9 对比:
在 COCO 数据集上训练的模型的 mAP(平均精度均值)是在 IoU(交并比)为 0.5 到 0.95 的范围内计算得到的平均值。
Model | 输入图像分辨率 | Size (MB) | mAP |
---|---|---|---|
yolov8n | 640 x 640 | 10.7 | 37.3 |
yolov8s | 640 x 640 | 37.2 | 44.9 |
yolov8m | 640 x 640 | 85.4 | 50.2 |
yolov8l | 640 x 640 | 143.3 | 52.9 |
yolov8x | 640 x 640 | 222.7 | 53.9 |
Model | 输入图像分辨率 | Size (MB) | mAP |
---|---|---|---|
Yolov9t | 640 x 640 | 7.5 | 38.3 |
Yolov9s | 640 x 640 | 25 | 46.8 |
Yolov9m | 640 x 640 | 67.2 | 51.4 |
Yolov9c | 640 x 640 | 85 | 53.0 |
Yolov9e | 640 x 640 | 190 | 55.6 |
五、小结:
YOLOv9 作为 YOLO 系列的最新成员之一,在目标检测领域展现出了强大的实力和潜力。
YOLOv9 在实时目标检测领域的发展中占据重要地位,在效率、准确性和适应性方面均带来了显著改进。通过采用 PGI(可编程梯度信息)和 GELAN(通用高效层聚合网络)等创新解决方案来应对关键挑战,YOLOv9 为该领域的未来研究与应用树立了新的先例。
随着技术的不断进步和应用场景的不断拓展,将在更多领域发挥重要作用并推动相关技术的发展。
老徐,仲秋,2024/9/17