以下是这些 YOLO 系列配置文件的详细解析,按版本和功能分类说明:
一、YOLOv3 系列
文件名 核心特性 适用场景 yolov3.yaml
原始 YOLOv3 结构,3 尺度预测(13x13,26x26,52x52) 通用目标检测 yolov3-spp.yaml
增加 SPP(空间金字塔池化)模块 ,提升感受野 大目标检测(如遥感图像) yolov3-tiny.yaml
轻量化版本,仅保留 2 个预测层,通道数减半 边缘设备实时检测
二、YOLOv5 基础系列
按模型大小分类(参数量递增):
文件名 模型规模 参数量(M) FLOPs(G) 特点 yolov5n6.yaml
Nano 1.9 4.5 最小模型,适合移动端 yolov5s6.yaml
Small 7.2 16.5 平衡速度与精度 yolov5m6.yaml
Medium 21.2 49.0 主流选择 yolov5l6.yaml
Large 46.5 109.1 高精度场景 yolov5x6.yaml
XLarge 86.7 205.7 最大模型,需高性能GPU
注 :后缀 6
表示输入分辨率为 640x640 (默认 yolov5s
为 640x640,yolov5s6
强调分辨率配置)
三、YOLOv5 结构变体
1. 特征金字塔改进
文件名 结构特性 yolov5-fpn.yaml
使用标准 FPN (自顶向下融合) yolov5-panet.yaml
使用 PANet (双向特征金字塔) yolov5-bifpn.yaml
采用 BiFPN (加权双向跨尺度连接)
2. 多尺度预测增强
文件名 预测层配置 优势领域 yolov5-p2.yaml
2 层预测(P3, P4) 中大型目标快速检测 yolov5-p34.yaml
3 层预测(P3, P4, P5) 通用场景 yolov5-p6.yaml
4 层预测(P3-P6),最高层下采样64倍 极小目标检测(如无人机) yolov5-p7.yaml
5 层预测(P3-P7),支持 1280x1280 输入 超高清图像分析
3. 模块替换优化
文件名 关键技术 作用 yolov5s-ghost.yaml
使用 Ghost 模块替代常规卷积 减少 30% 计算量 yolov5s-LeakyReLU.yaml
激活函数替换为 LeakyReLU(原版为 SiLU) 兼容老旧硬件部署 yolov5s-transformer.yaml
在 Neck 部分引入 Transformer 编码器 提升复杂场景识别能力
四、锚点框配置
文件名 作用 anchors.yaml
定义锚点框(anchor boxes)的尺寸和比例,需根据数据集目标尺寸调整
五、典型场景推荐
需求 推荐配置文件 硬件要求 工业质检(小缺陷) yolov5m6-p6.yaml
RTX 3080 移动端实时检测 yolov5n6.yaml
Jetson Nano 自动驾驶(多尺度目标) yolov5x6-bifpn.yaml
A100 GPU 兼容 TensorRT 部署 yolov5s-LeakyReLU.yaml
支持 FP16 的嵌入式设备
关键参数对比示例
以输入尺寸 640x640 为例:
模型 mAP@0.5 速度(FPS) 显存占用(GB) yolov5n6 28.9 220 1.2 yolov5s-bifpn 37.5 120 3.8 yolov5x6-p7 52.1 35 18.4
注 :数据基于 COCO 2017 验证集,测试硬件为 RTX 3090。