Yolo系列算法-理论部分-YOLOv5

news2025/1/18 8:58:41
0. 写在前面

        YOLO系列博客,紧接上一篇Yolo系列算法-理论部分-YOLOv4-CSDN博客

1. YOLOv5-美而全的产品

        YOLOv5的诞生,直接将目标检测算法向终局推进,Ultralytics团队在COCO数据集上预训练的目标检测架构和模型直接开源,其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。

2. 网络结构

        YOLOv5是YOLOv4的升级改进版本,官方版本一共有5个,按模型的大小排序分别是YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,让开发者能再精度和速度中得到一个权衡,以YOLOv5s来说明整体网络结构。

  2.1 Input 

        图像预处理部分,对输入的图像进行Mosaic数据增强,通过随记缩放、随记裁剪、随记排布的方式对不同图像进行拼接;

        采用Mosaic数据增强的方法,从增加检测目标的背景丰富度和提高小目标检测两个方向提升检测效果;并且在BN计算的时候一次性会处理四张图片。

2.2 Backbone

        主干网络部分,主要采用:Fcous结构+CSP结构。首次引入Fcous结构,用于直接处理输入的图片,通过降维和压缩输入特征图,从而减少计算量和提高感受野,同时提高目标检测的精度和模型的表达能力

        Fcous重要的是切片操作,将4×4×3的图像切片之后变成2×2×12的特征图。

        以YOLOv5s的结构为例,原始608×608×3的图像输入Focus结构,采用切片操作,先变成304×304×12的特征图,再经过一次32个卷积核的卷积操作,最终变成304×304×32的特征图。

2.3 Neck

        网络的颈部,采用的是FPN+PAN结构,结构和YOLOv4是一样的,可以参考上一篇博文Yolo系列算法-理论部分-YOLOv4-CSDN博客:主要通过融合高低层特征提升目标检测的效果,尤其可以提高小尺寸的检测效果。

2.4 Head

        对于网络的输出部分,与YOLOv4一样采用三个不用的输出Head,进行多尺度预测;随着YOLOv5的逐渐工业落地,Head部分也可以修改为输出一个结果,便于后续终端的移植工作,详细内容可参考:

  1. Yolo系列算法-理论部分-YOLOv4-CSDN博客;
  2. 详细介绍 Yolov5 转 ONNX模型 + 使用ONNX Runtime 的 Python 部署(包含官方文档的介绍)_yolov5转onnx-CSDN博客
3. 改进方向
3.1 自适应锚框计算

        在YOLOv5之前的系列中,对最佳Anchors的获取都是通过K-Means的方法获得,这部分操作需要在网络训练之前单独运行。YOLOv5的创新点就是将此功能嵌入到整体代码中,每次训练时,自适应计算不同训练集中的最佳锚框值,并给用户开放接口,可以关掉自动计算功能。

3.2 自适应灰度填充

        为了应对输入图片尺寸不一的问题,通常做法事将原图直接resize成统一的大小,但是这样会造成目标的变形,为了避免这种情况的发生,YOLOv5采用了灰度填充的方式统一输入尺寸,避免目标变形的问题,灰度填充的核心思想就是将原图的长宽等比缩放对应统一尺寸,然后对空白部分用灰色填充。

3.3 损失函数
  1. 分类用交叉熵损失函数(BEC Loss),边界框回归用CIoU Loss
  2. CIoU将目标与anchor之间的中心距离,重叠率、尺度以及惩罚项都考虑进去,使得目标框回归变得更加稳定,不会像IoU和GIoU一样出现训练过程中的发散等问题;惩罚因子把预测框长宽比拟合目标框的长宽比考虑进去。
4. 性能表现

        在COCO数据集上,当输入原图的尺寸是:640×640时,从YOLOv5n到YOLOv5s,检测精度逐渐上升,检测速度逐渐下降,非常适合工程实践,实现精度与速度的完美匹配。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1518813.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot同时接收json数据和 MultipartFile

首先测试接口发送方式。。。。。注意发送结构&#xff01; 后端接收RequestPart SaCheckPermission("system:records:add")Log(title "【用药纪录】", businessType BusinessType.INSERT)RepeatSubmit()PostMapping()public R<Void> add( RequestP…

【上海大学计算机组成原理实验报告】一、数据传送实验

一、实验目的 了解实验仪器数据总线的控制方式。掌握数据传送的基本原理。掌握各寄存器的结构、工作原理及其控制方法。 二、实验原理 根据实验指导书的相关内容&#xff0c;数据输入到寄存器的过程是先通过指令选择源和目标&#xff0c;再通过数据总线来传送数据&#xff0…

mac电脑解决无法打开软件

文章目录 报错内容解决方法一方法二方法三 报错内容 macOS无法验证此App是否包含恶意软件。 解决方法一 打开系统偏好设置>安全性与隐私>通用&#xff0c;这个时候有个按钮&#xff0c;“仍然允许”点击即可。 方法二 按住Control键点按应用, 然后打开&#xff0c…

D1084 5A低压差电压调整器芯片——具有5A输出能力、低压差为1.5V的三端稳压器

1、 概述&#xff1a; D1084是一款具有5A输出能力、低压差为1.5V的三端稳压器。输出电压可通过电位器调节或1.5V, 1.8V, 3.3V三个固定电压版。内含电流限制和热保护功能&#xff0c;防止任何过载时产生过高的结温。D1084系列电路有标准TO-220、TO-263和TO-252封装形式。 2、 典…

AIX7.2下安装qt4.8.7

在AIX安装Qt需要编译安装&#xff0c;编译需要安装xlC编译器。 安装好xlC编译器后我们需要将对应的路径导入到PATH环境变量中 export PATH/opt/IBM/xlC/16.1.0/bin:/opt/IBM/xlc/16.1.0/bin:$PATH 解压 qt-everywhere-opensource-src-4.8.7.tar.gz gunzip -d qt-everywhere…

pr怎么导出mp4格式?正确步骤在这里

在PR中导出MP4格式的视频文件是一项基本而重要的技能&#xff0c;特别是当您希望与他人分享您的创作或在不同平台上展示您的作品时。正确的导出步骤不仅确保视频质量的最大化&#xff0c;还可以确保文件格式的兼容性&#xff0c;使得您的视频能够在各种设备和平台上无缝播放。p…

markdown笔记公式(持续更新)

文章目录 1. 如何插入数学公式2. 加减乘除3. 幂数、指数、对数4. 根号、省略号、向量以及特殊符号&#xff08;大于等于、小于等于&#xff09;、划线5. 累加、累乘6. 矩阵6.1无框矩阵6.2 边框矩阵6.3 带省略符号的矩阵6.4 带分割符号的矩阵6.5 行中矩阵 7. 积分8. 极限运算9. …

【3GPP】【核心网】【5G】5G核心网组网方案(超详细)

5G NR RRC协议总体介绍 1. 开机入网流程 UE入网过程包括几个子过程: 小区搜索与选择 UE开机选网,小区搜索并完成下行同步。 系统消息广播 UE读取广播信息,选择合适小区进行驻留。 随机接入 UE与gNB建立上行同步。 RRC连接建立 …

HTML案例-1.标签练习

效果 源码 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </head&g…

链路聚合实验(华为)

思科设备参考&#xff1a;链路聚合实验&#xff08;思科&#xff09; 一&#xff0c;技术简介 网络设备的链路聚合技术&#xff08;Link Aggregation&#xff09;是一种将多个物理链路捆绑在一起&#xff0c;形成一个逻辑链路的技术。这样做可以增加带宽、提高可靠性和实现负…

硬件笔记(26)---- 高速电路中滤波电容的选取

先要知道电容的等效电路 其中ESL取决于电容的类型和封装&#xff0c;一般用贴片陶瓷电容为例&#xff0c;对于直插式电解电容&#xff0c;他们的ESL很大。按下表&#xff0c;封装越大&#xff0c;ESL越大&#xff0c;但是0612有些例外 0612和1206就是 长短边的区别&#xff0c;…

【征稿中-EI稳定检索】2024年电力、能源工程和计算机技术国际学术会议 (ICPEECT 2024)

【征稿中-EI稳定检索】2024年电力、能源工程和计算机技术国际学术会议 (ICPEECT 2024) 2024 International Conference on Power, Energy Engineering, and Computer Technology (ICPEECT 2024) 会议官网&#xff1a;http://www.icpeect.com &#xff08;先投稿&#xff0c;先…

【联邦学习贡献评估-数据评估指标的介绍】

跨机构联邦学习 企业或机构作为参与方的联邦学习称为跨机构联邦学习, 也称为企业对企业联邦 学习(business-to-business, B2B FL). 跨机构联邦学习呈现参与方数量少、算力充足、单个参与方数据 量大、存在商业风险顾虑等特点. 案例 典型案例是 FATE 联邦学习平台, 为金融等行…

OJ_这是一颗树吗

题干 C实现 树结构需要满足的三个条件 不存在入度大于2的结点已连通的u&#xff0c;v&#xff0c;再加入一条新边就会成环边数 顶点数-1 #include <iostream> #include <vector> using namespace std;//并查集的应用&#xff1a;判断图的连通性int set[10001];…

最迟但到的 Star History 2023 年度开源精选!

千呼万唤始出来&#xff0c;Star History 2023 年终开源精选来啦&#xff01;&#x1f389; AI 是 2023 开源领域里最主要的关键词&#xff0c;但其实过去一年还是有很多其他值得关注的项目和发展趋势的&#xff01;Star History 小编总结了几个类别并精选了类别中最亮眼的项目…

Java基于微信小程序的校园订餐小程序的研究与实现,附源码

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…

MySQL一些命令记录

查看数据引擎 show engines;创建数据库,并选择库 CREATE DATABASE IF NOT EXISTS test_database; USE test_database;创建表 CREATE TABLE IF NOT EXISTS test_table (id INT AUTO_INCREMENT PRIMARY KEY,field1 VARCHAR(50),field2 VARCHAR(50),field3 VARCHAR(50),field4 …

为什么猫咪生骨肉冻干价格相差那么大?五款比较好的猫生骨肉冻干牌子推荐

随着养猫知识的普及&#xff0c;生骨肉冻干喂养受到越来越多铲屎官的欢迎。然而&#xff0c;价格因素让部分铲屎官止步。事实上&#xff0c;资深铲屎官如我&#xff0c;早已认识到生骨肉冻干的价值。虽然价格稍高&#xff0c;但其为猫咪带来的实际好处是远超其价格的。 对于像我…

Python处理大型(>1GB)CSV文件的正确姿势

Python大型CSV文件处理 1、背景描述2、大型CSV文件处理方式 1、背景描述 Pandas在读取大型文件时&#xff0c;通常会遇到内存不足的问题。例如&#xff0c;在某次处理大于1GB的CSV文件时&#xff0c;出现了如下错误&#xff1a; 那么&#xff0c;针对这种情况&#xff0c;我们应…

fs模块 练习题

编写程序&#xff1a; 在文件夹data里有文件a.txt和文件b.txt。将文件a.txt和文件b.txt的内容读取后写入文件c.txt中。 一、同步读取 const fs require(fs); let datas1fs.readFileSync(./data/a.txt); let datas2fs.readFileSync(./data/b.txt); let datas3datas1datas2;//对…