目标检测之YOLOv5算法分析

news2025/1/11 21:43:20

YOLOv5共有5个版本的网络模型及其权重文件,即(n,s,m,l,x)
(下图来自github上yolov5官方开源项目的性能截图)
在这里插入图片描述
其中n,s,m,l,x网络模型结构如出一辙,差异在参数上。另外的n6,s6,m6,l6,x6模型是对于更大分辨率图片检测。

网络结构

该网络结构图来自CSDN博主:江大白。此处引用,仅供学习记录使用。
在这里插入图片描述
此图为 Y O L O v 5 s YOLOv5s YOLOv5s的网络模型架构。

Backbone

CSP-Darknet53

Neck

SPPF + CSP-PAN
在这里插入图片描述

Head

YOLOv3 Head
输出三种大小的特征预测,如分别是 ( 76 , 76 , 255 ) , ( 38 , 38 , 255 ) , ( 19 , 19 , 255 ) (76,76,255),(38,38,255),(19,19,255) (76,76,255),(38,38,255),(19,19,255),不同版本不一致。


重点解析

边界框优化
在YOLOv4的基础上,将 b w = p w ∗ e t w b_w=p_w*e^{t_w} bw=pwetw b h = p h ∗ e t h b_h=p_h*e^{t_h} bh=pheth换成 b w = p w ∗ ( 2 ∗ σ ( e t w ) ) 2 b_w=p_w*(2*\sigma(e^{t_w}))^2 bw=pw(2σ(etw))2 b h = p h ∗ ( 2 ∗ σ ( e t h ) ) 2 b_h=p_h*(2*\sigma(e^{t_h}))^2 bh=ph(2σ(eth))2.
使用 σ \sigma σ函数旨在限制 t w t_w tw t h t_h th的值域,避免出现Nan的情况发生。

数据增强
数据增强方式有mosaic、HSV色域变换、旋转、缩放、翻转、平移、剪切等

真实框与Anchor匹配

r w = w g t w a t r h = h g t h a t r w m a x = m a x ( r w , 1 r w ) r h m a x = m a x ( r h , 1 r h ) r w m a x = m a x ( r w m a x , r h m a x ) \begin{align} r_w&=\frac{w_{gt}}{w_{at}}\\ r_h&=\frac{h_{gt}}{h_{at}}\\ r_w^{max}&=max(r_w,\frac{1}{r_w})\\ r_h^{max}&=max(r_h,\frac{1}{r_h})\\ r_w^{max}&=max(r_w^{max},r_h^{max})\\ \end{align} rwrhrwmaxrhmaxrwmax=watwgt=hathgt=max(rw,rw1)=max(rh,rh1)=max(rwmax,rhmax)
其中 w g t w_{gt} wgt为真实框的宽度, w a t w_{at} wat为anchor的宽度, h g t h_{gt} hgt为真实框的高度, h a t h_{at} hat为anchor的高度。

( 3 ) ( 4 ) (3)(4) (3)(4)两式子用于衡量真实框与anchor差异大小,如果两者框的差异最小或两个框最相近,那么 r h m a x r_h^{max} rhmax r w m a x r_w^{max} rwmax为1.最后 ( 5 ) (5) (5)中,获取框在高、宽上的最大差异值。这个差异值会与给定的阈值进行比较,如果满足阈值条件则认为匹配成功,否则失败。该原理与之前的使用IOU匹配原理类似。

损失函数(v6.0及以后版本)
损失=边界框定位损失+目标分类损失+CIoU损失(置信度损失)
L o s s = λ 1 L l o c + λ 2 L c l s + λ 3 L c i o u Loss=\lambda_1L_{loc}+\lambda_2L_{cls}+\lambda_3L_{ciou} Loss=λ1Lloc+λ2Lcls+λ3Lciou
也即在这里插入图片描述
参数K为特征图数量, S 2 S^2 S2为grid cell数量, B B B为anchor数量。

其中为了平衡不同尺度的损失(在coco数据集上),对于三个预测特征层 { P 3 ( 小目标,如 76 ∗ 76 ) , P 4 ( 中等目标,如 38 ∗ 38 ) , P 5 ( 大目标,如 19 ∗ 19 ) } \{P_3(小目标,如76*76),P_4(中等目标,如38*38),P_5(大目标,如19*19)\} {P3(小目标,如7676),P4(中等目标,如3838),P5(大目标,如1919)}上的目标CIOU损失采用不同的权重: L o s s c i o u = 4 ∗ L c i o u s m a l l + L c i o u m e d i u m + 0.4 ∗ L c i o u l a r g e Loss_{ciou}=4*L_{ciou}^{small}+L_{ciou}^{medium}+0.4*L_{ciou}^{large} Lossciou=4Lciousmall+Lcioumedium+0.4Lcioularge
损失函数中, 为了提高对小目标的精准度,提高了小目标预测的损失。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/118188.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

人生黄金十年,你有考虑来社科院与杜兰大学金融管理硕士项目汲取能量吗

在人生长河中,你觉得黄金的十年是哪个阶段呢?在一篇文章中看到人生最宝贵的十年,就是30岁到40岁这十年,一切都未确定,一切都还有机会,这个年龄段,寸阴寸金,流金年华,应该…

FFmpeg学习笔记--视频传输的基本概念

目录 1--容器(container)和文件(file) 2--媒体流(stream) 3--数据帧(frame)和数据包(packet): 4--编解码器(Codec) 5…

7万人随访发现,每周高强度运动15分钟,死亡风险降低24%

*仅供医学专业人士阅读参考我们已经知道,无论是日常规律运动,还是周末集中一两天运动,只要每周能完成至少75-150分钟的高强度有氧运动,都可以降低全因死亡率和特定原因死亡率[1]。每周300-600分钟中强度运动或150-300分钟高强度运…

RocketMQ原理篇

文章目录broker与NameServerMessageQueue与Topic的关系生产者、消费者写入读取 消息CommitLog生产者消费者组broker与NameServer 基于 Dledger 实现 RocketMQ 高可用自动切换 broker 会每隔 30 秒向 NameServer 发送一个的心跳 ,NameServer 收到一个心跳 会更新对…

kafka再浅析

在日常开发中,经常使用kafka,对它是既熟悉又陌生,下面继续聊,继续总结。 1、消息中间件 分布式消息是一种通信机制,和RPC、HTTP不一样,消息中间件采用分布式中间代理的方式进行通信。采用消息中间件后&…

MarkDown语法(自用)

目录结构展示 tree -a 显示所有tree -d 只显示文档夹tree -L n 显示项目的层级,n表示层级数,比如想要显示项目三层结构,可以用tree -l 3;tree -I pattern 用于过滤不想要显示的文档或者文档夹。比如你想要过滤项目中的 node_modu…

Linux之(17)系统服务

Linux之(17)系统服务 Author:onceday Date:2022年12月24日 漫漫长路,有多少人对你笑过… 参考文档: Systemd 入门教程:命令篇 - 阮一峰的网络日志 (ruanyifeng.com)可能是史上最全面易懂的 Systemd 服务管理教程&a…

MergeTree原理之一级索引

一级索引 MergeTree的主键使用PRIMARY KEY定义,待主键定义之后,MergeTree会依据index_granularity间隔(默认8192行),为数据表生成一级索引并保存至primary.idx文件内,索引数据按照PRIMARY KEY排序。相比使…

【PotPlayer】采集Switch图像及录制

【PotPlayer】采集Switch图像及录制下载potplayer使用方法连接设备录制视频无边框设置阳,休,懂?QAQ。阳之前买了个Switch,正好有好玩的想录下来,然后就…自行某宝,某东去买个采集卡。本文只管连软件&#x…

【运维有小邓】ADSelfService Plus身份管理

一、身份管理挑战: 由于企业需要越来越高的安全性,以保护用户帐户免遭入侵者的任何恶意攻击,因此身份管理正日益变得重要。在所有密码相关的身份挑战中,帮助台工作单量成为重中之重,它们在组织的年同比财务预算中不堪…

(二)ElasticSearch使用

一、ES的基本使用 1.创建索引 创建一个test索引http://localhost:9200/test 2.删除索引 http://localhost:9200/test 3.查看索引 http://localhost:9200/_all 4.向索引中新增数据 http://localhost:9200/person/_doc/ 5.搜索数据 http://localhost:9200/person/_doc/_sear…

全志Tina Linux SPINAND UBI 离线烧录 开发指南 支持百问网T113 D1-H哪吒 DongshanPI-D1s V853-Pro等开发板

1 概述 编写目的: 介绍Sunxi SPINand 烧写时的数据布局 2 名词解释 词义UBIunsorted block imagePEBphysical erase blockLEBlogical erase block PEB 和logical block 关系 1 PEB 1 logical block 1 logical block 2 physical blocks3 总体数据布局 ubi 方案…

必读,一文普及MES系统知识

MES系统的基本概念制造执行系统(MES)是一套面向制造企业的信息管理系统。MES系统可以为企业提供管理模块,包括制造数据管理、计划与调度管理、生产调度管理、库存管理、质量管理、生产过程控制、底层数据集成分析、上层数据集成与分解&#x…

LVGL学习笔记5 - Display, Screen和Layer

目录 1. Display 2. Screen 2.1 创建Screen 2.2 加载Screen 2.3 获取活动的Screen 2.4 实例 2.4.1 定义2个Screen全局变量 2.4.2 初始化Screen 2.4.3 循环更替 3. Layer图层 3.1 切换顺序 3.2 顶层和系统层 3.3 实例 3.3.1 创建全局变量 3.3.2 初始化 3.3.3 …

【OpenFOAM】-olaFlow-算例5- oppositeSolitariesFlume

算例路径: olaFlow\tutorials\oppositeSolitariesFlume 算例描述: 两列反向的孤立波相互作用 学习目标: 熟练掌握olaFlow的造波设置,波浪方向与消波方向设置 算例快照: 图1 两列反向孤立波相互作用文件结构&#xff1…

Linux Kernel 远程代码执行漏洞(CVE-2022-47939)

Linux Kernel 远程代码执行漏洞(CVE-2022-47939) CVE-2022-47939 据Security Affairs消息,近期披露的一个严重 Linux 内核漏洞会影响 SMB 服务器,可能导致远程代码执行。 Linux Kernel SMB2_TREE_DISCONNECT 命令处理中存在远程…

C进阶:征服指针之指针与数组强化笔试题练习(2)

🐲🦖 本篇文章是接上篇文章的,上篇文章链接:http://t.csdn.cn/RogqL 目录 🐇🐱一.关于 strlen 函数与数组、指针的综合笔试题 😸T1. 🐆 T2. 🐅T3. 🐲一.关…

网络和通信安全中的SSL/TLS国密改造

2021年3月,国家市场监管总局、国家标准化管理委员会发布公告,国家密码应用与安全性评估的关键标准GB/T39786—2021《信息安全技术信息系统密码应用基本要求》(以下简称“GB/T39786”)正式发布,GB/T 39786是贯彻落实《中…

CSS浮动与CSS定位装饰 Day3

结构伪类选择器 结构伪类 公式 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>伪类</title><style>li:nth-child(4n){background-color: red;}</style> </head> <body>…

【记录贴】项目经理的进阶日常:靠年终总结获得了核心项目的机会

进入项目经理这个岗位已经三年了&#xff0c;之前决定转行做项目经理是因为它涉及的知识面广&#xff0c;对个人的成长非常有帮助&#xff1b;也期望未来能积累一些大型且复杂的项目经验、获得更好的升职空间。但现在做了这么久&#xff0c;好像遇到了职业瓶颈&#xff0c;仿佛…