CV——day70 零基础学YOLO:YOLOv1

news2025/1/15 16:55:25

YOLO系列

  • 1. 不同阶段算法优缺点分析
  • 2. IOU指标计算
  • 3. MAP指标计算
    • **指标分析**
    • 如何计算MAP
  • 4 YOLOv1
    • 4.1 YOLOv1核心思想
    • 4.2 YOLOv1网络架构
      • 那么,7 * 7 * 30的输出是怎么来呢?
  • 4.3 损失函数
      • 4.3.1 位置误差
      • 4.3.2 置信度误差(含object)
      • 4.3.3 置信度误差(不含object)
      • 4.3.4 分类误差
    • 4.4 总结

1. 不同阶段算法优缺点分析

检测任务分为两种类型:

  1. 单阶段检测算法:YOLO系列

    最核心的优势:速度非常快,适合做实时检测任务! 但是缺点也是有的,效果通常情况下不会太好!

  2. 二阶段检测算法:Faster-RCNN,MASK-RCNN
    速度通常较慢(5FPS),但是效果通常还是不错的!

2. IOU指标计算

image-20230127120544388

其实很简单的理解就是交并比,两个框分别是预测结果地面真值

3. MAP指标计算

image-20230127110548998

首先要认识基础的精确度和召回率的计算公式,这是一个例子:

image-20230127110632397

指标分析

基于置信度阈值来计算,例如分别计算0.9;0.8; 0.7

image-20230127110751521

0.9时: TP+FP = 1,TP = 1 ; FN = 2; Precision=1/1; Recall=1/3;

如何计算MAP

采用P–R图:需要把所有阈值都考虑进来;MAP就是所有类别的平均

image-20230127110912258

最理想的情况就是框柱整个坐标系以接近1,图中(左)蓝色实线代表P–R曲线(精确度&召回率),红色虚线代表所计算的区域,即选择时选择蓝色实线的最大值;图(右)展示了所画出的四个区域,计算面积就是MAP的值

4 YOLOv1

  • 经典的one-stage方法
    You Only Look Once,名字就已经说明了一切!
    把检测问题转化成回归问题(即(x,y,w,h)),一个CNN就搞定了!
    可以对视频进行实时检测,应用领域非常广!

image-20230128092952305

Faster R-CNN map较高,但fps远不能达到实时监测的要求

4.1 YOLOv1核心思想

将输入图像划分成两种候选框,计算并选择IOU最大的候选框 ,还有置信度来确定预测是否准确。最终想要得到的就是最右边的三个框。

image-20230128093107970

4.2 YOLOv1网络架构

image-20230128094211064

YOLOv1的卷积层在后代已经被优化了,所以不需要仔细看。

在上图中,值得关注的是两个全连接层,因为全连接层的存在,因此在最开始输入的图像大小还必须是固定的,7 * 7 * 4096 ;7 * 7 * 1470,这是两个全连接层的参数。

那么,7 * 7 * 30的输出是怎么来呢?

之前已经说过,v1会生成两个预测框B1,B2,那就已经有两个输出分别为

B1:(x1,y1,w1,h1,C1);B2:(x2,y3,w2,h2,C2),其中C代表置信度,这已经占了10个位置,剩下的二十个代表的其实是网络中可识别的类别共计20类。

每个数字的含义:

  1. 10 =(X,Y,H,W,C) * B (2个)
  2. 当前数据集中有20个类别
  3. 7 * 7表示最终网格的大小
  4. (S * S) * (B * 5+C)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VrBCqJiO-1674872650313)(C:\Users\hp\AppData\Roaming\Typora\typora-user-images\image-20230128100347551.png)]

4.3 损失函数

image-20230128100715881

4.3.1 位置误差

对于x,y,w,h要指定一个函数来最小化与真实值的误差

image-20230128101412121

前半部分是x,y;后半是w,h;加根号的意义是为了解决小物体中偏移量不敏感的问题,就如图所示:

image-20230128101531444

4.3.2 置信度误差(含object)

图像分前景和背景,预测框想要选择的是前景。

先算预测框与真实值的IOU,再与IOU最大的框进行预测(大于阈值)。

image-20230128102222563

4.3.3 置信度误差(不含object)

比上一节多加了一个参数λ,其目的是为了减弱占更多空间的背景的影响

4.3.4 分类误差

image-20230128102246548

4.4 总结

全部加在一起就是总的损失函数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/181572.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

股票量化分析工具QTYX使用攻略——小市值轮动选股策略(更新2.5.9)

搭建自己的量化交易系统 如果要长期在市场中立于不败之地!必须要形成一套自己的交易系统。 如何学会搭建自己的量化交易系统? 边学习边实战,在实战中学习才是最有效地方式。于是我们分享一个即可以用于学习,也可以用于实战炒股分析…

Springboot农产品特产销售网站maven mysql idea

摘 要 I 1 绪论 1 1.1研究背景 1 1.2研究现状 1 1.3研究内容 2 2 系统关键技术 3 2.1 JSP技术 3 2.2 JAVA简介 3 2.3 MYSQL数据库 4 2.4 B/S结构 4 3 系统分析 5 3.1 可行性分析 5 3.1.1 技术可行性 5 3.1.2经济可行性 5 3.1.3操作可…

[Android开发基础2] 七大常用界面控件(附综合案例)

文章目录 一、文本TextView 二、按钮Button 三、编辑输入框EditText 四、图片ImageView 五、单选按钮RadioButton 六、复选框CheckBox 七、系统消息框Toast 综合案例&#xff1a;账号注册界面 一、文本TextView TextView控件用于显示文本信息。 演示&#xff1a; <?…

kafka可视化web管理工具-KafkaMmap

kafka可视化web管理工具-KafkaMmap ​ 使用过kafka的小伙伴应该都知道kafka本身是没有管理界面的&#xff0c;所有操作都需要手动执行命令来完成。但有些命令又多又长&#xff0c;如果没有做笔记&#xff0c;别说是新手&#xff0c;就连老手也不一定能记得住&#xff0c;每次想…

blender绑定骨骼法 2 rig

image.pngimage.png生成一个body_temp add neck 脖子 add chin 下巴 image.pngadd shoulder肩膀 image.pngadd wrist手腕 add spline root .额那个位置 image.pngadd ankle脚踝 image.pngFACIAL setup是面部的骨骼绑定,这里没眼球啥的就不弄了直接 点go 就生成了骨骼. image.pn…

1、SPSS 25的安装

目录 一、简介 二、竞争优势 三、安装步骤 一、简介 SPSS 是一款用于Windows操作系统的数据和科学图形的数值分析软件&#xff0c;能够为用户提供多样的数据统计、处理、报告等功能&#xff0c;还能根据数据帮用户生成离散图、折线图等图形&#xff0c;以更加直观的方式向你…

【数据库增删查改基础版】本文将与大家一起去探索基础版本的数据库增删查改,图文讲解数据库增删查改

前言&#xff1a; 大家好&#xff0c;我是良辰丫&#xff0c;这篇文章我将带领大家进入基础版本增删查改数据库的学习&#xff0c;后面的文章会有数据库进阶版&#xff0c;更多的约束条件让你润享丝滑。增删查改是数据库操作中极其重要的内容&#xff0c;我们从简单入手&#x…

12.Java二维数组讲解

本篇文章重点需要掌握的内容如下: 后面附有Java二维数组的练习题 文章目录前言一、二维数组的应用场景二、二维数组的初始化1.静态初始化2.动态初始化三、二维数组的内存图1.特殊情况1的写法:特殊情况1的写法的好处:2.特殊情况2的写法四、二维数组的练习题总结前言 一、二维数…

三子棋游戏

前言 三子棋是一种民间传统游戏&#xff0c;又叫九宫棋、圈圈叉叉、一条龙、井字棋等。将正方形对角线连起来&#xff0c;相对两边依次摆上三个双方棋子&#xff0c;只要将自己的三个棋子走成一条线&#xff0c;对方就算输了。但是&#xff0c;有很多时候会出现和棋的情况。 文…

Hi3861鸿蒙物联网项目实战:倒车雷达

华清远见FS-Hi3861开发套件&#xff0c;支持HarmonyOS 3.0系统。开发板主控Hi3861芯片内置WiFi功能&#xff0c;开发板板载资源丰富&#xff0c;包括传感器、执行器、NFC、显示屏等&#xff0c;同时还配套丰富的拓展模块。开发板配套丰富的学习资料&#xff0c;包括全套开发教程…

Cadence PCB仿真 使用 Allegro PCB SI 敏感网络列表.lst文件的建立方法图文教程

🏡《Cadence 开发合集目录》   🏡《Cadence PCB 仿真宝典目录》 目录 1,概述2,基本方法3,建立技巧4,总结1,概述 敏感网络表(.lst文件)是一个在PCB设计阶段需要特别关注的网络列表。本文简单介绍其建立或导出方法。 2,基本方法 第1步:使用记事本新建1个文本文档…

vue2原理核心Object.defineProperty()的理解

Object.defineProperty(obj, prop, { configurable:false //默认false ,为true是可以属性修改,删除 enumerable:false //默认false ,为true是可以枚举对象 value:prop对应的值 // 初始为undefined writable:false //默认false ,为true是可以修改value的值 }) o…

python实现XML文件的内容变更

文章目录一、使用背景二、实现效果三、内置库的使用四、代码实现解析五、完整代码一、使用背景 我们在某些情况下需要对XML格式的文件进行内容处理&#xff0c;可以直接打开处理&#xff0c;但是对于一些需要自动化或者不方便手动处理的情况下我们的代码实现就比较关键啦&…

maxlength属性

<!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>maxlength属性</title> </head> <body> <form action"action_page.php"> <!--…

面试官问:生产环境遇到难题,你是如何解决的?

1、生产环境发生 cpu 飙高的问题&#xff1f;你是如何定位解决的呢&#xff1f; 我们的线程是运行在 cpu 上面 1. CAS 自旋一直重试导致 cpu 飙高 没有控制自旋次数&#xff1b;乐观锁 2. 死循环; 3. 阿里云 Redis 被注入挖矿程序,建议 Redis 端口不要能够被外网访问; 4. 服务…

Python 介绍和环境准备

文章目录一、概述二、Python 应用领域1&#xff09; Web应用开发2&#xff09;自动化运维3&#xff09;网路爬虫4&#xff09;人工智能领域5&#xff09;科学计算三、Python 环境准备1&#xff09;Linux 平台安装 Python2&#xff09;Window 平台安装 Python3&#xff09;安装 …

Windows WSL 启用 Systemd(使用 snap 安装应用)

背景 如今&#xff0c;WSL 已经能够支持 systemd。我们看一下怎么在 WSL 启用 systemd 来使用 snap。 准备工作 确保 WSL 版本在 0.67.6 及以上。可以通过如下命令查看。 wsl --version如果版本过低&#xff0c;可以下载最新版本的 WSL 并安装。 启用 Systemd 测试环境为…

SAP入门技术分享七:Field Symbol和数据引用

Field Symbol和数据引用1.概要2.定义Field Symbol&#xff08;1&#xff09;定义-Generic TYPE(泛型)&#xff08;2&#xff09;定义-Fully TYPE(全类型)3.分配Field Symbol&#xff08;1&#xff09;Assign语句的基本结构&#xff08;2&#xff09;将结构体字段分配到字段符号…

分布式链路追踪在数字化金融场景的最佳实践

作者 | 张冀 责编 | Carol 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 【CSDN 编者按】在以微服务和容器化为主导应用的现代化浪潮下&#xff0c;系统的可观测性变得越来越重要&#xff0c;而链路追踪技术就成为软件系统实现“无人驾驶”的关键手段。本文作者…

基于Java+SpringBoot+Vue前后端分离小区管理系统设计与实现

博主介绍&#xff1a;✌全网粉丝3W&#xff0c;全栈开发工程师&#xff0c;从事多年软件开发&#xff0c;在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战✌ 博主作品&#xff1a;《微服务实战》专栏是本人的实战经验总结&#xff0c;《Spring家族及…