yolov1模型

news2025/7/12 16:44:12

目录

一、机器视觉算法

二、yolov1 预测阶段（向前推断）

三、预测阶段的后处理

（声明：本文章是在学习他人视频的学习笔记，图片出处均来自该up主，侵权删视频链接：为什么要学YOLOV1_哔哩哔哩_bilibili）

一、机器视觉算法

yolo是解决目标检测问题的计算机视觉算法

计算机视觉能够解决很多问题如图像分类目标检测图像分割

分类：输入图像，输出图像中不同类别图像的类别

检测：将不同类别的图像框选出来并检测其类别

分割：将不同类别的图像通过抠图的形式区分开来

分割也分为两种：1、语义分割（Semantic Segmentation） 2、实例分割（Instance Segmentation）

除了以上这些计算机视觉还可以进行关键点检测例如将人体的骨架的关键点识别出来或将人脸部的关键点识别出来（眼睛、鼻子、嘴巴...）

而目标检测是计算机视觉里一个非常重要的部分 yolo算法就是解决这个问题的

二、yolov1 预测阶段（向前推断）

输入的是448×448分辨率的彩色图片，通过一系列的卷积层最后得到了一个30维的7×7的矩阵

为什么最后输出的是7x7x30呢

在模型已经训练好的情况下输入一个图像 yolo会将图像划分成7×7的网格（grid cell）

每一个grid cell还会分成两个bounding box

每个bounding box会生成一些信息，如中心点的x、y矩形框的h、w还有这个框的自信度，而grid cell也会生成一些信息，即假设该grid cell是不同物体的概率，是鸟的概率P（bird|Object）、是车的概率P(car|Object)等20个，自信度与不同的概率相乘，最高的那个就是yolo所推测出的物体类别。

好了，知道这些我们就可以进一步知道为什么预测阶段最后输出的是7x7x30，

7×7对应的是7×7个grid cell，而30对应的是一个grid cell中两个bounding box对应的x、y、w、h、c

各5个，加起来一共10个 grid cell的类别概率（class probability）有20个类别概率，这样就构成了7×7×30的tensor

三、预测阶段的后处理

NMS非极大值抑制

将第一个bounding box的确信值与20个类别条件概率相乘，就可以得到第一个bounding box类别全概率

将第二个bounding box的确信值与20个类别条件概率相乘，就可以得到第二个bounding box类别全概率

49个grid cell有98个bounding box，就有98个 bounding box类别全概率

将98个全概率框选出来如下图，不同的颜色代表不同的种类，线条越粗代表概率越大

再经过处理后就变成了这个样子

处理的具体过程，先将低于0.2的概率全部置为零，再将概率从高到低排列，最后再进行NMS处理就得到了最后的结果

那么NMS的实际又是怎么操作的呢

如图，首先将概率最高的（橙框）与所有比它低的依次进行IOU运算，若IOU的值大于设定的阈值，则将该概率置为0

比较完概率最高的后，再从概率第二高（蓝框）的与所有比它小的比较，若IOU大于阈值则小概率的（紫框）置为0，依次类推

最后将概率不为0的类别和它的概率读出，并框在图像上

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/23384.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

拿铁DHT-PHEV座舱智能程度体验笔记（超详细）

拿铁DHT-PHEV座舱智能程度体验笔记（超详细）

评测时间： •第一次 2022年10月1日-10月7日 •第二次 2022年10月25日评测配置： •两驱超大杯 18.98万元好评功能盘点座舱芯片及内存：高通骁龙 8155，算力8TOPS，存储8GB，内存12G，一流的配置。四…

阅读更多...

领悟《信号与系统》之连续时间信号的时域分析法

领悟《信号与系统》之连续时间信号的时域分析法

连续时间信号的时域分析法一、LTI 连续系统的响应1. LTI 微分方程的建立与求解2. LTI 连续系统的零输入响应与零状态响应1. 零输入响应2. 零状态响应3. 全响应二、冲激响应和阶跃响应1. 冲激响应2. 阶跃响应三、卷积积分及其性质1. 任意信号的分解2. 任意信号作用下的零状态响应…

阅读更多...

一个合格的中级前端工程师需要掌握的 28 个 JavaScript 技巧

一个合格的中级前端工程师需要掌握的 28 个 JavaScript 技巧

1. 判断对象的数据类型使用 Object.prototype.toString 配合闭包，通过传入不同的判断类型来返回不同的判断函数，一行代码，简洁优雅灵活（注意传入 type 参数时首字母大写） 不推荐将这个函数用来检测可能会产生包装类型…

阅读更多...

【跨境电商】6种实用有效的策略帮助改善客户沟通

【跨境电商】6种实用有效的策略帮助改善客户沟通

关键词：跨境电商卖家、客户沟通 1.什么是客户沟通？ 客户沟通是公司与消费者的互动。品牌识别接触点并通过各种渠道（例如电话、电子邮件和实时聊天）在每个接触点建立关系。公司可以通过始终如一的参与并将消费者置于这种互动的中心…

阅读更多...

【Redis】内存回收：内存淘汰策略

【Redis】内存回收：内存淘汰策略

【Redis】内存回收：内存淘汰策略文章目录【Redis】内存回收：内存淘汰策略一、Redis内存回收-过期key处理二、Redis内存回收-内存淘汰策略一、Redis内存回收-过期key处理如果你发现，平时在操作 Redis 时，并没有延迟很大的情况发生…

阅读更多...

Watermelon Book(二）线性模型

Watermelon Book(二）线性模型

文章目录线性回归对数几率回归线性类别分类多分类学习类别不平衡问题基本形式：若给定 d个属性描述的示例x(x1,x2,x3…xd)，则线性模型试图学得一个通过属性的线性组合来进行预测。f(x)W1*X1W2*X2...Wn*Xnw(T)xbw(w1;w2;w3;wn;)线性模型形式简单、易于建模…

阅读更多...

[附源码]java毕业设计校园共享单车系统

[附源码]java毕业设计校园共享单车系统

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： SSM mybatis Maven Vue 等等组成，B/S模式 M…

阅读更多...

排序算法——七种排序算法汇总，详细

排序算法——七种排序算法汇总，详细

文章目录排序排序的概念及应用一、直接插入排序1. 简介2.动图展示3.过程4.代码5.总结二、希尔排序1.简介2.过程3.代码4.总结三、选择排序1.简介2.代码3.总结四、堆排序1.代码2.总结五、冒泡排序1.过程2.代码3.总结六、快速排序1.简介2.过程3.两种优化快速排序的思想4.代码-递归…

阅读更多...

【附源码】计算机毕业设计JAVA学生校内兼职管理平台

【附源码】计算机毕业设计JAVA学生校内兼职管理平台

【附源码】计算机毕业设计JAVA学生校内兼职管理平台目运行环境项配置： Jdk1.8 Tomcat8.5 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： JAVA…

阅读更多...

什么是 SSH 密钥？生成、身份验证、密钥对信息等

什么是 SSH 密钥？生成、身份验证、密钥对信息等

SSH 密钥不仅可以提高安全性，还可以实现当今企业所需的大规模连接流程、单点登录 (SSO) 以及身份和访问管理的自动化。什么是 SSH 密钥？ SSH 密钥是安全外壳 (SSH) 协议中使用的安全访问凭证。 SSH 密钥使用基于公钥基础设施 (PKI) 技术（数…

阅读更多...

Android12窗口模糊（二）高斯模糊API源码解析

Android12窗口模糊（二）高斯模糊API源码解析

前言在 Android 12 中，提供了一些用于实现窗口模糊处理效果（例如背景模糊处理和模糊处理后方屏幕）的公共 API。窗口模糊处理或跨窗口模糊处理用于模糊处理给定窗口后方的屏幕。有两种窗口模糊处理方式，可用于实现不同的视觉效果…

阅读更多...

不小心清空了回收站怎么恢复，回收站删除的东西可以恢复吗

不小心清空了回收站怎么恢复，回收站删除的东西可以恢复吗

不小心清空了回收站怎么恢复？回收站是操作系统提供的一个非常实用的功能，专门为用户保存从电脑硬盘删除的各种数据，因而很多时候我们都会用到回收站，它能够保存各种数据，我们也能够在里面恢复自己想要的数据&#xff0…

阅读更多...

Flutter组件--AppBar相关属性

Flutter组件--AppBar相关属性

AppBar介绍 AppBar是基于Material Design设计风格的应用栏，一般使用在Scaffold内部，作为顶部导航栏。为什么需要AppBar 1、因为导航栏里面一般由左侧功能键（返回键、菜单键）、标题、右侧功能键组成，而AppBar里面内置…

阅读更多...

django的使用步骤详细

django的使用步骤详细

一、安装django pip install django 二、创建django项目放django文件的的文件路径上输入cmd进入终端输入下面的命令 django-admin startproject 项目名称三、app的创建进入创建好的项目里面输入一下的命令 python manage.py startapp app名称四、注册app 五、编写U…

阅读更多...

计算机视觉：基于Numpy的图像处理技术（二）：图像主成分分析（PCA）

计算机视觉：基于Numpy的图像处理技术（二）：图像主成分分析（PCA）

计算机视觉：基于Numpy的图像处理技术（二）：图像主成分分析🏳️‍🌈 文章目录计算机视觉：基于Numpy的图像处理技术（二）：图像主成分分析:rainbow_flag:图像主成分…

阅读更多...

企业数据泄漏事件频发，如何防止企业数据泄漏？

企业数据泄漏事件频发，如何防止企业数据泄漏？

2022年即将接近尾声，这一年受疫情和国际经济形势影响，各行各业都不太好过，同样互联网领域发展不平衡、规则不健全、秩序不合理等问题日益凸显，虽然互联网的快速发展为企业数字化转型提供了支撑，但是互联网发展进程中“…

阅读更多...

Android App开发动画特效之利用滚动器实现平滑翻页（附源码和演示简单易懂）

Android App开发动画特效之利用滚动器实现平滑翻页（附源码和演示简单易懂）

需要图片集请点赞关注收藏后评论区留言~~~ 一、利用滚动器实现平滑翻页在日常生活中，平移动画比较常见，有时也被称为位移动画，左右翻页和上下滚动其实都用到了平移动画，譬如平滑翻书的动画效果，就是位移动画的一种应…

阅读更多...

BHQ-3 amine，1661064-89-6可在430nm至730nm范围内猝灭所有普通荧光团

BHQ-3 amine，1661064-89-6可在430nm至730nm范围内猝灭所有普通荧光团

英文名称：BHQ-3 amine CAS：1661064-89-6 外观：深紫色粉末分子式：C32H36N7 分子量：518.69 储存条件：-20C，避光避湿结构式： 凯新生物产品简介：干燥的寡核苷酸在环境…

阅读更多...

如今传统企业如何做数字化转型？

如今传统企业如何做数字化转型？

如今传统企业如何做数字化转型？ 传统企业的数字化转型，也分为大型企业和中小企业，二者的侧重是十分不同的！ 大型传统企业数字化转型的侧重点是—— 如何利用新一代信息技术，整合其现有技术和资源优势，在相…

阅读更多...

MyBatis的缓存

MyBatis的缓存

目录 1.一级缓存情况一 : 不同的SqlSession对应不同的一级缓存情况二 : 同一个SqlSession但是查询条件不同情况三 : 同一个SqlSession两次查询期间执行了任何一次增删改操作情况四 : 同一个SqlSession两次查询期间手动清空了缓存 2.二级缓存 2.1二级缓存的相关配置 3.MyBa…

阅读更多...

推荐文章

最新文章