YOLOV1——你总能在这找到你想要的答案

news2024/11/20 14:25:26

目录

一:前言   

        与传统的RCNN的区别在哪?

二:YOLO-V1中心思想 

三:计算损失

(1):位置损失

        为什么高宽要加上根号的损失?

 (2):置信度损失

(3):分类损失

四:总结


一:前言   

        YOLOv1(You Only Look Once v1)是一种经典的目标检测算法,由Joseph Redmon等人在2015年提出。相比于传统的目标检测方法,YOLOv1具有更快的速度和较好的实时性能。

        YOLOv1的核心思想是将目标检测问题转化为一个回归问题,并通过一个单一的卷积神经网络来同时预测目标的类别和边界框。具体而言,YOLOv1将输入图像分成一个固定大小的网格(通常是7x7或14x14),每个网格单元负责检测该单元中是否存在目标以及目标的位置和类别。


        与传统的RCNN的区别在哪?

        YOLO是一种单阶段(One-Stage)检测器,而RCNN是一种两阶段(Two-Stage)检测器。YOLO在一个网络中直接进行目标检测,同时预测目标的类别和边界框,无需额外的候选区域生成步骤。而RCNN首先生成候选区域,然后对每个候选区域进行分类和边界框回归。

        在每个网格中,YOLO会预测固定数量的边界框,每个边界框包含一个目标的边界框坐标(通常使用(x, y, w, h)表示,表示边界框的中心坐标和宽高)和目标的类别概率。预测的类别概率是多类别分类问题,使用softmax函数将输出映射到概率分布。

二:YOLO-V1中心思想 

        先通过iou筛选出两个(几个看你的图片)需要微调的候选框,但不是每个都需要微调,得看看有没有框住这个物体,也就是置信度confidence,大于阈值的再做微调!然后如果还有两个以上的,那就计算iou,拿出比较大的当作结果。

原理很简单,最后的7*7*30的话,其中30是5+5+20,两个五是那两个黄色框(锚框)表示的四个坐标和一个置信度,20表示这个物体在20种类里边的概率分别是多少!

 

B是锚框的个数,像上面的图片的B是2,S*S是7*7

三:计算损失

(1):位置损失

        这个箭头的意思,只计算我的iou值最大的那个。因为可能会有多个都微调到了边界框,而我只需要一个 。然后算真实值与预测值的差异平方损失

        为什么高宽要加上根号的损失?

        因为对于同样的偏移宽度,对于大物体来说,影响没那么大,但是对于小物体而且,影响就非常大了。看图就知道了    

改进加根号后就不一样了:

 

 (2):置信度损失

        C和C^是置信度和设定的iou做损失,目的是让这个iou尽量达到我预期设置的iou,如果iou是1,那么我的置信度肯定也很高。框住物体了。最大是1

 不含有物体的就希望他为0,λ是权重损失,因为背景不那么重要,很明显,前景的系数是1,而背景的系数是λ,那么想让背景的权重变低,就把λ设置为0.1设置更小

(3):分类损失

        一般就是,假设我现在框住的这个目标的真实值是狗,那么把这个20个概率里面的预测狗的概率与真实狗的概率做交叉熵损失就行了,这个简单,这里跟之前说的softmax的预测衣服是一样的。

 最后:把所有损失加起来即可

四:总结

        Yolov1的存在问题:小物体难以检测。多标签的物体不好预测。当物体黏在一起的时候,就不能预测出来另外一个,因为他的锚框只能检测一个类别,

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/633019.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一次虚拟机centos7系统崩溃恢复记录

前两天,因为单独断开电源测试网络,结果不知道为什么,两台虚拟机中一台就出现紧急状态,看日志是下面情况 通过网上一些资料,说可以通过xfs_repair -v -L /dev/dm-0来修复,但这次我这里没有相关 看这个mappe…

【Docker】docker部署前Springboot-vue后端分离项目【实战篇】

文章目录 1、docker 安装jdk2、docker 安装mysql通过Docker命令进入Mysql容器内部初始化数据sqlDbx连接查看 3、docker build构建后端镜像修改配置数据库JDBC链接IP为虚拟机服务器IPmaven clean package打包后端jar并上传到服务器编写Dockfilebuild 构建查看构建的后端镜像app …

AAOS系列之音量设置

文章目录 前言UI 处理流程音量键的响应流程AudioService设置音量流程AAOS音量条选项总结 前言 AAOS音量设置内容可以分为几个部分 音量的ui响应流程legacy模式dynamic模式通过按键进行设置 AAOS 音量设置比通用的Android系统复杂,表现在两个方面。首先是UI响应上…

chatgpt赋能python:如何取出带有4的整数

如何取出带有4的整数 Python是一门功能强大的编程语言,可以轻松解决复杂的编程问题。在本文中,我们将介绍如何使用Python编程语言从一个整数列表中取出所有带有4的整数。我们将从介绍如何创建一个整数列表开始,然后编写Python代码以实现我们…

Unreal 5 实现丢弃武器功能

之前实现了物品的拾取功能,但是没有实现丢弃功能,这一篇讲一下我是如何实现丢弃功能的。 丢弃功能的逻辑是:拾取物品时,需要使用拾取的物品进行类的实现,所以,我们需要把数据存储到拾取的物品上&#xff0c…

4.DIY可视化-拖拽设计1天搞定主流小程序-后台设计幻灯

后台设计幻灯:本教程均在第一节中项目启动下操作 1.首页幻灯片php安装:phpthink安装: 2.数据库创建:幻灯片表:项目根目录下cmd :执行 : php think diygw:tableandapi oneHdp查看结果目录:访问url: http://one.com/one/api.hdp/list 3.界面增删…

【6.10 代随_53day】 最长公共子序列、不相交的线、最大子数组和

最长公共子序列、不相交的线、最大子数组和 最长公共子序列动态规划方法图解步骤代码 不相交的线动态规划方法 最大子数组和图解步骤代码 最长公共子序列 力扣连接:1143. 最长公共子序列(中等) 动态规划方法 确定递推公式 主要就是两大情况…

《横向联邦学习中 PCA差分隐私数据发布算法》论文算法原理笔记

论文地址:https://www.arocmag.com/article/01-2022-01-041.html 论文摘要 为了让不同组织在保护本地敏感数据和降维后发布数据隐私的前提下,联合使用 PCA进行降维和数据发布,提出横向联邦 PCA差分隐私数据发布算法。引入随机种子联合协商方…

九、进程程序替换

文章目录 一、进程程序替换(一)概念(二)为什么程序替换(三)程序替换的原理(四)如何进行程序替换1. execl2. 引入进程创建——子进程执行程序替换,会不会影响父进程呢? &…

016、元组(行)结构与dml操作

元组结构与dml操作 元组(行)结构行头信息Pageinspect工具DML操作InsertionDeletionUpdate块空间清理元组(行)结构 t_xmin保存插入此元组的事务的txid。这一行被哪个事务ID所修改t_xmax保存删除或更新此元组的事务的txid。如果此元组未被删除或更新,则t_xmax设置为0,这意味…

数据结构——堆(C语言实现)

文章目录 什么是堆堆的实现堆的结构定义堆的初始化接口堆的销毁接口堆的插入数据接口向上调整建堆接口判断堆是否为空堆的删除数据接口向下调整建堆接口获取堆顶数据获取堆的有效数据个数完整实现代码小结 堆排序堆排序的实现 关于建堆和堆排序时间复杂度的分析向下调整建堆向上…

STL之string

目录 string的基本实现一. string的基本架构二. 常用方法及实现1.初始化和清理a. 构造函数b. 析构函数c. swapd. 拷贝构造e. operator 2.成员访问a. operator[]b. sizec. c_str 3.迭代器iteratora. beginb. end 4.增删查改a. reserveb. resizec. insertd. push_backe. appendf.…

【连续介质力学】连续体运动学

简介 一个质点从t0出发,随着时间有不同的构形,运动的描述是运动学。 所以需要建立运动方程来表征连续体是如何演化及其性质(例如位移、速度、加速度、质量密度、温度等)如何随时间变化 初始构形 或者 参考构形: B …

Java反射与注解

文章目录 一、 注解1.简介2. 元注解3. 自定义注解 二、 反射1. 简介2. 理解Class类并获取Class实例3. 类的加载与初始化4. 类加载器ClassLoader5. 获取运行时类的完整结构6. 动态创建对象执行方法7. 反射操作泛型8. 反射操作注解 一、 注解 1.简介 Annotation是JDK5.0开始引入…

day52|动态规划13-子序列问题

子序列系列问题 300.最长递增子序列 什么是递增子序列: 元素之间可以不连续,但是需要保证他们所在位置是元素在数组中的原始位置。 dp数组dp[i]表示以nums[i]为结尾的最长递增子序列的长度。递归函数:dp[i] max(dp[j]1,dp[j])初始化条件&…

Linux常用命令——gpm命令

在线Linux命令查询工具 gpm 提供文字模式下的滑鼠事件处理 补充说明 gpm命令是Linux的虚拟控制台下的鼠标服务器,用于在虚拟控制台下实现鼠标复制和粘贴文本的功能。 语法 gpm(选项)选项 -a:设置加速值; -b:设置波特率&…

chatgpt赋能python:Python中如何取出字符串中的数字并赋予新的变量

Python 中如何取出字符串中的数字并赋予新的变量 在 Python 中,我们经常需要处理字符串,其中可能包含多种类型的数据。当我们需要获取字符串中的数字时,该怎样做呢?本文将介绍取出字符串中的数字的方法,并赋予新的变量…

chatgpt赋能python:Python利器之数字提取

Python 利器之数字提取 Python 是一门强大的编程语言,被广泛应用在数据分析、人工智能等领域。在很多数据分析的场景下,需要从文本中提取数字,本文将介绍如何使用 Python 快速提取文本中的所有数字。 使用正则表达式提取数字 正则表达式&a…

YOLOv7 模型融合

将两种训练模型的检测结果融合 首先需要两种模型,一个是yolov7原有的模型,另一个是你训练出来的模型 其中yolov7.pt是官方提供的模型,有80个类别 其中yolov7_3.7HRW.pt是我们自己训练的模型,有三个分类,举手、看书、写…

WPF开发txt阅读器6:用树形图管理书籍

txt阅读器系列: 需求分析和文件读写目录提取类💎列表控件与目录字体控件绑定书籍管理系统 TreeView控件 TreeView可以通过可折叠的节点来显示层次结构中的信息,是表达文件系统从属关系的不二选择,其最终效果如下 为了构建这个树…