【YOLO系列】yolo V1 ,V3,V5,V8 解释

news2025/1/21 9:32:01

文章目录

  • yolo V1 模型结构图
    • 通道数 的 物理意义是什么?
    • 输出 7×7×30 怎么理解?
    • YOLO v1 损失函数LOSS
  • yolo V3
  • yolo V5
  • yolo V8

视频来源:https://www.bilibili.com/video/BV13K411t7Zs/


AI视频小助理
一、YOLO系列的目标检测算法,其中详细讲解了U6V1的网络结构,包括卷积层、池化层、通道数等基础知识。
00:01 - 介绍YOLO系列的目标检测算法
01:36 - 详细介绍yolo V1的网络结构,包括卷积层和池化层
05:17 - 解释通道数的意思和物理意义,以及卷积神经网络中的卷积核和通道数的关系
二、卷积神经网络的基本概念和结构,以及如何通过网络输出预测图像中的目标检测结果,详细解释了网络中各个参数的意义。
06:15 - 192个卷积核对应192个特征,对应原图表达。
07:18 - 特征图通道数为1024,经过4096全连接后转化为输出形状77×30。
08:22 - 输出结果为774×30的数字向量,每个数字代表原图小格子的预测结果。
三、目标检测模型的预测过程和输出结果,以及该模型的损失函数设计。其中,置信度和类别概率等概念被提及。
12:29 - 每个格子预测两个物体,但大量的预测是背景。
14:29 - 每个格子的置信度代表该位置是物体的概率
17:46 - YOLO的损失函数包含四个加号,其中第一个加号涉及到数学计算。
四、YOLO系列算法中的损失函数,包括中心坐标、宽高等预测结果的调整以及置信度的拟合,最后还介绍了YOLOv3的复杂结构和计算方法。
18:43 - 损失函数中加入中心坐标点,使其越来越准确
19:38 - 损失函数中加入宽高拟合,让预测结果与真实结果越接近越好
23:53 - YOLO v3模型有三个通路,经过卷积、批量归一化和激活函数处理
五、CBL、RESNET等深度学习中的小零件,以及这些零件如何拼接成复杂的结构,从而提取不同尺寸的信息,提高预测效果。
24:56 - CBL、卷积、批量规划、激活函数等深度学习小零件的拼接搭建整个网络结构。
26:40 - 不同尺寸信息提取可以提高预测效果,V3、V5、V8结构设计相似,但V8使用了更新数据进行训练。
28:56 - yolo V5和V8的网络结构复杂,越靠近输入层获取到的特征越细节,越靠上的特征越宏观
–本内容由AI视频小助理生成,关注解锁AI助理,由@Triticale21 召唤发送


yolo V1 模型结构图

在这里插入图片描述

通道数 的 物理意义是什么?

每一个通道 都是 由 1个卷积核 经过卷积运算 获得的输出结果
192个通道 对应 192个卷积核,这192个卷积核在训练过程中彼此独立,参数都是各自更新的,所以这192个卷积核 可以看作是 192个小特征!

输出 7×7×30 怎么理解?

只要物体的中心点落在这个格子内,就交给这个格子 来 预测!

每个格子要 预测两个物体,所以有两份 xywhc,xywhc,c 是置信度,20是类别概率

在这里插入图片描述

YOLO v1 损失函数LOSS

理解 意义
在这里插入图片描述

yolo V3

理解:提取 不同 尺寸 信息,让yolo 适用于 大尺寸的物体 和 小尺寸的 物体

越靠近输入,特征越细节;
越靠近输出,特征越宏观,越具体(高层语义)

在这里插入图片描述

yolo V5

模型 更复杂了,但还是3个分支
在这里插入图片描述

yolo V8

这个输出 是 3分支 检测吗?【有点像 自己任务想的输出了?】
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1347770.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《兼顾捕碳强度与可再生能源消纳的储能容量配置优化方法》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主的专栏栏目《论文与完整程序》 这个标题涉及到两个主要方面:捕碳强度和可再生能源的消纳,以及与之相关的储能容量配置的优化方法。下面我会逐一解读这两个方面&…

ES6之生成器(Generator)

✨ 专栏介绍 在现代Web开发中,JavaScript已经成为了不可或缺的一部分。它不仅可以为网页增加交互性和动态性,还可以在后端开发中使用Node.js构建高效的服务器端应用程序。作为一种灵活且易学的脚本语言,JavaScript具有广泛的应用场景&#x…

OpenCV-11颜色通道的分离与合并

本次我们使用两个比较重要的API split(mat)将图像的通道进行分割。 merge((ch1,ch2,ch3))将多个通道进行融合。 示例代码如下: import cv2 import numpy as npimg np.zeros((480, 640, 3),…

HTML使用JavaScript的三种方式

要使用 JavaScript&#xff0c;你可以在 HTML 文件中的 <script> 标签中编写代码&#xff0c;或者将代码保存到一个单独的 .js 文件中并在 HTML 文件中引入。以下是一些常用的 JavaScript 使用方式&#xff1a; 内联 JavaScript&#xff1a;在 HTML 文件的 <script&g…

CodeWave赋能创新的全功能技术平台

目录 前言1 应用中心2 资产中心&#xff1a;汇聚创新能量&#xff0c;提供开发加速3 集成中心3.1 API管理3.2 报表管理 4 运维中心4.1 资源监控4.2 用户管理4.3 权限管理4.4 日志与监控 5 配置中心5.1 源码配置5.2 镜像仓库配置5.3 数据库配置5.4 报表配置5.5 资产配置5.6 品牌…

【小沐学NLP】Python实现K-Means聚类算法(nltk、sklearn)

文章目录 1、简介1.1 机器学习1.2 K 均值聚类1.2.1 聚类定义1.2.2 K-Means定义1.2.3 K-Means优缺点1.2.4 K-Means算法步骤 2、测试2.1 K-Means&#xff08;Python&#xff09;2.2 K-Means&#xff08;Sklearn&#xff09;2.2.1 例子1&#xff1a;数组分类2.2.2 例子2&#xff1…

有道翻译web端 爬虫, js

以下内容写于2023-12-28, 原链接为:https://fanyi.youdao.com/index.html#/ 1 在输入框内输入hello world进行翻译,通过检查发出的网络请求可以看到翻译文字的http接口应该是: 2 复制下链接最后的路径,去js文件中搜索下: 可以看到这里是定义了一个函数B来做文字的翻译接口函数…

IDEA JAVA Spring Boot运行Hello World(1.8)

参考资料&#xff1a; Spring Boot运行Hello World - 知乎https://blog.csdn.net/weixin_44005516/article/details/108293228(解决bug)SpringBoot入门第一章&#xff1a;Hello World-java教程-PHP中文网 (仅参考如何运行程序)java 8安装教程 java 8安装教程_java8安装-CSDN博…

开发Chrome插件获取当前页面Cookie

前言 看《重来》的时候有提到&#xff0c;把自己的需求做成产品&#xff0c;给更多人提供价值。 就是本篇的文章的由来。 我的需求场景&#xff0c;因为要用postman测公司开发的接口&#xff0c;公司接口通过cookie做鉴权&#xff0c; 所以我每次都要f12&#xff0c;然后从Ne…

Python筛选出批量下载的多时相遥感影像文件中缺失的日期

本文介绍批量下载大量多时相的遥感影像文件后&#xff0c;基于Python语言与每一景遥感影像文件的文件名&#xff0c;对这些已下载的影像文件加以缺失情况的核对&#xff0c;并自动统计、列出未下载影像所对应的时相的方法。 批量下载大量遥感影像文件对于RS学生与从业人员可谓十…

阿里后端实习一面面经

阿里后端实习一面面经 项目中使用到了es&#xff0c;es的作用&#xff1f; elasticsearch是一款非常强大的开源搜索引擎&#xff0c;具备非常多强大功能&#xff0c;可以帮助我们从海量数据中快速找到需要的内容 es中的重要概念&#xff1f; 群集&#xff1a;一个或多个节点…

JavaScript元素根据父级元素宽高缩放

/*** 等比缩放* param wrap 外部容器* param container 待缩放的容器* returns {{width: number, height: number}}* 返回值&#xff1a;width:宽度, height:高度*/aspectRatio(wrap: any, container: any) {// w h / ratio, h w * ratioconst wrapW wrap.width;const wrapH…

PyTorch中常用的工具(3)TensorBoard

文章目录 前言3 可视化工具3.1 TensorBoard 前言 在训练神经网络的过程中需要用到很多的工具&#xff0c;最重要的是数据处理、可视化和GPU加速。本章主要介绍PyTorch在这些方面常用的工具模块&#xff0c;合理使用这些工具可以极大地提高编程效率。 由于内容较多&#xff0c…

Unity坦克大战开发全流程——游戏场景——游戏界面——设置界面复用

游戏场景——游戏界面——设置界面复用 先将开始场景当中的设置面板复制过来 由于设置面板挂载的脚本都是相同的&#xff0c;在BeginScene中关闭设置面板时不会报空&#xff0c;而在GameScene中关闭设置面板时却会报空&#xff0c;这是因为监听事件中的单例模式调用的实例是Beg…

【时钟】分布式时钟HLC|Logical Time|Vector Clock|True Time

目录 简略 详细 附录 1 分布式系统不能使用NTP的原因 简略 分布式系统中不同于单机系统不能使用NTP(网络时间协议&#xff08;Network Time Protocol&#xff09;)来获取时间&#xff0c;所以我们需要一个特别的方式来获取分布式系统中的时间&#xff0c;mvcc也是使用time保证读…

Debezium发布历史40

原文地址&#xff1a; https://debezium.io/blog/2018/09/20/materializing-aggregate-views-with-hibernate-and-debezium/ 欢迎关注留言&#xff0c;我是收集整理小能手&#xff0c;工具翻译&#xff0c;仅供参考&#xff0c;笔芯笔芯. 使用 Hibernate 和 Debezium 实现聚合…

Linux安装Oracle调用dbca无响应和密码问题

Linux服务器下调用dbca无响应&#xff0c;或弹出如下提示&#xff1a; 则需要在Linux命令行窗口&#xff0c;输入如下命令即可 export DISPLAYip:0.0 注意&#xff1a;该ip应该为可显示图形桌面的机器ip地址。 该桌面需要已经安装了Xmanager-Passive&#xff08;比如 Xmanag…

Langchain-Chatchat开源库使用的随笔记(一)

笔者最近在研究Langchain-Chatchat&#xff0c;所以本篇作为随笔记进行记录。 最近核心探索的是知识库的使用&#xff0c;其中关于文档如何进行分块的详细&#xff0c;可以参考笔者的另几篇文章&#xff1a; 大模型RAG 场景、数据、应用难点与解决&#xff08;四&#xff09;R…

2024 Win 安装Oracle12C

文章目录 一、下载1.1 官方下载1.2 官方Archive下载1.3 博主提供 二、安装2.1 解压2.2 安装 三、连接3.1 SQL Plus3.2 切换到容器数据库orclpdb3.3 查询SID 四、查看数据4.1 SQL Develop 连接4.2 创建新用户4.3 develop 直接创建新用户4.3.2 SQL 错误: ORA-65096: 公用用户名或…

Django 学习教程- Django 入门案例

Django学习教程系列 Django学习教程-介绍与安装 前言 本教程是为 Django 5.0 编写的&#xff0c;它支持 Python 3.10 至以上。如果 Django 版本不匹配&#xff0c;可以参考教程 使用右下角的版本切换器来获取你的 Django 版本 &#xff0c;或将 Django 更新到最新版本。如果…