YOLOv8 : 网络结构

news2024/12/23 14:23:35

一. YOLOv8网络结构

1. Backbone

YOLOv8的Backbone同样参考了CSPDarkNet-53网络,我们可以称之为CSPDarkNet结构吧,与YOLOv5不同的是,YOLOv8使用C2f(CSPLayer_2Conv)代替了C3模块(如果你比较熟悉YOLOv5的网络结构,那YOLOv8的网络结构理解起来就easy了)。

如图1所示为YOLOv8网络结构图(引用自MMYOLO),对比图2的YOLOv5结构图,可以看到基本的架构是类似的。

这里值得注意的是,很多博文中写到YOLOv8使用了CSPDarkNet53作为backbone,当然是可以用的,但是官方代码中明显不是套用的CSPDarkNet53网络结构。事实上,YOLOv5的主干也并非是CSPDarkNet53网络。

图1 YOLOv8网络架构

图2 YOLOv5网络架构

2. Neck

YOLOv8的Neck使用的也是类似于YOLOv5的PAN-FPN,称作双流FPN,高效,速度快。

3. Head

与之前的YOLOv6,YOLOX类似,使用了Decoupled Head,YOLOv3、YOLOv4、YOLOv5均使用Coupled Head。

YOLOv8也使用3个输出分支,但是每一个输出分支又分为2部分,分别来分类和回归边框(参照图1的Decoupled Head)。

二. 细说Backbone

前面讲到,YOLOv8的Backbone类似于YOLOv5的Backbone,不同点是将C3换成了C2F,以及将第一个Convolution层设置为kernel size等于3,stride为2(YOLOv5的Kernel Size为6,padding为2)。

1. C2F与C3对比

那么C2F与C3单元相比,有什么优势呢?我们先上各自的网络结构图。如图3为C3结构图,图4为C2F结构图。

图4中,每一个Bottleneck的输入Tensor的Channel都只有上一级的0.5倍,因此计算量明显降低。从另一方面讲,梯度流的增加,也能够明显提升收敛速度和收敛效果。

图3 C3单元

图4 C2F单元

2. Bottleneck

YOLOv8的C2F使用了Bottleneck单元,但需要注意的是,Darknet所引入的Bottleneck不同于ResNet的Bottleneck。如图5和图6分别为Darknet的Bottleneck和ResNet的Bottelneck。

由图5和图6可以看出,Darknet的Bottleneck单元并未使用最后的1*1卷积进行通道的恢复,而是直接在中间的3*3卷积中进行了恢复。

此处大家进记住一点即可,Bottleneck可以大大减少参数,降低计算量。

图5 Darknet Bottleneck

图6 ResNet Bottleneck

三. Neck

YOLOv8的Neck采用了PANet结构。如图7为网络局部图。

由图7可以看出,Backbone最后经过了一个SPPF(SPP Fast,图示Layer9),之后H和W已经经过了32被的下采样。对应的,Layer4经过了8被下采样,Layer6经过了16背的下采样。设定输入为640*640,得到Layer4、Layer6、Layer9的分辨率分别为80*80、40*40和20*20。

Layer4、Layer6、Layer9作为PANnet结构的输入,经过上采样,通道融合,最终将PANet的三个输出分支送入到Detect head中进行Loss的计算或结果解算。

与FPN(单向,自上而下)不同,PANet是一个双向通路网络。与FPN相比,PANet引入了自下向上的路径,使得底层信息更容易传递到高层顶部(红色曲线标注路线)。

图7 YOLOv8 Neck(PANet)

四. Detect Head

YOLOv8采用了类似于YOLOX的Decoupled Head,将回归分支和预测分支进行分离。Decoupled Head的有点可以参考YOLOX的论文中提到的,收敛更快,效果更好。

需要特别提及的是,YOLOv8的Detect Head中,针对回归分支使用了DFL策略,之前的目标检测网络将回归坐标作为一个确定性单值进行预测,DFL将坐标转变成了一个分布。

DFL理论主要用来解决边界模糊的问题。详细了解可以参考论文“Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/880758.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

非线性 简介

让我们分析一下现实世界物体的运动规律 摇摇头,感受一下你的头是怎样运动的 我们的头侧向一方,准备往另一边转动时,先加速,等快要到达目标时,马上减速。 这是摇头时头的运动曲线 加速的时间很短,所以看起来…

【eNSP】OSPF实验

【eNSP】OSPF实验 原理术语Router-idOSPF区域DR与DDR 过程 实验根据图片连接模块配置设备名称和IP地址修改R1:修改R2:修改R3修改R4修改R5测试连通性 OSPF设置设置进程号和RID划分OSPF区域DR设置,2way实验设置查看设置结果 口令验证 原理 OSP…

控制威格士伺服阀放大器SM4-15、SX4-10、SX4-12

威格士的SM4-10、SM4-12、SM4-15、SX4-10、SX4-12、SX4-15、SM4-20、SX4-20、SM4-30、SM4-40系列伺服阀搭配模块式伺服放大器提供系统闭环控制,具有位置精度高、速度曲线可重复以及可预测的力或力矩的调节等优点。 伺服阀的典型应用包括注塑/吹塑成形系…

低代码开发工具:JVS轻应用之间如何实现数据的调用?

在低代码开发平台中,如何实现应用之间的数据共享呢?最标准的方式是通过接口,本文介绍JVS轻应用如何实现将数据通过API输出、轻应用如何实现体内API数据的获取?实现方式如下图所示,不管是数据提供方,还是数据…

ebay灯串UL报告 UL588检测标准

季节性和装饰性照明用品即灯串以及配件都是便携式插头连接的临时性商品,最大额定输入电压为 120 伏。 由 ILAC ISO 17025 认证的实验室出具的检测报告,确认每件商品均已经过检测,符合下列要求: 季节性和装饰性照明用品(灯串&…

idea下载安装教程

idea下载安装教程 文章目录 idea下载安装教程1、下载2、安装 1、下载 进入官网: https://www.jetbrains.com/ 下滑: 点击Download 这个就是专业版了,需要付费,学生认证就是用的这个专业版的 但是2023的版本对于页面做了很大的改…

物联网工程应用实训室建设方案

一、物联网工程应用系统概述 1.1物联网工程定义 物联网工程(Internet of Things Engineering)是一种以信息技术(IT)来改善实体世界中人们生活方式的新兴学科,它利用互联网技术为我们的日常生活活动提供服务和增益&am…

东方晶源亮相第十一届半导体设备年会,共话发展“芯”机遇

8月11日,以“协力同芯抢机遇,集成创新造设备”为主题的第十一届(2023年)中国电子专用设备工业协会半导体设备年会暨产业链合作论坛(CSEAC)在无锡太湖国际博览中心圆满闭幕。为期3天的CSEAC,通过…

SpringBoot知识点总结

概述 SpringBoot的主要目的在于简化Spring应用程序的开发&#xff0c;提供了一个引导类SpringBootApplication.run(配置类名.calss)作为程序的启动入口。 注意&#xff1a; <dependencyManagement>中定义的jar包并不是直接加载到工程中 restful风格 RestController:配…

涉及近300个业务场景,重庆银行数字员工平台建设解析

随着数字化转型战略规划的逐步落地&#xff0c;重庆银行于2022年6月成功建设了数字员工平台&#xff0c;该平台已成为行内数字化转型的标杆应用。数字员工平台以RPA&#xff08;机器人流程自动化&#xff09;为基础&#xff0c;AI&#xff08;人工智能&#xff09;技术为抓手&a…

码银送书第五期《互联网广告系统:架构、算法与智能化》

广告平台的建设和完善是一项长期工程。例如&#xff0c;谷歌早于2003年通过收购Applied Semantics开展Google AdSense 项目&#xff0c;而直到20年后的今天&#xff0c;谷歌展示广告平台仍在持续创新和提升。广告平台是负有营收责任的复杂在线平台&#xff0c;对其进行任何改动…

【动态规划】回文串问题

文章目录 动态规划&#xff08;回文串问题&#xff09;1. 回文子串2. 最长回文子串3. 回文串分割 IV4. 分割回文串 ||5. 最长回文子序列6. 让字符串成为回文串的最小插入次数 动态规划&#xff08;回文串问题&#xff09; 1. 回文子串 题目链接 状态表示 f[i][j]表示 i 到 j …

W5500-EVB-PICO 做UDP Server进行数据回环测试(七)

前言 前面我们用W5500-EVB-PICO 开发板在TCP Client和TCP Server模式下&#xff0c;分别进行数据回环测试&#xff0c;本章我们将用开发板在UDP Server模式下进行数据回环测试。 UDP是什么&#xff1f;什么是UDP Server&#xff1f;能干什么&#xff1f; UDP (User Dataqram P…

小程序的排名规则是什么?

如何提高小程序微信搜一搜排名呢&#xff1f;AdSet带大家了解&#xff0c;影响小程序搜索排名的五个关键要素&#xff1a; 关键因素一&#xff1a;最近使用过 在小程序的排序规则里&#xff0c;有一条是最霸道的&#xff0c;也是第1优先级——使用过。只要用户使用过这个小程…

C++ STL priority_queue

目录 一.认识priority_queue 二. priority_queue的使用 三.仿函数 1.什么是仿函数 2.控制大小堆 3.TopK问题 四.模拟实现priority_queue 1.priority_queue的主要接口框架 2.堆的向上调整算法 3.堆的向下调整算法 4.仿函数控制大小堆 五.priority_queue模拟实现整体代码和测…

领航未来!探索开源无人机与5G组网的前沿技术

近年来无人机行业高速发展&#xff0c;无人机被广泛应用于航拍、农业、电力、消防、科研等领域。随着无人机市场不断增长&#xff0c;其对实时超高清图传、远程低时延控制、海量数据处理等需求也在不断扩张&#xff0c;这无疑给通信链路带来了巨大的挑战。 为应对未来的需求变…

仿东郊到家【8月份稳定版】同城到家/家政上门/美容/理疗/足疗/推拿/私教/瑜伽/健身

1、物料商城&#xff08;商品分类、商品管理&#xff09; 2、地图导览&#xff08;平台总销售额、人员统计、营收数据、当前开放城市&#xff09; 3、后台新增&#xff1a;技师统计&#xff08;技师概况、技师数据统计、区域分布、技师数据等&#xff0c;可视化数据一目了然&am…

iTOP-i.MX8M开发板添加USB网络设备驱动

选中支持 USB 网络设备驱动&#xff0c;如下图所示&#xff1a; [*] Device Drivers→ *- Network device support → USB Network Adapters→ {*} Multi-purpose USB Networking Framework 将光标移动到 save 保存&#xff0c;如下图所示&#xff1a; 保存到 arch/arm64/c…

TIA博途WINCC_如何在IO域中保证输入数值只能为正数?

TIA博途WINCC_如何在IO域中保证输入数值只能为正数? 在某些情况下,输入的数值受到限制,本例就以输入的数值必须为正整数为例进行说明。 如下图所示,在PLC的全局DB块中添加一个测试变量,数据类型为Int(该数据类型的范围为-32768~+32767), 如下图所示,将该测试变量拖拽到…

克服多语言语音技术的障碍:五大挑战和创新解决方案

推荐&#xff1a;使用 NSDT场景编辑器 助你快速搭建可二次编辑器的3D应用场景 介绍 在用西班牙语&#xff08;您的首选语言&#xff09;向语音助手询问某些内容后&#xff0c;您有多少次不得不暂停&#xff0c;然后用语音助手理解的语言&#xff08;可能是英语&#xff09;重述…