目标检测——day66 Scaled-YOLOv4: Scaling Cross Stage Partial Network

news2024/11/25 12:38:21

Scaled-Yolov4:可伸缩跨级部分网络

  • Scaled-YOLOv4
  • 1. Introduction
  • 2. Related work
    • 2.1. Real-time object detection
    • 2.2. Model scaling(模型缩放)
  • 3. Principles of model scaling
  • 4. Scaled-YOLOv4
    • 4.1. CSP-ized YOLOv4
    • 4.2. YOLOv4-tiny
    • 4.3. YOLOv4-large
  • 6. Conclusions

Scaled-YOLOv4

1. Introduction

首先来看看YOLOv4在COCO数据集上的表现,据所知,是目前(2021年)COCO数据集上任何已发表的工作中精度最高的:55.5% AP(73.4% AP50) for the MS COCO dataset at a speed of∼16
FPS on Tesla V100,而随着测试时间的增加,YOLOv4-large achieves 56.0% AP (73.3 AP50).

  • 提出的Scaled-Yolov4和其他最先进的目标检测器的比较如下图所示,虚线只表示模型推理的延迟,实线包括模型推理和后处理。

image-20230117102711774

2. Related work

2.1. Real-time object detection

老生常谈的单阶段和两阶段目标检测器问题,在这儿给出普遍定义吧:

  1. 物体探测器主要分为单阶段物体探测器和两阶段物体探测器。

  2. 只需一次CNN运算即可得到单阶段物体探测器的输出。

  3. 对于两级目标检测器,通常将第一阶段CNN得到的高分区域建议反馈到第二阶段CNN进行最终预测。

2.2. Model scaling(模型缩放)

什么年代了还在玩传统缩放!(狗头)——改变模型深度,即增加更多的卷积层。

近年来,网络体系结构搜索(NAS)相关研究蓬勃发展,我们可以把NAS-FPN看作是一种主要在阶段级执行的模型缩放技术。 至于EfficientNet ,它使用基于深度、宽度和输入大小的复合缩放搜索。

本文将从目标检测的设计要求出发,尝试寻找一种用于协同复合缩放的方法。

3. Principles of model scaling

这一章是重点,建议读者回到原文阅读理解

4. Scaled-YOLOv4

在本节中,我们将重点放在为普通GPU、低端GPU和高端GPU设计可伸缩的Yolov4。

4.1. CSP-ized YOLOv4

image-20230117104623123

4.2. YOLOv4-tiny

YOLOV4-TINY的计算块。

image-20230117104631102

4.3. YOLOv4-large

图4显示了YOLOV4-P5、YOLOV4P6和YOLOV4-P7的结构。 我们设计在sizeInput,#Stage上执行复合缩放。 我们将每个阶段的深度标度设为2DSI,DS设为[1,3,15,15,7,7,7]。 最后,我们进一步利用推理时间作为约束来执行额外的宽度缩放。 我们的实验表明,当宽度缩放因子等于1时,Yolov4P6可以达到30 fps视频的实时性能。 对于Yolov4-P7,在宽度缩放因子等于1.25的情况下,可以达到16 fps视频的实时性能。

image-20230117104640770

本篇就到这了,实验部分也是常规证明模型好的内容

6. Conclusions

基于CSP方法的YOLOV4目标检测神经网络具有上下可伸缩性,适用于小型网络和大型网络。 因此,我们使用TensorRT-FP16在Test-Dev COCO数据集上实现了Yolov4大模型的最高精度56.0%AP,在RTX 2080TI上实现了Yolov4小模型的极高速度1774 fps,在其他Yolov4模型上实现了最佳速度和精度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/169260.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

上海亚商投顾:沪指缩量小幅调整 半导体与旅游股领涨

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。市场情绪沪指今日缩量小幅调整,创业板指稍显强势,多数时间红盘运行,科创50指数涨超1%。半…

springMVC讲解(上)

SpringMvc 1,简介 springmvc是spring的一个后续产品,是spring的一个子项目,是spring为表示层所开发的一整套完备的解决方案,在表示层框架经历了struct、webWork、struct2等诸多产品的历代更迭之后,目前业界普遍选择了…

JAVA就业课程,面试题大全

面试整体流程1.1 简单的自我介绍我是xxxx,工作xxx年.我先后在xxxx公司、yyyy公司工作。先后做个xxxx项目、yyyy项目。1.2 你简单介绍一下xxxx项目为了解决xxxx问题,开发了一套xxxx系统,该系统主要有那些部分组成。简单介绍项目的整体架构。参与某个模块的…

【Python学习】输入和输出

前言 往期文章 【Python学习】列表和元组 【Python学习】字典和集合 【Python学习】条件和循环 在很多时候,你会想要让你的程序与用户(可能是你自己)交互。你会从用户那里得到输入,然后打印一些结果。我们可以使用iinput和pr…

MATLAB趣味绘图-内接正六边形旋转

MATLAB趣味绘图-内接正六边形旋转 观察一下内部的正六边形大概在外部的正六边形边的四等分点的位置,通过数学平面几何知识可得边和角度的迭代关系式为: an134an−1θnθn−1arctan⁡36a_n \frac{\sqrt{13}}{4} a_{n-1} \\ \theta_n \theta_{n-1}\arcta…

金融行业数据库场景下,SmartX 超融合表现如何|性能验证与落地实践

在金融行业,数据库是一项至关重要的 IT 基础设施。作为交易和数据的主要载体,数据库往往需要在短时间内处理大量的业务数据,其可靠性、稳定性和性能将直接影响业务系统的运行状态。而在进行数据库基础架构选型时,一些客户对于超融…

C++学习笔记——类和对象

1.面向对象的三大特性:封装、继承、多态 2.对象有其属性和行为 3.具有相同性质的对象,可被抽象为类 1.封装 1.封装是C面向对象三大特性之一 2.封装的意义: (1)将属性(变量)和行为&#xff…

python学习 --- 字典基础

目录 一、什么是字典? 1、字典示意图-无序说明 2、字典实现原理 二、字典的创建 1、使用花括号 2、使用内置函数dict() 三、字典常用操作 1、字典中元素的获取 2、key的判断(存在与否) 3、字典元素的删除 4、字典元素的新增 5、获…

计讯物联智慧水务解决方案:用“智水”捍卫生命之泉

项目背景 水是生命的源泉,是城市的灵魂,是农业的命脉,是工业的基石。2022年以来,基于国家政策的引导、科技革新的驱动与供排水需求增长,智慧水务的发展突飞猛进,从信息化到数字化,再到智能化&a…

若依 ruoyi vue el-switch 列表开关状态显示有误 全部关闭的问题

后台使用int类型传状态status的值但是前端列表展示的开关状态是未开启,实际上,后台传的都是开启的状态结果应该是这样确定后台传的status值 在 el-switch 标签中是否使用了正确的值判断,比如 后台用的是字符串、布尔 或者是 数值类型&#xf…

android判断文件是否存在跳转不同activity

android studio版本:2021.2.1Patch 2例程名称:ActivityJump完成日期:2023.1.17一直在完善一个小东西,也是不断的在学习。之前做的那个桌面日历天气(老旧安卓手机发挥余热做桌面时钟摆件使用),有…

java 数列排序

试题 基础练习 数列排序提交此题 评测记录 资源限制内存限制&#xff1a;512.0MB C/C时间限制&#xff1a;1.0s Java时间限制&#xff1a;3.0s Python时间限制&#xff1a;5.0s问题描述给定一个长度为n的数列&#xff0c;将这个数列按从小到大的顺序排列。1<n<200输入格式…

【渗透测试】信息搜集总结

前言零零散散的发布过很多文章了&#xff0c;但是也没有完整的总结一下&#xff0c;今天就从信息搜集入手&#xff0c;系统的总结一下。一方面可以巩固自己的基础&#xff0c;作为自己的字典随用随查&#xff0c;另一方面希望对大家的学习和工作起到帮助作用。按照这个过程基本…

求两点间的距离-C语言实现

任务描述 已知两点A(x1,y1),B(x2,y2),求其间的距离。 输入 一行四个浮点数,x1,y1,x2,y2 输出 两点间的距离,要求不要输出多余的零。 本关知识 两点间的距离公式 pow函数 在C语言中,提供了用于求x的y次幂的函数,函数原型为: double pow(double x, double y…

啊啊啊小红书爆款标题技巧被我找到了!

我通过平日里对小红书的了解和积累&#xff0c;再加上这一阵子对小红书爆款笔记的研究&#xff0c;终于在这么多笔记当中发现了小红书爆款笔记标题的撰写规律&#xff01; 我们在撰写小红书的时候恨不得篇篇都是爆文&#xff0c;那么今天就来讲一下小红书那些爆款笔记标题的撰写…

75、DiffRF: Rendering-Guided 3D Radiance Field Diffusion

简介 主页&#xff1a;https://sirwyver.github.io/DiffRF/ 对应用于三维亮度场的概率扩散过程进行去噪。在3D监控和体积渲染的指导下&#xff0c;模型能够无条件地合成高保真3D资产(左)。 蒙面补全的新应用(右)&#xff0c;即从不完整的对象中恢复形状和外观的任务(在右上方…

超实用的百度百科人物词条创建攻略分享,纯干货

自媒体时代&#xff0c;人们越来越有IP意识&#xff0c;打造个人IP就是在为自己创造更多价值。 个人IP的打造是一个提升知名度的过程&#xff0c;怎么才能快速提升&#xff1f;创建一个百度百科词条不失为一个好的选择。 现在用户有问题就会在百度上搜索一下&#xff0c;当用户…

java实现模拟调用接口

本文总结如何用fiddler和postman调试接口&#xff0c;并用java模拟调用接口。fiddler用法当页面点击事件后&#xff0c;在fiddler出现一个请求&#xff0c;单击左侧请求&#xff0c;在右侧的raw的tab标签&#xff0c;出现该请求的详细内容。其实一个请求需要两类参数&#xff0…

Linux常用命令——umask命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) umask 用来设置限制新建文件权限的掩码 补充说明 umask命令用来设置限制新建文件权限的掩码。当新文件被创建时&#xff0c;其最初的权限由文件创建掩码决定。用户每次注册进入系统时&#xff0c;umask命令都被…

大数据技术架构(组件)——Hive:流程剖析1

1.1、流程剖析大致流程&#xff1a;1、客户端连接到HS2(HiveServer2&#xff0c;目前大多数通过beeline形式连接&#xff0c;Hive Cli模式相对较重&#xff0c;且直接略过授权访问元数据),建立会话2、提交sql&#xff0c;通过Driver进行编译、解析、优化逻辑计划&#xff0c;生…