YOLOv5模型压缩:综述

news2025/1/19 11:11:53

YOLOv5模型压缩:综述

  • Abstract
  • Introduction
  • 剪枝
    • 基于ln-范数修剪模型
    • Feature map activation
    • Batch normalization scaling factor (BNSF)
    • First-order derivative
    • Mutual information
    • Granularity of Pruning
      • 非结构化剪枝
      • 结构化剪枝
        • 基于通道的修剪
        • 基于滤波器的修剪
        • 基于核的剪枝
    • 关于剪枝的最新研究
  • 量化
    • 量化区间:均匀或非均匀
    • 量化方案:QAT PTQ
    • 量化部署方案
    • 量化YOLOv5的最新研究
  • 结论
  • 剪枝挑战与未来方向
  • 量化的挑战与未来

论文地址:https://arxiv.org/abs/2307.11904
文章末尾有相关论文链接~

Abstract

近年来,研究人员一直 致力于改进YOLO目标检测器。自其问世以来,已经推出了八个主要版本的YOLO,旨在提高其准确性和效率,尽管YOLO的明显优点使其在许多领域得到了广泛应用,但是资源有限的设备上部署他存在挑战。为了解决这个问题,开发了各种神经网络压缩方法,主要分为:网络剪枝、量化和知识蒸馏三大类
利用模型压缩方法的丰硕成果,如降低内存使用和推理时间等,使他们成为在硬件受限的边缘设备上部署大型神经网络时受到亲耐,甚至可以说是必要的方法。
通过这样做,我们识别出在适应YOLOv5的剪枝和量化压缩中存在的差距,并提供这一领域进一步探索的未来方向。在几个版本的YOLO中,我们特别选择了YOLOv5,因为他在文献中具有较新和较高的流行度的优秀权衡。

Introduction

作为一个基本问题,目标检测多年来一直是一个活跃的研究领域。目标检测 的主要目标是在给定的图像中识别和定位不同类别的感兴趣对象。目标检测是许多其他高级计算机视觉任务的基础,从语义分割到目标跟踪到活动识别,近年来,基于深度学习的方法,如卷积神经网络,在目标检测任务中取得了最先进的性能。由于计算能力和尖端算法的进步,目标检测变得更加准确,能够应用于广泛的实际应用。
在这里插入图片描述
与传统目标检测方法相比,使用CNNs可以减轻目标检测中特征提取、分类和定位的问题。通常,目标检测可以通过两种方法进行,即单阶段双阶段。在前者中,算法直接预测对象的边界框和类别概率,而在后者中,算法首先生成一组区域建议,然后将这些建议分类为对象或背景。不同于Faster R-CNN [6]和R-FCN [12]作为双阶段目标检测方法,如YOLO [5]、SSD [13]、 EfficientDet [14]和RetinaNet [15]等单阶段方法通常使用一个全卷积神经网络(FCN)来检测对象的类 别和空间位置,而不需要中间步骤。
在不同的单阶段目标检测方法中,自2016年发布以来,YOLO一直受到了广泛关注。YOLO的主 要思想是将输入图像划分为一个网格单元,并针对每个单元预测边界框和类别概率。YOLO将目标检 测视为回归问题。此外,由于它使用单个神经网络进行目标检测和分类,因此可以同时优化这两个任 务,从而提高整体的检测性能。YOLOv1采用了一个简单的结构,其中包含24个卷积层和两个全连接 层,用于生成概率和坐标 [5]。
自发布以来,YOLO已经经历了多个改进和变体。2017年,YOLOv2(也称为YOLO9000)发布, 通过使用多尺度训练,锚点框,批归一化,Darknet-19架构和改进的损失函数等方式改进了性能 [16]。 其后,Redmon和Farhadi介绍了YOLOv3,它采用了特征金字塔网络,带锚点框的卷积层,空间金字 塔池化(SPP)块,Darknet-53架构和改进的损失函数 [17]。与之前的版本不同,YOLOv4由不同的 作者引入。A. Bochkovskiy等人利用CSPDarknet53架构,Bag-of-Freebies,Bag-of-Specials,mish激活函 数,Weighted-Residual-Connections(WRC),Spatial Pyramid Pooling(SPP)和Path Aggregation Network
(PAN)提高了YOLO的性能[18]。
2020年,Ultralytics推出YOLOv5,提供了五种不同大小的版本

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/943768.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AutoRunner自动化测试工具新版本智能识别算法之视觉识别

泽众AutoRunner(简称AR)是国内专业的支持C/S、B/S各种技术框架的、基于组件识别的自动化测试工具,实现7*24小时的自动化回归测试和功能测试,让测试更智能。 视觉识别是一种通过计算机技术对图像或视频进行分析和理解的方法。这种算…

checkstyle检查Java编程样式:final参数

checkstyle可以利用FinalParameters检查方法、构造器、catch和for-each块的参数是final的: https://checkstyle.sourceforge.io/checks/misc/finalparameters.html 背后的原理:程序执行期间修改参数的值会引起混乱,所以应该避免。 要配置使…

一道经典面试题:@Configuration 和 @Component 有何区别?

关于 Configuration 注解有一个特别经典的面试题: Configuration 和 Component 有什么区别? 无论小伙伴们之前是否背过相关的面试题,今天这篇文章学完之后相信大家对这个问题都会有更深一层的理解,废话不多少,咱们开…

地理空间数据的定义、收集和应用

简介 地理空间数据是指与地球表面特定位置相关的数据。它包含多种数据类型,包括地图、卫星图像和GIS(地理信息系统)数据。近年来,由于技术的进步以及对有关物理世界的准确和最新信息的需求不断增长,地理空间数据的…

9、监测数据采集物联网应用开发步骤(7)

监测数据采集物联网应用开发步骤(6) 串口(COM)通讯开发 本章节测试使用了 Configure Virtual Serial Port Driver虚拟串口工具和本人自写的串口调试工具,请自行baidu下载对应工具 在com.zxy.common.Com_Para.py中添加如下内容 #RS232串口通讯列表 串口号,波特率,…

恒运资本:股票佣金怎么算?

股票佣钱是指证券买卖中券商向出资者收取的手续费。股票买卖中,佣钱是不可避免的一项本钱,出资者需求清楚地了解佣钱的收费规范和怎么核算,以便更好地掌握出资本钱,做出更正确的出资决策。 佣钱收费规范 股票佣钱收费规范&#x…

来文心中国行!专家面对面解读大模型产业实践及AI场景突围

9月1日,文心中国行将走进武汉。政府、高校及企业AI专家将现场分享人工智能与大模型最新政策、趋势、人才培养方案及产业实践案例,深入解读如何抓住大模型时代新机遇,高效实现智能化转型升级弯道超车。 加快实现高水平科技自立自强&#xff0c…

融云获评「创业邦 · 最具创新价值出海服务商」

点击报名,9 月 21 日融云直播课 8 月 22 日 - 23 日,创业邦主办的“2023 DEMO WORLD 全球开放式创新大会暨企业出海未来大会”在上海举行,会上发布了“创业邦 2023 出海企业创新价值 100 强”,融云荣登榜单,获评“最具…

如何安装和使用TypeScript。

目录 安装nodenpm下载typescript使用TypeScript总结 TypeScript是一种流行的编程语言,它是JavaScript的超集,具有更多的扩展功能和类型安全性。在本文中,我们将介绍如何安装和使用TypeScript。 安装node 要安装TypeScript,您需要…

Linux 查看当前文件夹下的文件大小

1.直接查看: ll 或者 ls -la #查看文件大小,以kb为单位 ll#查看文件大小,包含隐藏的文件,以kb为单位 ls -la2.以 M 或者 G 为单位查看,根据文件实际大小进行合适的单位展示 du -sh *

第62步 深度学习图像识别:多分类建模(Pytorch)

基于WIN10的64位系统演示 一、写在前面 上期我们基于TensorFlow环境做了图像识别的多分类任务建模。 本期以健康组、肺结核组、COVID-19组、细菌性(病毒性)肺炎组为数据集,基于Pytorch环境,构建SqueezeNet多分类模型&#xff0…

蓝牙模块产品认证-国际市场准入准则之BQB认证认证基础知识

蓝牙模块产品认证-国际市场准入准则之BQB认证认证基础知识 前言 BQB认证介绍 Bluetooth SIG Bluetooth SIG 由八大无线通讯行业巨头成立的一家公司,专门负责蓝牙规格开发、 技术推广及资格认证工作,成立于1998年。 Bluetooth SIG拥有Bluetooth Trademarks 免费地授…

宇瞳转债上市价格预测

宇瞳转债 基本信息 转债名称:宇瞳转债,评级:A,发行规模:6.0亿元。 正股名称:宇瞳光学,今日收盘价:13.04元,转股价格:15.29元。 当前转股价值 转债面值 / 转股…

JavaScript this、闭包和箭头函数

this this是函数内部的特殊对象之一(其他还有arguments、caller、new.target)。 this的 指向 或 值 是不确定的,取决于函数的调用方式。 在JavaScript中,this的指向有以下几种情况: 作为对象的方法调用作为普通函数…

avalonia、WPF使用ScottPlot动态显示ECG心电图

文章目录 avalonia、WPF使用ScottPlot动态显示ECG心电图实现效果,动态效果懒得录视频了安装代码部分UpdateData方法就是用来更新心电图表的方法, 根据消息队列数据去更新是视图中的ScottPlot 图表 avalonia、WPF使用ScottPlot动态显示ECG心电图 avalonia…

linux系统离线安装python以及python包

效果 1、下载python 从华为镜像网站下载 https://mirrors.huaweicloud.com/python/ 我下载的是python3.7.12版本的 2、安装python 按一系列的命令安装 mkdir /usr/local/python3 cd /usr/local/python3 tar -xvf Python-3.7.12.tar

LeetCode第16~20题解

CONTENTS LeetCode 16. 最接近的三数之和(中等)LeetCode 17. 电话号码的字母组合(中等)LeetCode 18. 四数之和(中等) LeetCode 16. 最接近的三数之和(中等) 【题目描述】 给你一个…

request+python操作文件导入

业务场景: 通常我们需要上传文件或者导入文件如何操作呢? 首先通过f12或者通过抓包查到请求接口的参数,例如: 图中标注的就是我们需要的参数,其中 name是参数名,filename是文件名,Content-Type是…

服务器数据恢复-重组RAID导致RAID6数据丢失的数据恢复案例

服务器数据恢复环境: 一台存储设备中有一组由12块硬盘组建的RAID6磁盘阵列,上层采用EXT3文件系统,共划分3个LUN。 服务器故障&分析: 存储设备在运行过程中RAID6阵列突然不可用,管理员对故障存储进行了重新分配RAI…

算法设计 || 第7题:TSP问题的成本矩阵

(一)TSP问题学习 看不懂可以观看这个老师视频学习:分支限界法(TSP问题,多段图的最短路径问题,任务分配问题,批处理作业调度问题)(算法设计第十周二节)_哔哩哔哩_bilibili (二) 考试例题 画出计算求解最优解的分支界限过…