什么是轻量化,轻量化模型is all your need hhh

news2024/11/28 8:39:35

其实学了几个小月,我们肯定知道,MLP有多deeper ,卷积层有多少层呀

抑或是Transformer架构,大量的参数,只能用huge 来描述,

可实际上我们的设备,有时候并没有服务器那么厉害,所以人们就想着

能不能在不改变model的精确度和效率,减少一下模型的规模

就是怎么样减少一下模型的复杂度或者参数量也好呀,在不失去优雅的情况下哈哈哈哈

这就是人类,贪婪的欲望推动着科技的进步哈哈哈哈

 这个图是我偷的,斯坦福的,

没别的意思,就是想告诉大家,我们做DeepLearning 蛮耗能量的

杜绝挖矿!!!遵循人类可持续发展,我们是人类命运共同体啊啊啊

我们现在碳中和哦 小伙子们

面临的问题和挑战:当前基于深度卷积神经网络的目标检测算法计算资源需求太大和内存消耗严重使得成本较高

而轻量化网络因可以牺牲一小部分检测精度使检测速度获得较大的提升受到了广泛关注。轻量化网络的设计核心是在尽可能保证模型精度的前提下,降低模型的计算复杂度和空间复杂度,从而使得深度神经网络可以被部署在计算性能和存储空间有限的嵌入式边缘设备上,实现从学术界到工业界的跃迁

1.直接设计轻量化的深度网络模型

人工设计的轻量化神经网络 、基于神经网络架构搜索(Neural architecturesearch,NAS)的自动设计神经网络技术、卷积神经网络压缩和基于 AutoML的自动模型压缩。

2.模型的压缩

参数剪枝与量化(Parameter Pruning and Quantization),

低秩分解(Low-rank Factorization),

轻量化模块设计(Light-weight Module Design),

知识蒸馏(Knowledge Distillation)
 

method

目前常见的轻量化目标检测模型通常采用单阶段目标检测算法高效的轻量级骨干网络

将分类问题中的训练模型作为目标检测的预训练模型,

这可以为训练检测器提供更丰富的语义信息。

最经典的做法采用深度可分离卷积、分组卷积等轻量卷积方式,减少卷积过程的计算量。此外,利用全局池化来取代全连接层,利用1×1卷积实现特征的通道降维,也可以降低模型的计算量,

 SqueezeNet (压缩再拓展) MobileNet(深度可分离卷积)ShuffleNet(通道混洗)

通过采用巧妙的融合策略与算法改进

轻量化 R-CNN 系列

自身体系结构的问题限制了检测速度。

轻量化 YOLO 系列

YOLO在轻型化目标检测尤其是在嵌入式平台下的重要地位

SSD平衡了YOLO和Faster RCNN的优缺点的模型,也常被用来与轻量级骨干网络进行结合达到高效率的目的。

最新的轻量化目标检测算法

1.NanoDet是一个 速度超快、(移动端 97fps)和轻量级(1.8MB)的移动端Ancho-free目标检测模型 

2.谷歌MobileDets [19]arXiv2020  CVPR2021

3.超越YOLOv4-TinyCSL-YOLO:移动端实时检测(2021

4.Micro-YOLO2021)保持检测性能的同时显着减少了参数数量和计算成本

YOLOv3-tiny网络中的卷积层替换为深度分布偏移卷积DSConv和移动反向瓶颈卷积 MBConv,并设计渐进式通道级剪枝算法以最小化数量参数并最大化检测性能

5.苹果团队MobileViT更小,更快,高精度的轻量级Transformer端侧网络架构

它是一个轻量级,通用的,低时延的端侧网络架构,将Transformer视为卷积,允许利用卷积和Transformer(例如,全局处理)的优点来构建轻量级和通用ViT模型。结合了CNN的归纳偏置优势和ViT的全局感受野能力,利用了CNN中的空间归纳偏置优势以及对数据增强技巧的低敏感性的特性,再结合了ViT中对输入特征图信息进行自适应加权和建立全局依赖关系等优点。
6.华为
GhostNet

提出了一种新的Ghost模块,可以从廉价的操作中生成更多的特征图。基于一组内在特征映射,以低廉的成本应用一系列线性变换来生成许多能充分揭示内在特征信息的ghost feature maps。论文提出的Ghost模块可以作为一个即插即用的组件来升级现有的卷积神经网络。Ghost bottlenecks用来堆叠Ghost模块,从而可以方便地建立轻量级GhostNet。
7.百度开源
 PP-PicoDet:轻量型实时目标检测模型

8.EdgeNeXt打混合拳:集CNNTransformer于一体

整体架构采取标准的“四阶段”金字塔范式设计,其中包含卷积编码器与SDTA编码器两个重要的模块。在卷积编码器中,自适应核大小的设计被应用,这与SDTA中的多尺度感受野的思想相呼应。而在SDTA编码器中,特征编码部分使用固定的3×3卷积,但通过层次级联实现多尺度感受野的融合,而此处若使用不同尺寸的卷积核是否会带来更好的效果有待考证。在自注意计算部分,通过将点积运算应用于通道维度,得到了兼顾计算复杂度与全局注意力的输出,是支撑本文的一个核心点。
9.腾讯
DisCo: 提升轻量化模型在自监督学习中的效果(ECCV2022

Distilled Contrastive Learning (DisCo),一种简单有效的基于蒸馏的轻量化模型的自监督学习方法,该方法可以显著提升Student的效果并且部分轻量化模型可以非常接近Teacher的性能。

1)基于自监督的蒸馏学习;

       (2)放弃共享队列,使整个框架不依赖于MoCo-V2,整个框架更加简洁。Teacher/Student 模型可以与其他比MoCo-V2更加有效的自监督/无监督表征学习方法结合,进一步提升轻量化模型蒸馏完的最终性能。

       (3)目前的自监督方法中,MLP的隐藏层维度较低可能是蒸馏性能的瓶颈。在自监督学习与蒸馏阶段增加这个结构的隐藏层的维度可以进一步提升蒸馏之后最终轻量化模型的效果,而部署阶段不会有任何额外的开销。

10.阿里提出目标检测新范式GiraffeDet:轻骨干、重Neck

提出了首个轻骨干+灵活FPN组合的检测器,所提GiraffeDet包含一个轻量S2D-chain骨干与一个Generalized-FPN并取得了SOTA性能。

        (1)不同常规骨干,本文设计了一种轻量型S2D-chain骨干,同时通过可控实验证实:相比常规骨干,FPN对于检测模型更为重要;

        (2)提出GFPN(Generalized-FPN)以跨尺度连接方式对前一层与当前层的特征进行融合,跳层连接提供了更有效的信息传输,同时可以扩展为更深的网络;

        在不同FLOPs-性能均衡下,所提GiraffeDet均取得了优异性能。当搭配多尺度测试时,GiraffeDet-D29在COCO数据集上取得了54.1%mAP指标,超越了其他SOTA方案。
11.ParC-Net
超苹果

通过将vision transformers的优点融合到ConvNet 中。提出了位置感知循环卷积(ParC),这是一种轻量级的卷积运算,它拥有全局感受野,同时产生与局部卷积一样的位置敏感特征。将ParCs和squeeze-exictation ops结合起来形成一个类似于元模型的模型块,它还具有类似于transformers的注意力机制。上述块可以即插即用的方式使用,以替换ConvNets或transformers中的相关块
 

依赖于巧妙的轻量化特征提取网络设计,以及网络内部高效的信息提取与传递机制

笔记来源于看了几十篇轻量化目标检测论文扫盲做的摘抄笔记_Y蓝田大海的博客-CSDN博客_目标检测轻量化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/142845.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

阿里云认证为什么那么多人考?考试内容难不难?

我国人口密集,每年有大量的毕业生涌进社会,除此之外还有很多进入社会很久的打工人,想要跳槽,到更加挣钱的岗位,待遇更好的公司去。为了能够早日买房、买车,很多人会选择社会热门行业去学习,甚至…

sqli-labs 第七关 多命通关攻略

sqli-labs 第七关 多命通关攻略描述字符串与数值之间的转换判断注入类型返回结果正常输入不正常输入错误输入总结判断注入类型判断是否为字符型注入判断是否为单引号字符型注入判断是否为双引号字符型注入判断是否为数值型注入总结判断注入类型(修正版)字…

二十六、Docker (2)

🌻🌻 目录一、Docker的常用命令 (阶段A)1.1 帮助命令1.2 镜像命令1.3 容器命令1.3.1 新建容器并启动1.3.2 列出所有运行的容器1.3.3 退出容器1.3.4 删除容器1.3.5 启动和停止容器的操作1.4 常用的其它命令1.4.1 后台启动容器1.4.2 查看日志1.4.3 查看容器…

如何搭建私域流量?

如今已经进入存量用户时代,越来越多的企业也明白了存量用户的重要性,因此企业都非常重视私域流量的搭建,以挖掘客户的价值。 前言 如今已经进入存量用户时代,越来越多的企业也明白了存量用户的重要性,因此企业都非常重…

安卓搭建好的模拟机,为调试准备

​ 这一节直接分享制作好的虚拟机,镜像系统,以及安卓源码,直接节省你的时间去配置,编译。 下来我来分享下搭建步骤: 1 虚拟机下载vm 12 pro ,这个网上百度就可以,原则13,14也都是可以的。 2 下…

移动魔百盒CM311-3-YST-晨星MSO9385-语音首页正常-TTL刷机包

移动魔百盒CM311-3-YST-晨星MSO9385-语音首页正常-TTL刷机包 固件特点: 1、三网通用; 2、开放原厂固件屏蔽的市场安装和u盘安装apk; 3、无开机广告,无系统更新,不在被强制升级; 4、大量精简内置的没用…

熬夜搞了 17000 字,终于把你这个 ES 玩明白了

平常经常用ES(ElasticSearch), 觉得这真是个好玩意儿,所以来分享一篇文章,希望通过这篇文章能让读者大致了解ES是做什么的以及它的使用和基本原理。 可能有的读者航海不知道ES是个啥玩儿,别着急,看完本文后,相信你会了…

import...from... 和 require 如何找到模块位置?

import Vue from "vue"; 为什么不用写相对地址和绝对地址就能够导出 Vue 呢?似乎也没有配置路径?也没有配置映射,那么究竟 from "vue"; 对应的究竟是那个路径呢? 先提出两个可能的方案 1.VS Code/WebStorm …

【每天学习一点新知识】nmap端口扫描

nmap所识别的6个端口状态open(开放的)应用程序正在该端口接收TCP 连接或者UDP报文。发现这一点常常是端口扫描 的主要目标。安全意识强的人们知道每个开放的端口 都是攻击的入口。攻击者或者入侵测试者想要发现开放的端口。 而管理员则试图关闭它们或者用防火墙保护它们以免妨碍…

Java封装公共Result结果返回类

前言 在使用Java开发接口请求中,我们需要对请求进行进行统一返回值,这时候我们自己封装一个统一的Result返回类,下面就介绍下我用的这种的这个类 当然,也可以使用第三方库封装的Result结果返回类,根据个人喜好选择即可…

学习笔记之Vue脚手架(三)

(三)使用Vue脚手架 使用Vue脚手架(三)使用Vue脚手架一、创建Vue脚手架1.1 说明1.2 具体步骤二、分析脚手架结构2.1 配置文件2.2 src文件夹2.3 public文件夹一、创建Vue脚手架 1.1 说明 1.Vue脚手架是Vue官方提供的标准开发工具&…

电脑技巧:分享常用的电脑快捷键

❤️作者主页:IT技术分享社区 ❤️作者简介:大家好,我是IT技术分享社区的博主,从事C#、Java开发九年,对数据库、C#、Java、前端、运维、电脑技巧等经验丰富。 ❤️个人荣誉: 数据库领域优质创作者🏆&#x…

Nutanix 替代专题 | SmartX 与 Nutanix 超融合市场、技术与性能对比

2022 年 8 月 19 日,Nutanix(路坦力)宣布中国市场自 2023 财年起将转型为合作伙伴销售主导模式,引起了广泛关注;同时结合当前 IT 基础架构的国产化趋势背景,不少正在使用和考虑使用 Nutanix 产品的企业开始…

js 跨域访问问题解决方法

什么引起了ajax不能跨域请求的问题? ajax本身实际上是通过XMLHttpRequest对象来进行数据的交互,而浏览器出于安全考虑,不允许js代码进行跨域操作,所以会警告。 有什么完美的解决方案么? 解决方案有不少,但…

数字化门店管理|如何让门店数字化管理,更加贴合日常运营细节?

在赋能品牌门店数字化管理的过程中,帷幄既注重前沿 AI 算法带来的技术驱动力,也注重基于门店管理中的真实场景与需求,让算法更贴合业务实际需求,从而带来运营优化与降本增效。 1 月,「帷幄数智空间 Whale SpaceSight」…

植物大战 动态内存——C++

这里是目录标题前言动态内存分布如何理解C语法的增加newnew用法关于struct和class的使用关于free和delete的区别。背会这句话抛异常operator new和operator delete内存池new和delete原理定位newmalloc和new的区别是什么?内存泄漏前言 总结复习前面的知识。 注意&a…

一文带你了解什么是云计算网络运维工程师,以及2023年的就业前景

作者简介:一名在校云计算网络运维学生、每天分享网络运维的学习经验、和学习笔记。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言 一.云计算网络运维工程师是做什么的? 二.作为一名云计算网络运…

MyBatis(用于简化JDBC开发)

MyBatis是一款持久层框架,用于简化JDBC开发 持久层:将数据报错到数据库,持久化更改的意思 javaEE三层架构:表现层(页面)、业务层(处理逻辑)、持久层(数据永久化更改&am…

拉伯证券|人心动了?刚刚,A股、港股大涨!

昨日A股传言较多,引发波动。上一年10月底11月初,也有类似情况。换个视点看,这说明人心开端动了,至于怎样个“思变”法,市场可能现已给出了答案! 今天上午,A股大涨,北向资金净流入110…

cs231n-2022-01 Assignments1-numpy的使用

numpy的使用 Numpy是Python中科学计算的核心库。它提供了一个高性能的多维数组对象,以及处理这些数组的工具。如果你已经熟悉MATLAB,你可能会发现这个教程对开始使用Numpy很有用。 运行并阅读cs231n课程网站上提供的示例代码,感觉十分简洁&a…