轻量级模型汇总解读——涉及MobileNet、ShuffleNet、GhostNet、EfficientNet、NasNet、轻量transformer

news2024/11/14 2:55:21

前言:最近需要将模型移植到瑞芯微rv1106上运行,相比于rv1126 NPU的2.0T算力,它的算力更小,只支持0.5T的算力,而且rv1106目前只支持int8量化,为了保证模型推理在满足精度要求的情况下,保证时间尽可能短,不得不上轻量化模型。

文章目录

  • 1、轻量级模型概述
  • 2、SqueezeNet
  • 3、MobileNet系列
  • 4、ShuffleNet系列
  • 5、EfficientNet系列
  • 6、GhostNet系列
  • 7、基于神经网络架构搜索系列
  • 8、轻量transformer系列


1、轻量级模型概述

常见的CNN,从2012年发展至今,可从两方面做出归类,一个是速度提升,一个是精度提升;前者注重减小模型参数量,减小模型推理时的flops数量,改进操作的有效性,后者注重整个网络结构改进,或增加网络层深度,或增加网络宽度,或提出更先进的block等,两者均同等重要,思想可相互借鉴。提升模型推理速度,是有效结合实际应用的,因为训练的模型终归是要部署起来的,部署在服务器端,由于算力足够,或许不会对模型有轻量化要求,但若模型需要部署在边缘端,则需要对模型有轻量化要求。

常见对模型进行轻量化操作有:模型裁剪(分为结构化裁剪和非结构化裁剪)、模型蒸馏、模型量化等手段,除了以上列的方法,还可以在模型训练时直接采用轻量化网络结构。自2016年SqueezeNet发布以来,更多研究者在设计网络结构时开始关注资源受限场景中网络结构运算时的效率问题,涌现出大量的轻量级模型,例如:Google的MobileNet系列,EfficientNet Lite系列,旷世的ShuffleNet系列,华为的GhostNet等,最近还涌现出一些轻量transformer的模型。下面放上一张经多篇论文汇总的参数量、计算量及ImageNet数据集top1准确率对比表,方便对比模型性能。
在这里插入图片描述
下面按照年份、模型系列对算法进行简要解析。


2、SqueezeNet

2016年提出,算是首次在保证模型精度的情况下关注如何减小模型参数量的设计,为了达到这个目的,作者实施了如下三个策略:
1、将3x3卷积核替换成了1x1卷积核
2、将3x3卷积核的输入通道减小
3、在网络的后期进行下采样,使卷积层有较大尺寸的激活图(保证精度)
具体详细解读见 轻量级模型解读——SqueezeNet


3、MobileNet系列

MobileNet由谷歌针对模型在移动/嵌入式设备上能实现部署而提出,系列到现在2024年,已经出到了第四个版本,分别如下:
2017年MobileNetv1——>2018年MobileNetv2——>2019年MobileNetv3——>2024年MobileNetv4,其主要贡献是提出了深度可分离卷积和倒置残差瓶颈,详细解读见博客轻量级模型解读——MobileNet系列


4、ShuffleNet系列

shuffleNet由旷视科技提出,在应用分组卷积时,考虑通道之间没有信息“交流”会阻碍模型的特征表达,于是考虑在分组卷积之前将通道打乱(shuffle),实验证明,这一改进有助提升模型性能,shuffleNetv2在改进模型结构的同时考虑模型的实际推理延时而不是通过flops去衡量,有一定的实际工程应用,详细解读见博客轻量级模型解读——ShuffleNet系列


5、EfficientNet系列

EfficientNet自2019年谷歌提出以来,经历了三个版本,2019EfficientNet ——> 2020EfficientNet-Lite——> 2021EfficientNetv2,严格来说,我们现在讨论的轻量级模型,只有EfficientNet-b0/b1/b2/b3,EfficientNetv2-b0/b1/b3/S以及专门针对移动端改进的EfficientNet-Lite属于轻量级模型这个标准。详细解读见博客轻量级模型解读——EfficientNet系列


6、GhostNet系列

GhostNet由华为诺亚方舟实验室于2019年11月底提出,投稿于cvpr2020,后面2022年,2024年相继提出更新版本GhostNetv2和GhostNetv3。GhostNetv1改进点不大,但出发点比较新颖,大多数研究者设计轻量模型,都是想去掉模型的冗余特征,但作者提出冗余特征对模型性能保证是必要的,作者的出发点是尽量用简单的线性操作精简生成这些冗余特征,最终的效果等效于将模型加深。v2版本是加入DFC注意力机制提升模型性能,v3是一些工程实际方面的改进,比如重参数化、蒸馏、学习策略、数据增强等。
具体详细解读见博客轻量化模型解读——GhostNet系列


7、基于神经网络架构搜索系列

基于神经网络架构搜索比较经典的轻量型模型主要有谷歌大脑在2017年提出的NASNet、2018年的MnasNet和2019提出的MixConv,当然还有其他系列的轻量型模型也是通过架构搜索得到,比如:MobileNetv3和MobileNetv4,EfficientNet-B0,GhostNetv3等,这里不再赘述。
这些基于神经网络架构搜索的方法,它们都基于谷歌大脑在2016年发布的神经网络架构搜索(Neural Architecture Search,NAS)论文发展而来,基于NAS的方法重点关注搜索空间(search space)和controller的更新策略。具体详细解读见博客轻量化模型解读——基于神经网络架构搜索(NAS)系列


8、轻量transformer系列

Transformer是2017谷歌提出的一篇论文,最早应用于NLP领域的机器翻译工作,但随着2020年DETR和ViT的出现,其在视觉领域的应用也如雨后春笋般渐渐出现,其特有的全局注意力机制给图像识别领域带来了重要参考。但是transformer参数量大,训练/推理耗时也是它的一大特点,NLP领域中,一个模型的参数量基本都是十亿量级。如何将transformer应用在图像领域并且轻量化是本篇博客的重点。我收集了近期4篇论文,DeiT(2020),ConViT(2021),Mobile-Former(2021)和MobileViT(2021)。详细解读见博客轻量化模型解读——轻量transformer系列

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2134549.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于C++实现(控制台)停车场管理系统

停车场管理系统设计报告 1 需求分析 1.1问题描述 停车场内只有一个可停放 n 辆汽车的狭长通道,且只有一个大门可供汽车进出。 汽车在停车场内按车辆到达时间的先后顺序,依次由北向南排列(大门在最南端,最先到达的第一辆车停放…

Python_两个jpg图片文件名称互换

项目场景 处理Adobe Photoshop导出的两个切片的顺序错误问题 小编在进行图片切片处理的时候,发现用PS导出的切片顺序错误,例如用PS导出的切片分别为test_01.jpg,test_02.jpg,但实际的使用需求是将两个图片的顺序调换&#xff0c…

IC开发——Verilog简明教程

1. 基础概念 1.1. 逻辑值 逻辑0,低电平,对应电路中接地GND。 逻辑1,高电平,对应电路中的电源VCC。 逻辑Z,高阻态,对应电路的悬空。 逻辑X,未知态,数据仿真中可能存在,如…

Delphi Web和Web服务开发目前有哪些选择

Delphi Web和Web服务开发目前有哪些选择 Delphi Web和Web服务开发目前有以下几个选择: Delphi MVC Framework(https://github.com/delphimvcframework/delphimvcframework):这是一个开源的Delphi Web框架,基于MVC&am…

小程序uniapp关闭手势返回操作

需求:进入当前页面后,无法返回其他页面,禁止所有返回操作(手势返回、左上角返回按钮等) 解决: 方法一:wx.enableAlertBeforeUnload wx.enableAlertBeforeUnload 在onLoad里调用: on…

-isystem isystem 实验记录

1,isystem 的理论 2,实验方案 $ tree . ├── inc111 │ └── test.h ├── inc222 │ └── test.h └── src ├── a.out └── hello.c inc111/test.h: #pragma once#define NUM 111 inc222/test.h #pragma once#define N…

2024年9月中国数据库排行榜:openGauss系多点开花,根社区优势明显

在墨天轮发布的9月中国数据库流行度排行榜中,中国数据库产业格局进一步聚集刷新,呈现出3大显著特征: 开源势力力争上游显优势领先潮流;openGauss 开源根社区优势明显;阿里华为两极鼎立云上云下各争先; 开…

2024年第二届《英语世界》杯全国大学生英语听力大赛

下周开考! 一、主办单位 商务印书馆《英语世界》杂志社 二、时间安排 赛事报名时间:即日起-2024年11月15日 正式比赛阶段:第一场:2024年9月22日10:00-22:00 第二场:2024年10月27日10:00-22:00 第三场&#xff1…

安装2024最新版Android Studio 最详细教程(带图展示)

一、安装JDK (1)首先在除C盘以外的盘建立文件夹,分别保存软件位置,JDK位置与SDK位置, 特别注意:所有文件名中不要出现空格,而且每个文件夹都是为空的状态 这里我是在D盘中操作。 &#xff0…

综合型医院适合什么样的数据摆渡方式,才能服务与安全兼顾?

综合型医院,是提供全面医疗服务的综合型医院。综合型医院的服务对象广泛,包括儿童、成人、老年人等各年龄段的人群,以及患有各种疾病的患者。它们通过提供全面的医疗服务,保障人民群众的健康需求,是医疗卫生事业的重要…

IP-adapter masking

https://github.com/huggingface/diffusers/issues/6802https://github.com/huggingface/diffusers/issues/6802

Java后端编程语言进阶篇

第一章 函数式接口 函数式接口是Java 8中引入的一个新特性,只包含一个抽象方法的接口。 函数式接口可以使用Lambda表达式来实现,从而实现函数式编程的特性。 使用 FunctionalInterface标识接口是函数式接口,编译器才会检查接口是否符合函数…

linux-L3-linux 复制文件

linux 中要将文件file1.txt复制到目录dir中,可以使用以下命令 cp file1.txt dir/复制文件 cp /path/to/source/file /path/to/destination移动 mv /path/to/source/file /path/to/destination复制文件夹内的文件 cp -a /path/to/source/file /path/to/destinati…

孟德尔随机化分析和GWAS分析有什么区别?

大家好,我是邓飞。 最近一直在研究孟德尔随机化分析,已经从概念到实操了,程序已经跑通了,很开心。这几天写的博客: 孟德尔随机化的术语理解 从一篇孟德尔随机化文章看MR常见结果形式 对于GWAS分析,从原…

LRELHLNNN;亲水性抗肝纤维化多肽作为基础肽;I型胶原蛋白靶向肽;九肽LRELHLNNN

【LRELHLNNN 简介】 LRELHLNNN是一种多肽,它能够选择性地结合到I型胶原蛋白,具有亲和力为170 nM。LRELHLNNN是由9个氨基酸组成,其氨基酸序列为H-Leu-Arg-Glu-Leu-His-Leu-Asn-Asn-Asn-OH。LRELHLNNN因其与I型胶原蛋白的高亲和力而在生物医学领…

密码学---黄道十二宫

✨简单理解的概念:是一种换位密码。 🎀破解需要用到对角线的方式:第一个H,先向下移动1位,再向右移动2位,依次类推。 🎀接着对对角线重新排列,就能得到一段有序的代码 🎀 …

玩机搞机-----如何简单的使用ADB指令来卸载和冻结系统应用 无需root权限 详细操作图示教程

同类博文: 玩机搞机---卸载内置软件 无root权限卸载不需要的软件 安全卸载_无需root卸载彻底内置软件-CSDN博客 在很多时候我们需要卸载一些系统级的app。但如果直接手机端进行卸载的话。是无法正常卸载的。其实我们可以通过有些成品工具或者完全靠ADB指令来进行卸…

网红酒店|基于java的网红酒店预定系统(源码+数据库+文档)

酒店预定|网红酒店|网红酒店预定系统 目录 基于java的网红酒店预定系统 一、前言 二、系统设计 三、系统功能设计 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍:✌️大厂码农|毕设布道师&am…

4×4矩阵键盘详解(STM32)

目录 一、介绍 二、传感器原理 1.原理图 2.工作原理介绍 三、程序设计 main.c文件 button4_4.h文件 button4_4.c文件 四、实验效果 五、资料获取 项目分享 一、介绍 ​​​​​矩阵键盘,又称为行列式键盘,是用4条I/O线作为行线,4…

【四范式】浅谈NLP发展的四个范式

自然语言处理(Natural Language Processing,NLP)是计算机科学,人工智能,语言学关于计算机和人类自然语言之间的相互作用的领域,是计算机科学领域与人工智能领域中的一个重要方向。NLP发展到今天已经进入到了…