论文笔记:GhostNet: More Features from Cheap Operations

news2024/12/27 0:07:55

1 论文简介

论文:GhostNet: More Features from Cheap Operations(华为诺亚团队)
源代码:https://github.com/huawei-noah/ghostnet

2 动机

由于内存和计算资源的限制,在嵌入式设备上部署卷积神经网络非常困难。
在这里插入图片描述
本文提出的GhostNet:

  • 降低计算复杂度:只保留固有特征;
  • 保持特征多样性:将固有特征进行线性变换得到冗余特征。

图1的分析如下:

  • (1)固有特征;
  • (2)线性变换;
  • (3)冗余特征。

在分类任务中,GhostNet在速度精度平衡上比 mobilenetv3 好。

3 相关工作

3.1 模型压缩(Model Compression)

  • Pruning connections
  • Channel pruning
  • Model quantization
  • binarization methods
  • Tensor decomposition
  • Knowledge distillation

3.2 紧凑模型设计(Compact Model Design)

  • MobileNets
  • MobileNets V2
  • MobileNets V3
  • ShuffleNet
  • ShuffleNet V2

4 具体方案

在这里插入图片描述
常规的卷积操作:

  • 输入数据: X ∈ R c × h × w X \in \mathbb{R}^{c \times h \times w} XRc×h×w c c c为通道数(如3通道,RGB), h h h为图片的高度, w w w为图片的宽度;
  • 输出数据: Y ∈ R h ′ × w ′ × n Y \in \mathbb{R}^{h' \times w' \times n} YRh×w×n h ′ h' h为输出特征映射的高度, w ′ w' w为输出特征映射的宽度, n n n个通道;
  • 操作: Y = X × f + b Y = X \times f + b Y=X×f+b f ∈ R c × k × k × n f \in \mathbb{R}^{c \times k \times k \times n} fRc×k×k×n为卷积操作, k × k k \times k k×k为卷积核大小, b b b为偏置;
  • 缺点:因为 n n n c c c一般取值很大(例如256或512),导致计算量大。

建议的GhostNet操作:

  • 输入数据: X ∈ R c × h × w X \in \mathbb{R}^{c \times h \times w} XRc×h×w c c c为通道数(如3通道,RGB), h h h为图片的高度, w w w为图片的宽度;
  • 输出数据: Y ′ ∈ R h ′ × w ′ × m Y' \in \mathbb{R}^{h' \times w' \times m} YRh×w×m h ′ h' h为输出特征映射的高度, w ′ w' w为输出特征映射的宽度, m m m个通道( m ≤ n m \leq n mn);
  • 操作1: Y ′ = X × f ′ Y' = X \times f' Y=X×f f ′ ∈ R c × k × k × m f' \in \mathbb{R}^{c \times k \times k \times m} fRc×k×k×m为卷积操作, k × k k \times k k×k为卷积核大小,为了简化,取消了偏置 b b b
  • 操作2:为了特征多样性,对操作1得到的固有特征进行线性变换, y i j = Φ i , j ( y i ′ ) , ∀ i = 1 , … , m , j = 1 , … , s y_{i j}=\Phi_{i, j}\left(y_{i}^{\prime}\right), \quad \forall i=1, \ldots, m, \quad j=1, \ldots, s yij=Φi,j(yi),i=1,,m,j=1,,s y i ′ ∈ Y ′ y_{i}^{\prime} \in Y^{\prime} yiY为第 i i i个固有特征映射, Φ i , j \Phi_{i, j} Φi,j为第 j j j个线性变换,通过线性变换,可以得到 { y i j } j = 1 s \{y_{ij}\}_{j=1}^s {yij}j=1s; 通过线性变换,我们可以得到 n = m ⋅ s n = m \cdot s n=ms个冗余特征 Y = [ y 11 , y 12 , … , y m s ] Y = [y_{11}, y_{12}, \dots, y_{ms}] Y=[y11,y12,,yms]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/442184.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅述 国产 仪器 4456系列数字荧光示波器

4456系列数字荧光示波器具有6个产品型号,带宽350MHz~1GHz,最高采样率5GSa/s,最大存储深度500Mpts/CH,最快波形捕获率100万个波形/秒,独创的Any Acquire Phosphor技术,为您提供全新的示波器使用体验。 4456…

Doris(12):高级设置

1 增大内存 内存不够时, 查询可能会出现‘Memory limit exceeded’, 这是因为doris对每个用户默认设置内存限制为 2g SHOW VARIABLES LIKE "%mem_limit%"; exec_mem_limit 的单位是 byte,可以通过 SET 命令改变 exec_mem_limit 的值。如改为 8GB。 SET…

《Spring MVC》 第四章 域对象、视图、转发和重定向

前言 介绍Spring MVC的域对象、视图、转发和重定向 1、域对象共享数据 Spring MVC 提供了多种域对象共享数据的方式,其中最常用的方式如下: 1.1、使用 Servlet API 向 request 域对象中共享数据 服务端代码: RequestMapping("toLo…

RTC音视频是什么意思?即构RTC音视频有什么优势

RTC音视频是什么意思? RTC(Real time communication),是实时音视频的一个简称,一种给行业提供高并发、低延时、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务的终端服务。但更广义的RTC技术,不单单局限于音视频,包括I…

C++ 算法进阶系列之剖析树型动态规划算法思想

1. 前言 什么是树型动态规划? 概念中有 2 个子概念: 一个是动态规划概念。动态规划可以简单理解为通过对已经计算出来的子问题的状态值进行修改(基于子问题的状态值找到当前子问题的最优值)而得到当前子问题的状态值。 Tips: 本文侧重于动…

数智融合,生态链接丨 亚信科技“信伙伴”交流会(成都站)成功举办

日前,“数智融合,生态链接”亚信科技“信伙伴”交流会(成都站)在成都希顿酒店成功举办。本次会议由四川省信创产业联盟指导,亚信科技AntDB数据库事业部、四川省软件行业协会联合举办。 伴随我国信息技术应用创新不断向…

探究以太坊生态系统中的Consensys:产品技术细节与应用场景介绍

文章目录 前言一. Infura1. API简介(1)HTTP API(2)WebSocket API 2. Infura优势(1)稳定性(2)易用性(3)免费 二、Truffle1. Truffle框架(1&#xf…

【大数据之Hadoop】十七、MapReduce之数据清洗ETL

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将分散、零乱、标准不统一的数据整合到一起,为决策提供分析依据。 ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。 1 ETL体系结构 ETL主要是用来实现…

Python无框架分布式爬虫,爬取范例:拼多多商品详情数据,拼多多商品列表数据

拼多多是中国领先的社交电商平台之一,是一家以“团购折扣”为主要运营模式的电商平台。该平台上有海量的商品,对于商家和消费者来说都具有非常大的价值,因此,拼多多商品数据的采集技术非常重要。本文将介绍拼多多商品数据的采集技…

元宇宙资讯|消息称苹果 MR 头显发售要等到 2025 年

长期担任苹果分析师的吉恩・蒙斯特 (Gene Munster) 表示,尽管该公司可能永远不会使用“元宇宙”这个词,但苹果公司的混合现实耳机将是对元宇宙的认可。 深水资产管理公司 (Deepwater Asset Management) 的管理合伙人吉恩・蒙斯特 (Gene Munster) 在周三表…

【系统安全及应用2】

目录 一、开关机安全控制二、终端登录安全控制2.1、限制root只在安全终端登录2.2、如何限制虚拟终端2.3、禁止普通用户登录 三、系统弱口令检测3.1、Joth the Ripper,简称为 JR 四、网络端口扫描4.1、NMAP4.2、nmap的使用nmap的常用选项netstat常用选项 一、开关机安…

【C++初阶】C++入门(二):引用内联函数auto关键字范围for循环(C++11)指针空值nullptr

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:C初阶 🎯长路漫漫浩浩,万事皆有期待 上一篇博客:【C初阶】…

【pinia】新一代更好用的状态管理器Pinia

目录 一,Pinia状态管理库 1.Pinia介绍 2.Pinia的核心特性 3.核心概念 4.Pinia vs Vuex 5.Pinia & Vuex的不同 6.Pinia名字 二,Pinia基本使用 1.安装Pinia 2.配置main.ts文件 3.创建store/index.ts文件 4.使用数据 三,状态更新…

再获CSA大奖!顺丰科技腾讯安全iOA零信任联合方案获认可

随着千行百业数字化转型的加速,远程办公、业务协同、分支互联等需求涌现,传统的基于边界的网络安全防护理念难以有效抵挡层出不穷的威胁攻击,基于“无边界安全”理念的零信任技术模型逐渐成为企业关注的重点。 近日,第六届云安全…

千云物流 -车辆智能监控调度(一)-技术选型

技术选型 消息队列:rabbitMq 时序数据库: TDengine kv存储:redis 时序数据库 https://db-engines.com/en/ranking/timeseriesdbms 选择范围:Apache IoTDB,TDengine,OpenTSDB 对于存储车辆位置数据的时序数…

LabelImg安装记录

一 安装anaconda 安装conda主要是为了方便环境管理,避免软件版本冲突,安装简单,教程也很多,不做赘述 二 创建虚拟环境 在这里,我们创建一个专门用于标注数据的虚拟环境,取名为labelImg # 第一条命令c…

特斯拉 Tesla 热管理系统技术迭代分析(Model S/X/3/Y热管理系统介绍)

摘要: 特斯拉第三代热管理系统 为了更好地了解特斯拉的技术迭代以及集成度较高的热管理技术,今天我们针对特斯拉初代和第二代热管理系统做简单介绍。 特斯拉第一代热管理系统 系统架构原理图 第一代热管理系统应用在Model S和Model X上,共有…

4月14号软件资讯更新合集.....

PlayEdu v1.0-beta.2 版本发布,企业培训解决方案 PlayEdu 是基于 SpringBoot3 Java17 React18 开发的企业内部培训系统。它专注于提供私有化部署方案,包括视频,图片等资源的内网部署。目前主要支持有本地视频上传播放、学员邮箱登录、无限…

MIT6.824 Lecture18 Fork Consistency

Background 拜占庭问题(Byzantine Generals Problem)得名于一个古老的传说,讲述了拜占庭帝国在战争中的一个失败策略。在这个故事中,多名拜占庭将军要协调进攻或撤退的行动,但是其中一些将军可能会向其他帝国泄露假消…

在 Rocky linux 8.5 使用 Kubespray v2.21.0 离线部署 kubernetes v1.25.6 集群(草稿)

文章目录 前言创建7台虚拟机要求配置代理下载介质部署前准备安装部署工具配置 python venv配置部署容器 配置互信编写 inventory.ini创建 offline.yml部署 offline repokubespray v2.21.1 部署 kubernetes 失败报错1:Install packages requirements报错2&#xff1a…