MobileNet 网络详解

news2025/4/7 2:27:47

一、了解

网络亮点:

1、DW网络,大大减少运算量和参数数量

2、增加超参数:控制卷积层卷积核个数的超参数 \alpha,控制图像输入大小的超参数 \beta,这两个超参数是人为设定的,不是机器学习到的。

二、DW卷积(Depthwise Conv)

传统卷积:卷积核channel= 输入特征矩阵channel  输出特征矩阵channel=卷积核个数

DW卷积:卷积核个数=1 ;输入特征矩阵channel=卷积核个数=输出特征矩阵channel

 Depthwise Separable Conv 深度可分卷积

由两部分组成 DW卷积 + PW卷积(Pointwise Conv)

PW卷积类似于普通卷积(只不过卷积核的大小=1)

 与普通卷积的参数比较

三、MobileNet V1网络

网络模型结构

conv / s2 :表示普通的卷积结构     s2表示步距为2

卷积核参数【高 x 宽 x 输入特征矩阵的深度 x 卷积核个数】

conv dw / s1: 表示dw卷积 步距为1   因为dw卷积的卷积核深度为1,所以只有输出特征矩阵的深度。

整个模型类似于VGG网络,将一系列卷积串行链接

统计数据

 table8:比较了三个网络的准确率、运算量、模型参数。可以看出MobileNet在准确率只下降了0.9%的情况下,运算量和模型参数都大大减小。

控制卷积层卷积核个数的超参数 \alpha:table6中数据显示,卷积核的个数下降,准确率、运算量、模型参数都会下降。根据自己的项目需求去选择\alpha

控制图像输入大小的超参数 \beta:table7中数据显示,适当的减小输入图像的大小,能够保证准确率降低很少的前提下,来大幅减少运算量。根据项目需求自己设定

有时候dw卷积不起作用,在MobileNet V2版本中会有一定的改善。 

四、MobileNet V2 网络

网络亮点 :

1、Inverted Residuals(倒残差结构)

2、Linear Bottlenecks

倒残差结构:

正常的残差结构:先降维,经过卷积后,再升维,中间使用 relu 激活函数

倒残差结构:先升维,经过DW卷积,再降维,中间使用 relu6 激活函数。

relu6 激活函数 

relu激活函数:当输入值为0时,默认值置为0;大于0时,不进行处理。

relu6激活函数:当输入值小于0时,默认值为0;

                          大于0小于6时,不进行处理,

                          大于6时,将值全部置为6.

 倒残差结构图

最后一层采用Linear线性激活。

表格数据中的 t 为扩展因子。

表格中第二层输出为步距的 s 分之一 倍

不是每一个倒残差结构都有shortcut捷径,只有当stride=1且输入特征矩阵与输出特征矩阵的shape相同时才会有shortcut链接。

V2 网络结构参数

t :扩展因子,第一层 1 x 1 的卷积层所采用的卷积核的扩展倍率 t

bottleneck :论文中指的是倒残差结构

步距:后面的数值只是每一个block对应的第一层的bottleneck的步距,剩下的步距都为1.

最后的卷积层相当于全连接层 

五、MobileNet V3 网络

 

论文下载链接https://github.com/WZMIAOMIAO/deep-learning-for-image-processing/tree/master/article_link 

 更新了block

增加了SE注意力机制

注意力机制 

对得到的每一个特征矩阵进行池化处理,再通过两个全连接层得到输出向量。第一个全连接层的channel等于输出特征矩阵的 1/4 ,第二个全连接层的节点个数与输出的节点个数保持一致。

对于输出的向量是是对特诊矩阵的每一个channel分析出了一个权重关系,认为比较重要的channel赋予更大的权重,不是那么重要的channel赋予一个比较小的权重。

NL:非线性激活函数

重新设计耗时层结构 

 用  h - sigmoid 激活函数代替sigmoid函数,得到 h - swish 激活函数

 

 网络结构

NL表示激活函数

exp size 通过1 x 1 升维升到多少维的参数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1674506.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么防止源代码防泄密

随着数字化时代的到来,源代码作为企业和个人的重要资产之一,承载着无价的知识和创新。然而,源代码泄露已成为当今信息安全领域的重要挑战之一,给企业带来了严重的经济损失和声誉风险。面对这一挑战,我们有责任加强对源…

亿级流量系统架构设计与实战

💂 个人网站:【 摸鱼游戏】【神级代码资源网站】【工具大全】🤟 一站式轻松构建小程序、Web网站、移动应用:👉注册地址🤟 基于Web端打造的:👉轻量化工具创作平台💅 想寻找共同学习交…

【火热征稿~~】2024年心理、哲学与历史国际会议(ICPPH 2024)

2024年心理、哲学与历史国际会议(ICPPH 2024) 2024 International Conference on Psychology, Philosophy, and History 【会议简介】 2024年心理、哲学与历史国际会议将于历史文化名城武汉召开。此次盛会集结了来自世界各地的心理学家、哲学家和历史学…

01软件下载安装和P解

凯哥英语视频 软件下载安装和P解 凯哥英语视频1.官网直接下,专业版安装不会有人不会吧实在下载不到就去我这百度云吧结语 1.官网直接下,专业版 点击前往逛网下载https://www.jetbrains.com/pycharm/ 下载专业版,奶茶外卖都能点,只…

【爬虫】爬取股票数据写入数据库并显示(四)

本文所涉及代码已全部打包上传,需要可以到文章末尾查看获取方式,免费,仅做学习交流!!! 股票客户端软件 2024/05,本文主要内容如下: 使用python requests爬取东方财富官网数据。将爬…

ros1版本apollo感知融合算法

apollo.ros-7.0.0 本文章针对apollo 7.0.0版本进行了ros1移植,具体介绍见下文。 PS:项目开发详细了解可在评论区留言。 ros版本apollo7.0.0感知算法 基于ros1的apollo 7.0.0感知融合算法。 简介 此项目基于ros1的apollo 7.0.0感知融合算法&#xff0…

05. 【Java教程】第一个 Java 程序

本节我们将以Windows操作系统为例,编写并执行第一个Java程序。在这之前,请确保你的操作系统上已经安装了JDK 1. 编译程序 大家可能有个疑问,为什么需要编译程序呢?计算机不能直接执行我们编写的源代码吗? 这是由于计…

OV SSL证书的特点

OV SSL证书,全称为Organization Validation SSL Certificate(组织验证型SSL证书),是一种中级的SSL证书类型。与仅验证域名所有权的DV(Domain Validation)证书不同,OV证书在颁发前会执行更加严格…

Jmeter接口测试之参数化

在接口测试中,某些时候一些场景会使用到参数化的场景,参数化简单的说就是同一个请求需要不同的数据,比如在性能测试中需要并发多个用户的场景,这样的目的是为了模拟真实的用户场景,需要模拟不同的账号,这里…

ZL-016D多通道小鼠主动跑轮系统主要研究动物生活节律

简单介绍: 多通道小鼠主动跑轮系统是由动物本身自发运动来推动跑轮转动。在这种构型中,笼内动物长期活动的信息,如跑轮转动方向、转数、累计总行程等,能够使用编码器进行长度计记录。此装置由转轮组件、笼体、以及转动方向速度传…

独享静态IP:跨境网络新助手

在数字化浪潮席卷全球的今天,互联网已成为人们生活中不可或缺的一部分。而在这个由数据和信息构成的虚拟世界里,IP地址作为每一个网络设备的独特标识,其重要性不言而喻。特别是独享静态IP,它不仅为用户提供了更加稳定、安全的网络…

美国加州正测试ChatGPT等生成式AI,在4大部门应用

5月11日,美联社消息,美国加州政府正在测试ChatGPT等生成式AI,应用在税收和收费管理部、交通部、公共卫生部以及卫生与公众服务部4大部门。 测试时间6个月,为其提供技术支持的一共有5家公司,分别是OpenAI、Anthropic、…

【北京迅为】《iTOP-3588开发板从零搭建ubuntu环境手册》-第2章 获取并安装Ubuntu操作系统

RK3588是一款低功耗、高性能的处理器,适用于基于arm的PC和Edge计算设备、个人移动互联网设备等数字多媒体应用,RK3588支持8K视频编解码,内置GPU可以完全兼容OpenGLES 1.1、2.0和3.2。RK3588引入了新一代完全基于硬件的最大4800万像素ISP&…

下载文件名称乱码或变成了随机码

如图 后端是有正常返回附件名称的,浏览器开发工具中也正常显示了这个数据,但是下载下来的文件名称确实一堆随机码. 其实这个问题的原因是因为跨域 查看console: Refused to get unsafe header "content-disposition" 现象,后端传递到前端的fileName不能被识别,下载…

Sass语法介绍-混合指令

08 【Sass语法介绍-混合指令】 1.前言 混合指令在 Sass 中也是一个比较常用的指令,在前面我们讲解的内容中有编写过混合指令 mixin ,本节我们将详细讲解混合指令 mixin 的语法包括定义混合指令和引用混合指令等等,混合指令同样非常好用&…

期权隐含波动率到底是什么意思?

今天期权懂带你了解期权隐含波动率到底是什么意思?期权隐含波动率解析。通俗的说,期权隐含波动率是在期权市场中买家和卖家对于,某一期权合约价格变动幅度大小的判断。 期权隐含波动率到底是什么意思? 隐含波动率是根据期权市场价…

财务分析软件怎么选?看这篇就够了

怎么才能选到一款真正能够用于财务分析的软件?且是能够又快又直观地将财务数据情况分析清楚,从不同角度灵活分析财务数据背后的关联的软件,简单来说那得选一款BI财务分析软件。具体哪款BI财务分析软件更合适?那就要从以下几个方面…

Java 程序员必备的 15 个框架集

Java 程序员方向太多,且不说移动开发、大数据、区块链、人工智能这些,大部分 Java 程序员都是 Java Web/后端开发。那作为一名 Java Web 开发程序员必须需要熟悉哪些框架呢? d8f18202405131220599753.png 1.Spring 毫无疑问,Spri…

创建存储过程

查询语句 DDL CREATE TABLE student (id INT PRIMARY KEY AUTO_INCREMENT,createDate DATE NOT NULL,phone VARCHAR(20) NOT NULL,age INT NOT NULL,sex ENUM(男, 女) NOT NULL,introduce TEXT NOT NULL,userName VARCHAR(50) NOT NULL ); DML INSERT INTO student (create…

边缘计算安全有多重要

德迅云安全研究发现边缘安全是对存储或处理在网络边缘的数据的保护。边缘可以用不同的方式定义,但一般来说,它包括企业直接控制之外的任何设备或位置。这可能包括传感器、连接物联网的设备和移动设备。 边缘计算正在彻底改变商业运作方式。这引发了对边缘…