[神经网络]基干网络之ResNet、MobileNet

news2026/2/27 14:56:29

一、ResNet

①特点

ResNet的深度远比之前的算法深，且不会出现网络退化问题。

Ps.网络退化：网络深度增加反而不如原来的网络。(网络退化 != 过拟合/梯度消失)

②残差块

残差块采用短路连接(Shortcut Connection) / 跳跃连接，拟合的目标由直接最终结果变更为在原输入恒等映射基础上的变化(即残差)

Ps.残差(Residual)：预测值和真实值之间的偏差

在ResNet网络中，多个残差块进行堆叠形成完整的网络结构，解决了退化问题。

若残差块在计算过程中因下采样改变了通道数而与短边维度数不一致(不能直接相加)的处理方法：

1.对短边多出来的通道进行0填充(padding)

2.对短边进行1x1卷积将通道数调整到与F(x)一致

③解决网络退化的机理

1.深层梯度回传流畅：梯度的回传可以沿着短边直接传输，防止梯度消失。

2.传统线性结构网络难以拟合“恒等映射”：弥补了高度非线性造成的不可逆的信息损失（可以让模型自行选择要不要进行更新）

二、MobileNet V1

主要用于嵌入式设备的边缘计算（资源需求较低）

补充阅读：网络轻量化的途径↓

1.压缩已训练好的模型：知识蒸馏、权重量化；剪枝；注意力迁移

2.直接训练轻量化网络

3.加速卷积运算：im2col+GEMM，Winograd，第秩分解

4.硬件部署：Tensorflow-slim / Tensorflow-Lite

①深度可分离卷积

MobileNet由深度可分离卷积堆叠而成；相较于传统卷积，深度可分离卷积可以视为将通道拆分，每个卷积核仅负责一个通道（而不是一个卷积核负责全部通道）；而跨通道信息可由1x1通道进行补充。

可以总结为：3x3以上卷积仅负责本通道信息；1x1卷积仅负责跨通道信息

深度可分离卷积 = 深度卷积(depthwise conv) + 逐点卷积(pointwise conv)

深度卷积(depthwise conv)

逐点卷积(pointwise conv)

MobileNet的深度卷积和逐点卷积的组合方式如下图所示（先DepthWise在PointWise）

深度可分离卷积是分组卷积的特例。分组卷积：一个卷积核只负责一部分特征图的卷积

深度可分离卷积也可以用在其他基干网络中提高计算参数效率（如ResNet）。

②空间可分离卷积

相对于深度可分离卷积而言，将一个卷积分解为两个不对称卷积。如将一个3x3卷积分解为一个1x3卷积和一个3x1卷积。

但就效率而言，空间可分离卷积并不如深度可分离卷积来得多。

③深度可分离卷积对参数量、计算量的影响

对标准卷积而言：（ $D_K$ 为卷积核边长）

乘法计算量： $(D_K\cdot Dk\cdot M)\cdot(N\cdot D_F\cdot D_F)$

$(D_K\cdot Dk\cdot M)$ 是一次卷积的乘法次数； $(N\cdot D_F\cdot D_F)$ 是特征图的元素个数

参数量： $D_K\cdot D_K \cdot M \cdot N$

而对于深度可分离卷积而言：

乘法计算量： $(D_K \cdot D_K)\cdot (M\cdot D_F\cdot D_F)+M\cdot (N\cdot D_F\cdot D_F)$

$D_K\cdot D_K$ 为一次卷积的乘法次数; $N\cdot D_F \cdot D_F$ 和 $N\cdot D_F \cdot D_F$ 为特征图的元素个数，M为通道数

参数量为： $D_K \cdot D_K \cdot M+1\cdot1\cdot M\cdot N$

相较于标准卷积而言,MobileNet的计算量和参数量均为原网络的 $\frac{1}{N}+\frac{1}{D^2_K}$

其次MobileNet还提供了两个超参数：α-网络宽度（控制卷积核个数）； $\rho$ -输入图像分辨率，所有的M，N都要乘以α，所有 $D_F$ 都要乘以 $\rho$

③深度可分离卷积模块

相较于左边的标准卷积，深度可分离卷积将一个3x3卷积拆分成一个1x1卷积，并在中间加入了BN层和ReLu层。

三、MobileNet V2

MobileNet V1存在以下缺陷：①没有残差连接；②很多DepthWise卷积核训练出来都是0（卷积核权重数量和通道数量太少；ReLu；低精度）

相较于MobileNet V1而言，V2使用了逆残差结构和线性瓶颈结构。

MobileNet V2的操作顺序如下：先以1x1卷积升维（6倍）；再在高维度使用深度可分离卷积；最后用1x1卷积降维（降维后使用线性激活函数而非MobileNet V1的ReLu6激活函数）。同时添加了残差结构（下采样(首个卷积步长为2)的模块不具备残差连接）

MobileNet V2和ResNet虽然都有残差结构，但结构上有显著的区别：

①ResNet先降维后升维，MobileNet V2先升维后降维

↑所谓的逆残差结构

②ResNet使用标准卷积，MobileNet V2使用了深度可分离卷积

③ResNet使用ReLu激活函数，MobileNet V2使用ReLu6激活函数

④ResNet全部是非线性激活(ReLu)，MobileNet V2降维时使用的是线性激活函数

⑤ResNet的残差连接的是两个高维向量，MobileNet V2连接的是两个低维向量

ReLu6激活函数

相较于原版ReLu函数（1为最大值），ReLu6为了改善低精度下的表示能力，将上限设置为6。

MobileNet V2由16个逆残差模块堆叠而成。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/365590.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

2023年2月初某企业网络工程师面试题【建议收藏】

2023年2月初某企业网络工程师面试题【建议收藏】

拓扑图如下，主机A与主机B能互相通信，但是A不能ping通RA的F0接口，这是为什么？RA上f0接口上配置了ACL，禁止源ip为主机A，目的ip为RA f0的数据包的发送； 第一个路由器上只有到主机B网段的路由&#…

阅读更多...

MFCCA多通道多说话人语音识别模型上线魔搭（ModelScope）

MFCCA多通道多说话人语音识别模型上线魔搭（ModelScope）

实验室研发的基于多帧跨通道注意力机制（MFCCA）的多说话人语音识别模型近日上线魔搭（ModelScope）社区，该模型在AliMeeting会议数据集上获得当前最优性能。欢迎大家下载。开发者可以基于此模型进一步利用ModelScope的微调…

阅读更多...

【Python】文本转语音库pyttsx3

【Python】文本转语音库pyttsx3

一、语音输出 1、安装文本转换语音库pyttsx3 安装指令： pip install pyttsx3 2、导入pyttsx3库后，调用speak函数即可进行语音播放。 import pyttsx3 #语音播放 pyttsx3.speak("How are you?") pyttsx3.speak("I am fine, thank yo…

阅读更多...

成都欢蓬电商：抖音直播卖药灰度测试通告

成都欢蓬电商：抖音直播卖药灰度测试通告

据报道，近日有MCN机构透露，目前抖音直播卖药为“测试项目，谨慎试跑中”; “仍处于灰度测试，至于测试多久，抖音官方确实没有答复，需要看第一阶段数据，然后定夺，预计4月份会纳入更多机…

阅读更多...

第八章《嵌入式系统原理与实践》--沈建华王慈清华大学出版社课后部分习题个人答案

第八章《嵌入式系统原理与实践》--沈建华王慈清华大学出版社课后部分习题个人答案

第八章 1，2，3，4，6，7，9，12 1 什么是串行通信、并行通信？ 按一次传输数据位个数区分串行通信并行通信是数据是一位一位地由端口发送或接收数据的各个数据位（一般为 8 位…

阅读更多...

「TCG 规范解读」初识 TPM 2.0 库续二

「TCG 规范解读」初识 TPM 2.0 库续二

可信计算组织（Ttrusted Computing Group,TCG）是一个非盈利的工业标准组织，它的宗旨是加强在相异计算机平台上的计算环境的安全性。TCG于2003年春成立，并采纳了由可信计算平台联盟（the Trusted Computing Platform Alli…

阅读更多...

手写一个文件上传demo

手写一个文件上传demo

背景最近闲来无事，同事闻了一下上传文件的基本操作，如何用文件流来实现一个文件的上传功能基本概念流（Stream）是指在计算机的输入输出操作中各部件之间的数据流动。可以按照数据传输的方向，将流可分为输入流和输出…

阅读更多...

Vue3：有关v-model的用法

Vue3：有关v-model的用法

目录前言： 回忆基本的原生用法： 原生input的封装： 自定义v-model参数： 对el-input的二次封装： 多个v-model进行绑定: v-model修饰符： v-model自定义参数与自定义修饰符的结合： 前言&am…

阅读更多...

Java 网络编程 Ⅰ

Java 网络编程 Ⅰ

目录基础知识IP 和 Portinternet（互联网）Java UDP 编程UDP（User Datagram Protocol）：无连接无状态的数据报通讯协议实现Java TCP 编程TCP（Transmission Control Protocol）：面向连接的…

阅读更多...

XSS注入进阶练习篇（三） XSS原型链污染

XSS注入进阶练习篇（三） XSS原型链污染

XSS原型链污染1.原型链的概念1.1 构造函数的缺点1.2 prototype 属性的作用1.3 原型链1.4 constructor属性1.5 prototype和__proto__2. 原型链污染2.1 原型链污染是什么？2.2 原型链污染的条件2.3 原型连污染实例2.3.1 hackit 20182.3.2 challenge-04223.总结1.原型链…

阅读更多...

Java跳槽涨薪之路-想学Java的赶紧上车了

Java跳槽涨薪之路-想学Java的赶紧上车了

前言Java 是近 10 年来计算机软件发展过程中的传奇，在很多开发者心中的地位可谓“爱不释手”，与其他一些计算机语言随着时间的流逝影响也逐渐减弱不同，Java 随着时间的推移反而变得更加强大。按应用范围，Java 可分为 3 个体系&…

阅读更多...

【Unity3D】空间和变换

【Unity3D】空间和变换

1 空间 1.1 左右手坐标系及其法则 1.1.1 左右手坐标系左手坐标系与右手坐标系Unity 局部空间、世界空间、裁剪空间、屏幕空间都采用左手坐标系，只有观察空间采用右手坐标系。左右手坐标系除了坐标系朝向（旋向性）不同，还存在以…

阅读更多...

顶象APP加固的“蜜罐”技术有什么作用

目录蜜罐有很多应用模式蜜罐技术让App加固攻守兼备顶象端加固的三大功能为了捕获猎物，猎人会在设置鲜活的诱饵。被诱惑的猎物去吃诱饵时，就会坠入猎人布置好的陷阱，然后被猎人擒获，这是狩猎中常用的一种手段。在业务安全防…

阅读更多...

自动化测试框架设计

自动化测试框架设计

大数据时代，多数的web或app产品都会使用第三方或自己开发相应的数据系统，进行用户行为数据或其它信息数据的收集，在这个过程中，埋点是比较重要的一环。埋点收集的数据一般有以下作用： 驱动决策：ABtest、漏…

阅读更多...

华为OD机试用Python实现 -【微服务的集成测试】(2023-Q1 新题)

华为OD机试用Python实现 -【微服务的集成测试】(2023-Q1 新题)

华为OD机试300题大纲参加华为od机试，一定要注意不要完全背诵代码，需要理解之后模仿写出，通过率才会高。华为 OD 清单查看地址：blog.csdn.net/hihell/category_12199275.html 华为OD详细说明：https://dream.blog.csdn.net/article/details/128980730 微服务的集成测试…

阅读更多...

信号的运算与变换

信号的运算与变换

目录前言本章内容介绍信号的运算与变换相加相乘时移反折尺度变换微分（差分） 积分（累加） 信号的奇偶求解信号的实虚分解合适的例题 1、时移反折 2、时移尺度 3、时移反折尺度 4、反求x(t) 前言《信号…

阅读更多...

gma 1.1.3 (2023.02.22) 更新日志

gma 1.1.3 (2023.02.22) 更新日志

（实际版本日期：2023.02.14） 重要更新： 从本版本开始， gma 开始支持 Python 3.11！ 新增： 1、map 增加【AddDataSetDiscrete】添加离散型栅格数据集绘制功能。 2、math a、添加 Stretch 数据…

阅读更多...

2023年PMP考试应该注意些什么？

2023年PMP考试应该注意些什么？

首先注意（报考条件） 2023年PMP考试报名流程： 一、PMP英文报名： 英文报名时间无限制，随时可以报名，但有一年的有效期，所以大家尽量提前报名，在英文报名有效期内进行中文报名。英…

阅读更多...

儿童饰品发夹发卡出口美国办理什么认证？

儿童饰品发夹发卡出口美国办理什么认证？

亚马逊美国站上传新产品，很多时候都是需要类目审核的，后台给出要求提供认证，产品类目不同，所需要提供的认证证书是不一样，儿童产品需要提交的是CPC认证，玩具，母婴用品，儿童书包&…

阅读更多...

前端面试题整理之HMTL篇（二）

前端面试题整理之HMTL篇（二）

HTML面试题（二） 前言： 面试题及答案解析，大部分来自网络整理，我自己做了一些简化，内容有很多部分已经重复，解释也有些乱，大家带着自己的思考去看，整理自己的语言&#x…

阅读更多...

推荐文章

最新文章