关于ResNet和FPN的一份介绍

关于ResNet和FPN的一份介绍

news2025/4/19 10:05:52

在这篇文章中我将介绍ResNet和FPN这两个深度学习中重要的技术。

一、ResNet-50/101

首先我们先来看ResNet技术：

1.1 概述

ResNet技术是基于残差学习，引入Bottleneck技术以及Shortcut Connection技术，而去解决神经网络中的退化问题。

1.2 主要思想

在这个技术中，主要有三种思想，即残差映射、Bottleneck结构以及通道调整。

残差映射：

首先我们知道残差就是指预期输出与实际输出之间的差值，如果用x表示实际输出，H(x)表示预期输出，那么可以得到残差的表达式为：

$F(x)=H(x)-x$

而残差映射就是指通过跳跃连接（Skip Connection）将输入 x 直接传递到后续层，并与经过神经网络层后的结果相加的过程。

Bottleneck结构：

所谓Bottleneck结构就是指这样的三个过程，首先是1*1卷积降维，然后通过3*3卷积特征提取，最后进行1*1卷积升维。我们可以这样理解，就是我们要开着载货卡车通过安检，为了正常和较快的通过，我们首先卸下一部分的货物，然后对于其中关键货物进行安检，最后安检完成后重新载货出发。

通道调整：

是解决残差块的输入与输出通道数不一致问题的关键技术。当输入特征图（Input）和残差函数（Residual Function）的输出特征图通道数不同时，无法直接通过跳跃连接（Skip Connection）相加，此时需要通过通道调整使二者的维度匹配。其中常用的有两种方法，分别为1*1卷积以及补0操作。

1.3 组成

ResNet的组成有五个阶段，分别为：Conv1、Conv2、Conv3、Conv4、Conv5。其中Conv1是进行卷积以及池化操作，另外四个阶段都是Bottleneck模块。

其中根据Conv4阶段中Bottleneck模块数量的差异分为50层的网络和101层网络，所以得名ResNet-50/101。

二、FPN

2.1 概述

所谓FPN就是基于多尺度融合去构建特征金字塔。其中，它是基于多个层次的，具体有三个层次，分别为：自顶向下、自底向上以及横向连接。这三种层次可以带来不同的好处，分别为保留空间细节、将深层语义信息传递到浅层以及将语义，定位信息融合。

2.2 结构

如果我们把FPN分为两个部分，那么分别就是主干部分以及特征金字塔部分。

其中在主干部分，它是依靠刚才所说的ResNet的，即采用ResNet作为主干网络（如ResNet-50/101），通过逐阶段下采样生成多尺度特征图。

然后在特征金字塔部分，这部分主要有三小部分，先是P5生成，即从主干网络的最高层特征C5出发，通过 1×1卷积调整通道数（例如将2048→256），生成初始的 P5；

然后是逐层采样，通过自顶向下（P5→P4→P3→P2）逐级上采样，并与主干网络的同尺度特征融合；

最后是最终优化部分，即对每个融合后的特征图（P5~P2）施加 3×3卷积。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2337021.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

AI大模型学习九：‌Sealos cloud+k8s云操作系统私有化一键安装脚本部署完美教程

AI大模型学习九：‌Sealos cloud+k8s云操作系统私有化一键安装脚本部署完美教程

一、说明 ‌Sealos‌是一款基于Kubernetes（K8s）的云操作系统发行版，它将K8s以及常见的分布式应用如Docker、Dashboard、Ingress等进行了集成和封装，使得用户可以在不深入了解复杂的K8s底层原理的情况下，快速搭建起一个…

阅读更多...

详解关于VS配置好Qt环境之后但无法打开ui界面

详解关于VS配置好Qt环境之后但无法打开ui界面

目录找到Qt安装目录中designer.exe的路径找到vs中的解决方案资源管理器右键ui文件，找到打开方式点击添加然后把前面designer.exe的路径填到程序栏中，点击确定然后设置为默认值，并点击确定当在vs中配置好Qt环境之后，但…

阅读更多...

$【深度学习与大模型基础】第9章-条件概率以及条件概率的链式法则$

【深度学习与大模型基础】第9章-条件概率以及条件概率的链式法则

简单理解条件概率条件概率就是在已知某件事发生的情况下，另一件事发生的概率。用数学符号表示就是： P(A|B) 在B发生的前提下，A发生的概率。计算机例子：垃圾邮件过滤假设你写了一个程序来自动判断邮件是否是垃圾邮件&#xf…

阅读更多...

STM32-FreeRTOS的详细配置

STM32-FreeRTOS的详细配置

配置FreeRTOS 原文链接：https://ydamooc.github.io/posts/c9defcd/ 1.1 下载FreeRTOS 打开FreeRTOS官网：https://www.freertos.org/ 点击下载，并且选择"FreeRTOS 202212.01"版本，再点击Download按钮下载官方的资源包…

阅读更多...

视觉自回归图像生成：基于多模态大模型的万字深度梳理

视觉自回归图像生成：基于多模态大模型的万字深度梳理

目前利用多模态大模型进行图像生成主要有以下两种形式： LLM作为condtioner：利用MLLM依据用户输入的text prompt来生成条件信息，条件信息被注入到下游生成模型进行更精细化的生成控制。这种形式通常需要外接一个额外专门的多模态生成模型&…

阅读更多...

openssh离线一键升级脚本分享（含安装包）

openssh离线一键升级脚本分享（含安装包）

查看当前的版本 [rootmyoracle ~]#ssh -V相关安装包下载地址 openssh下载地址：http://ftp.openbsd.org/pub/OpenBSD/OpenSSH/portable/openssl下载地址：https://www.openssl.org/source/zlib下载地址：http://www.zlib.net/今天演示从7.4升级…

阅读更多...

音视频之H.265/HEVC预测编码

音视频之H.265/HEVC预测编码

H.265/HEVC系列文章： 1、音视频之H.265/HEVC编码框架及编码视频格式 2、音视频之H.265码流分析及解析 3、音视频之H.265/HEVC预测编码预测编码是视频编码中的核心技术之一。对于视频信号来说，一幅图像内邻近像素之间有着较强的空间相关性,相邻图像之…

阅读更多...

Python异步编程入门：Async/Await实战详解

Python异步编程入门：Async/Await实战详解

引言在当今高并发的应用场景下，传统的同步编程模式逐渐暴露出性能瓶颈。Python通过asyncio模块和async/await语法为开发者提供了原生的异步编程支持。本文将手把手带你理解异步编程的核心概念，并通过实际代码案例演示如何用异步爬虫提升10倍效率&#…

阅读更多...

设计模式每日硬核训练 Day 13：桥接模式（Bridge Pattern）完整讲解与实战应用

设计模式每日硬核训练 Day 13：桥接模式（Bridge Pattern）完整讲解与实战应用

🔄 回顾 Day 12：装饰器模式小结在 Day 12 中，我们学习了装饰器模式（Decorator Pattern）： 强调在不改变原类结构的前提下，动态为对象增强功能。通过“包装对象”实现运行时组合，支…

阅读更多...

库洛游戏一面+二面

库洛游戏一面+二面

目录一面 1. ArrayList和LinkedList的区别，就是我在插入和删除的时候他们在时间复杂度上有什么区别 2. hashmap在java的底层是怎么实现的 3. 红黑树的实现原理 4. 红黑树的特点 5. 为什么红黑树比链表查询速度快 6. 在java中字符串的操作方式有几种 7. Stri…

阅读更多...

XSS攻击（反射型、存储型、dom型、PDF、SWF、SVG）

XSS攻击（反射型、存储型、dom型、PDF、SWF、SVG）

一、XSS攻击是什么 XSS是恶意攻击者往 Web 页面里插入恶意可执行网页脚本代码，当用户浏览该页之时，嵌入其中 Web 里面的脚本代码会被执行，从而可以达到攻击者盗取用户信息或其他侵犯用户安全隐私的目的。二、XSS分类反射型XSS 常见情况是…

阅读更多...

C复习（主要复习）

C复习（主要复习）

指针和数组指针数组是一个数组，数组的每个元素都是指针。它适用于需要存储多个指针的场景，如字符串数组。数组指针是一个指针，指向一个数组。它适用于需要传递整个数组给函数或处理多维数组的场景。函数指针：函数指针的定义需要…

阅读更多...

Ubuntu24.04搭建ESP8266_RTOS_SDK V3.4开发环境

Ubuntu24.04搭建ESP8266_RTOS_SDK V3.4开发环境

【本文发布于https://blog.csdn.net/Stack_/article/details/147194686，未经允许不得转载，转载须注明出处】需要有Linux使用基础，自行准备 1、VM17 Pro （自行搜索教程安装） 2、ubuntu-24.04-desktop-amd64 &#xff0…

阅读更多...

matlab求和∑函数方程编程？

matlab求和∑函数方程编程？

matlab求和∑函数方程编程？ 一题目：求下列函数方程式的和二：代码如下： >> sum_result 0; % 初始化求和变量 for x 1:10 % 设…

阅读更多...

基于Java+MySQL实现的（Web）科研资讯推送系统

基于Java+MySQL实现的（Web）科研资讯推送系统

科研资讯推送系统技术选型核心框架：SpringBoot 数据库层：springdatajpa 安全框架：Shiro 数据库连接池：Druid 缓存：Ehcache 部署阿里云学生机:ecs.n4.small Tomcat:9.0 JDK:1.8 数据库:MySQL8.0 操作系统:CentOS…

阅读更多...

PHP弱类型hash比较缺陷

PHP弱类型hash比较缺陷

目录 0x00 漏洞原因 0x01 利用方法 0x02 [BJDCTF2020]Easy MD5 1 利用md5($password,true)实现SQL注入 PHP md5弱类型比较数组绕过 0x00 漏洞原因 1、在进行比较的时候，会先将两边的变量类型转化成相同的，再进行比较 2、0e在比较的时候会将其认…

阅读更多...

asm汇编源代码之-汉字点阵字库显示程序源代码下载

asm汇编源代码之-汉字点阵字库显示程序源代码下载

汉字点阵字库显示程序源代码下载文本模式下显示16x16点阵汉字库内容的程序(标准16x16字库需要使用CHGHZK转换过后才能使用本程序正常显示) 本程序需要调用file.asm和string.asm中的子程序,所以连接时需要把它们连接进来,如下 C:\> tlink showhzk file string 调用参…

阅读更多...

Excel 中让表格内容自适应列宽和行高

Excel 中让表格内容自适应列宽和行高

Excel 中让表格内容自适应列宽和行高目录 Excel 中让表格内容自适应列宽和行高自适应列宽自适应行高在Excel中让表格内容自适应列宽和行高，可参考以下操作：自适应列宽方法一：手动调整选中需要调整列宽的列（如果是整个表格，可点击表格左上角行号和列号交叉处的三角形全…

阅读更多...

Java使用ANTLR4对Lua脚本语法校验

Java使用ANTLR4对Lua脚本语法校验

文章目录什么是ANTLR？第一个例子ANTLR4 的工作流程Lua脚本语法校验准备一个Lua Grammar文件maven配置生成Lexer Parser Listener Visitor代码新建实体类Lua语法遍历器语法错误监听器单元测试参考什么是ANTLR？ https://www.antlr.org/ ANTLR (ANothe…

阅读更多...

vue3.2 + element-plus 实现跟随input输入框的弹框，弹框里可以分组或tab形式显示选项

vue3.2 + element-plus 实现跟随input输入框的弹框，弹框里可以分组或tab形式显示选项

效果基础用法（分组选项） 高级用法（带Tab栏）   <template><div class"smart-selector-container"><el-popove…

阅读更多...

推荐文章

最新文章