主干网络backbone讲解—— Conv4与Resnet12

news2025/12/26 4:26:23

1 Conv4

在一些论文中，也称为Conv-64F。其中“64F”表示网络中使用了64个滤波器（filters）

它包含 4 个重复的卷积块，在每个块中包含：

一个 kernel=3，stride=1，padding=1的卷积层；
一个 BatchNorm层；
一个 ReLU ；
一个大小为 2 的最大池化层。

输入图像的大小调整为 3 × 84 × 84 ，经过第一个卷积块后channel从3变成64。

有些论文还会在最后添加一个大小为5的全局最大池化层以降低嵌入的维数，大大减少后期转换的计算负担。

四个卷积块如图所示：
在这里插入图片描述

四个卷积块是相同的，图像shape的变化过程

图像经过第一个卷积块之后，3 × 84 × 84变成64 × 42 × 42（2 × 2最大池化）；
经过第二个卷积块之后，变成64 × 21 × 21;
第三个卷积块输出64 × 10 × 10;
第四个卷积块输出64 × 5 × 5。

经过5 × 5的最大池化后则输出64 × 1 × 1，再按照channel展平为64维。

第一个卷积块如下如图所示：
在这里插入图片描述

在最后的卷积层之后，Conv-64F还包括一个全连接层，用于将特征图转换为分类输出。全连接层的输出经过softmax函数激活，得到最终的分类结果。

总体来说，Conv-64F主干网络是一个相对简单的卷积神经网络结构，但在许多图像分类和目标识别任务中已经表现出良好的性能。

Resnet12

Resnet12包含4个残差块，每个残差块有3个卷积层。“12”表示一共有12个卷积层；
一个残差块包含，如图(a)：

kernel=3, stride=1, padding=1的卷积层+ Batchnorm层+ leakyReLU层；
kernel=3, stride=1, padding=1的卷积层+ Batchnorm层+ leakyReLU层；
kernel=3, stride=1, padding=1的卷积层+Batchnorm层；
下采样层包含kernel=1, stride=1, padding=0的卷积层+ Batchnorm层;
最后再经过leakyReLU层，2 × 2的最大池化层，以及使用DropBlock防止过拟合。

在这里插入图片描述

图像shape的变化过程

图像经过第一个残差块之后，3 × 84 × 84变成64 × 42 × 42（2 × 2最大池化）；
经过第二个残差块之后，变成160 × 21 × 21;
第三个残差块输出320 × 10 × 10;
第四个残差块输出640 × 5 × 5。
经过5 × 5的平均池化后输出640 × 1 × 1，使用DropBlock防止过拟合，再按照channel展平为640维。

ResNet12被广泛应用于图像分类、目标检测和语义分割等任务中，其具有优秀的性能和较低的计算复杂度，即可以有效地解决深度神经网络中的梯度消失和梯度爆炸问题，并且可以在保持较小计算量的同时实现高精度的分类。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/413156.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

jquery中的ajax方法怎样通过JSONP进行远程调用

jquery中的ajax方法怎样通过JSONP进行远程调用

关于JSONP的概念以及为什么要使用JSONP您可以参考JSONP教程，本文的重点在于演示下在JQUERY中的Ajax方法怎样通过JSONP进行远程调用。 $.ajax的参数首先介绍下$.ajax的参数： type：请求方式 GET/POST url:请求地址 async:布尔类型&#xff…

阅读更多...

第十四届蓝桥杯大赛软件赛省赛 C/C++ 大学 A 组题解+个人总结

第十四届蓝桥杯大赛软件赛省赛 C/C++ 大学 A 组题解+个人总结

提示：此题解为本人自己解决，如有差错请大家多多指正。文章目录题解总结一、幸运数1.试题2.解法3.代码二、[有奖问答](https://blog.csdn.net/A2105153335/article/details/130038980?spm1001.2014.3001.5501)三、[平方差](https://blog.csdn.net/A2105…

阅读更多...

spring 随笔 ioc/di 4-Bean生命周期钩子

spring 随笔 ioc/di 4-Bean生命周期钩子

0. RUN，或8RUN，是每年都会思考的问题 Spring框架后置处理器PostProcessor详解 BeanDefinitionRegistryPostProcessor 扩展接口动态注册bean AOP的高级特性targetSource AnnotationAwareAspectJAutoProxyCreator#postProcessBeforeInstantiation源码解析…

阅读更多...

第五十九章线段树（二）

第五十九章线段树（二）

第五十九章线段树（二）一、懒标记（lazy_tag）1、作用2、思路二、结构体定义三、带有懒标记的函数操作1、pushup函数2、build函数3、modify函数4、pushdown函数5、query函数四、代码一、懒标记（lazy_tag） 1、…

阅读更多...

redis五大基本数据类型之（源码分析）

redis五大基本数据类型之（源码分析）

redis五大数据结构StringHashsetListZset总结String String 是最基本的 key-value 结构，key 是唯一标识，value 是具体的值，value其实不仅是字符串， 也可以是数字（整数或浮点数），value 最多可以…

阅读更多...

远程桌面连接是什么？远程桌面连接使用教程

远程桌面连接是什么？远程桌面连接使用教程

有时候电脑出现各类网络连接、网址访问出错问题，自己无法解决的情况下，常常会求助其他擅长IT的同事或朋友，要么自己通过社交工具在线沟通、要么抱着电脑找人家解决。然而，通过远程桌面完全可以让朋友同事远程帮自己查看电脑问题&a…

阅读更多...

永远加载不满的进度条

永远加载不满的进度条

前言各位开发大佬，平时肯定见到过这种进度条吧，一直在加载，但等了好久都是在99% 如下所示：有没有好奇这个玩意儿咋做的呢？细听分说 （需要看使用：直接看实践即可） fake-progress …

阅读更多...

亚马逊云科技Serverless Data：数字经济下的创新动能

亚马逊云科技Serverless Data：数字经济下的创新动能

Serverless时代已经到来！企业的技术架构，总是伴随着不断增长的数据与日趋复杂的业务持续演进。如何通过构建更易用的技术架构来聚焦在业务本身，而不必在底层基础设施的管理上投入过多的精力，是数据驱动型企业需要思考的重要议题。…

阅读更多...

实操| 前端新人无敲代码开发APP

实操| 前端新人无敲代码开发APP

作为一种大型的基于GPT-3. 5结构的语言模型，ChatGPT由OpenAI训练，采用深度学习技术，通过大量的文本数据学习，可以生成类似于人类自然语言的文字。ChatGPT是一种非常强大的对话引擎，能进行对话、回答问题和完成任务。Ch…

阅读更多...

数据库锁原理

数据库锁原理

数据库锁原理锁的定义InnoDB中的锁模式共享锁独占锁共享意向锁和独占意向锁LOCK_AUTO_INC自增锁INNODB_AUTOINC_LOCK_MODEInnoDB中的锁类型表锁行锁行子类型LOCK_REC_NOT_GAP精准行锁LOCK_GAP行GAP锁LOCK_ORDINARY行NEXT-KEY锁LOCK_INSERT_INTENTION插入意向锁锁的定义为了体…

阅读更多...

数据分析之Matplotlib 基础入门

数据分析之Matplotlib 基础入门

目录第一章什么是Matplotlib 常见图表及其分类 Matplotlib 第一个绘图程序第二章 Matplotlib 基础 Matplotlib 图表常用设置颜色设置线条样式和标记样式画布设置设置坐标轴标题设置坐标轴刻度设置坐标轴范围设置网格线设置文本标签和标题添加图例添…

阅读更多...

Image Deconvolution with the Half-quadratic Splitting Method

Image Deconvolution with the Half-quadratic Splitting Method

Image Deconvolution with the Half-quadratic Splitting Method 在处理图像重建或者逆问题的时候，我们经常会看到一种称为 Half-quadratic Splitting（HQS）的方法，这是在优化领域里非常经典的一种方法，之前也断断续续…

阅读更多...

【Cesium 编程第一篇】概述、环境搭建、界面介绍

【Cesium 编程第一篇】概述、环境搭建、界面介绍

年前年后一直在面试，发现一个奇怪的现象：很多互联网公司经受住三年的疫情冲击，反而在疫情放开的那一刻撑不住了，很多大厂都在批量的裁员：美国硅谷、北京字节、迪士尼中国等等。在北京的朋友也是年后到现在一直没有找到…

阅读更多...

AI是一场革命，我真不是在跟风

AI是一场革命，我真不是在跟风

AI是场革命，好像现在很多人都开始这么说，那么我说我不是在跟风，为什么？不好意思，又要翻翻旧贴 -> AI是一场革命，不要笑，我是认真的。2016年我就这样讲了，就如我常说的&#xff0c…

阅读更多...

【《中国工业经济》论文复刻】“一带一路”倡议与中国企业升级

【《中国工业经济》论文复刻】“一带一路”倡议与中国企业升级

数据和变量描述本部分介绍文章研究所使用的数据和关键变量。数据来源：自主整理时间范围：2012-2017年变量说明： 相关变量见下表。一. 摘要近年来，中国应该如何实现产业升级受到学界的广泛关注，产业升级归根…

阅读更多...

Widows下安装Nginx并设置开机自启

Widows下安装Nginx并设置开机自启

1 下载Nginx 下载地址：http://nginx.org/en/download.html 2 启动Nginx nginx的启动方式有两种：一种是直接点击nginx.exe启动，另一种是通过命令行启动 2.1 直接启动找到nginx目录，双击nginx.exe 即可启动 2.2 命令行启动…

阅读更多...

不卷不成魔，新时代的IT人员更需要卷，不卷不成活

不卷不成魔，新时代的IT人员更需要卷，不卷不成活

简介从2022年开始至今，IT界发生了很多巨大的变革带来了许多巨大的变化。这些变革、这些变化导致了有人欢喜有人悲、有人迷茫有人焦虑。1年半来，迷茫、焦虑、精神内耗了也都差不多了，大家都已经认识到了现实，作为凡人的我们所能…

阅读更多...

Moviepy模块之多图拼接为一个动图

Moviepy模块之多图拼接为一个动图

文章目录前言项目场景项目素材1.jpg2.jpg3.jpg项目代码1. 引入库2. 读取存储图片的文件夹3. 获取文件夹中所有的.jpg结尾的图片文件名4. 按照文件名排序5. 读取所有图片并拼接成动图6. 保存动图问题描述原因分析解决方案最终效果前言大家好，我是空空star&#xff0…

阅读更多...

《花雕学AI》16：BingGPT桌面端的另外一个惊喜—完美整合了新Bing的AI作画功能

《花雕学AI》16：BingGPT桌面端的另外一个惊喜—完美整合了新Bing的AI作画功能

你是否曾经想过，如果你能用语言描述你想要的画面，就能让AI为你生成一幅美丽的图画，那该有多好？你是否曾经想过，如果你能在桌面端直接与新Bing进行智能、流畅、有趣的对话，而不需要打开浏览器或安装插件&…

阅读更多...

好看的html登录界面，

好看的html登录界面，

界面效果： 代码： <!DOCTYPE html> <html><head><title>Login Page</title><style>body {background-color: #f2f2f2;font-family: Arial, sans-serif;}form {background-color: #fff;border-radius: 5px;box-shado…

阅读更多...

推荐文章

最新文章