主干网络backbone讲解—— Conv4与Resnet12

news2024/10/6 4:13:35

1 Conv4

在一些论文中,也称为Conv-64F。其中“64F”表示网络中使用了64个滤波器(filters)

它包含 4 个重复的卷积块,在每个块中包含:

  • 一个 kernel=3,stride=1,padding=1的卷积层;
  • 一个 BatchNorm层;
  • 一个 ReLU ;
  • 一个大小为 2 的最大池化层。

输入图像的大小调整为 3 × 84 × 84 ,经过第一个卷积块后channel从3变成64。

有些论文还会在最后添加一个大小为5的全局最大池化层以降低嵌入的维数,大大减少后期转换的计算负担。

四个卷积块如图所示:
在这里插入图片描述

四个卷积块是相同的,图像shape的变化过程

  1. 图像经过第一个卷积块之后,3 × 84 × 84变成64 × 42 × 42(2 × 2最大池化);

  2. 经过第二个卷积块之后,变成64 × 21 × 21;

  3. 第三个卷积块输出64 × 10 × 10;

  4. 第四个卷积块输出64 × 5 × 5。

    经过5 × 5的最大池化后则输出64 × 1 × 1,再按照channel展平为64维。

第一个卷积块如下如图所示:
在这里插入图片描述

在最后的卷积层之后,Conv-64F还包括一个全连接层,用于将特征图转换为分类输出。全连接层的输出经过softmax函数激活,得到最终的分类结果。

总体来说,Conv-64F主干网络是一个相对简单的卷积神经网络结构,但在许多图像分类和目标识别任务中已经表现出良好的性能。

Resnet12

Resnet12包含4个残差块,每个残差块有3个卷积层。“12”表示一共有12个卷积层;
一个残差块包含,如图(a):

  • kernel=3, stride=1, padding=1的卷积层+ Batchnorm层+ leakyReLU层;
  • kernel=3, stride=1, padding=1的卷积层+ Batchnorm层+ leakyReLU层;
  • kernel=3, stride=1, padding=1的卷积层+Batchnorm层;
  • 下采样层包含kernel=1, stride=1, padding=0的卷积层+ Batchnorm层;
  • 最后再经过leakyReLU层,2 × 2的最大池化层,以及使用DropBlock防止过拟合。

在这里插入图片描述

图像shape的变化过程

  1. 图像经过第一个残差块之后,3 × 84 × 84变成64 × 42 × 42(2 × 2最大池化);
  2. 经过第二个残差块之后,变成160 × 21 × 21;
  3. 第三个残差块输出320 × 10 × 10;
  4. 第四个残差块输出640 × 5 × 5。
  5. 经过5 × 5的平均池化后输出640 × 1 × 1,使用DropBlock防止过拟合,再按照channel展平为640维。

ResNet12被广泛应用于图像分类、目标检测和语义分割等任务中,其具有优秀的性能和较低的计算复杂度,即可以有效地解决深度神经网络中的梯度消失和梯度爆炸问题,并且可以在保持较小计算量的同时实现高精度的分类。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/413156.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jquery中的ajax方法怎样通过JSONP进行远程调用

关于JSONP的概念以及为什么要使用JSONP您可以参考JSONP教程,本文的重点在于演示下在JQUERY中的Ajax方法怎样通过JSONP进行远程调用。 $.ajax的参数 首先介绍下$.ajax的参数: type:请求方式 GET/POST url:请求地址 async:布尔类型&#xff…

第十四届蓝桥杯大赛软件赛省赛 C/C++ 大学 A 组题解+个人总结

提示:此题解为本人自己解决,如有差错请大家多多指正。 文章目录题解总结一、幸运数1.试题2.解法3.代码二、[有奖问答](https://blog.csdn.net/A2105153335/article/details/130038980?spm1001.2014.3001.5501)三、[平方差](https://blog.csdn.net/A2105…

spring 随笔 ioc/di 4-Bean生命周期钩子

0. RUN,或8RUN,是每年都会思考的问题 Spring框架后置处理器PostProcessor详解 BeanDefinitionRegistryPostProcessor 扩展接口 动态注册bean AOP的高级特性targetSource AnnotationAwareAspectJAutoProxyCreator#postProcessBeforeInstantiation源码解析…

第五十九章 线段树(二)

第五十九章 线段树(二)一、懒标记(lazy_tag)1、作用2、思路二、结构体定义三、带有懒标记的函数操作1、pushup函数2、build函数3、modify函数4、pushdown函数5、query函数四、代码一、懒标记(lazy_tag) 1、…

redis五大基本数据类型之(源码分析)

redis五大数据结构StringHashsetListZset总结String String 是最基本的 key-value 结构,key 是唯一标识,value 是具体的值,value其实不仅是字符串, 也可以是数字(整数或浮点数),value 最多可以…

远程桌面连接是什么?远程桌面连接使用教程

有时候电脑出现各类网络连接、网址访问出错问题,自己无法解决的情况下,常常会求助其他擅长IT的同事或朋友,要么自己通过社交工具在线沟通、要么抱着电脑找人家解决。然而,通过远程桌面完全可以让朋友同事远程帮自己查看电脑问题&a…

永远加载不满的进度条

前言 各位开发大佬,平时肯定见到过这种进度条吧,一直在加载,但等了好久都是在99% 如下所示:有没有好奇这个玩意儿咋做的呢?细听分说 (需要看使用:直接看实践即可) fake-progress …

亚马逊云科技Serverless Data:数字经济下的创新动能

Serverless时代已经到来!企业的技术架构,总是伴随着不断增长的数据与日趋复杂的业务持续演进。如何通过构建更易用的技术架构来聚焦在业务本身,而不必在底层基础设施的管理上投入过多的精力,是数据驱动型企业需要思考的重要议题。…

实操| 前端新人无敲代码开发APP

作为一种大型的基于GPT-3. 5结构的语言模型,ChatGPT由OpenAI训练,采用深度学习技术,通过大量的文本数据学习,可以生成类似于人类自然语言的文字。ChatGPT是一种非常强大的对话引擎,能进行对话、回答问题和完成任务。Ch…

数据库锁原理

数据库锁原理锁的定义InnoDB中的锁模式共享锁独占锁共享意向锁和独占意向锁LOCK_AUTO_INC自增锁INNODB_AUTOINC_LOCK_MODEInnoDB中的锁类型表锁行锁行子类型LOCK_REC_NOT_GAP精准行锁LOCK_GAP行GAP锁LOCK_ORDINARY行NEXT-KEY锁LOCK_INSERT_INTENTION插入意向锁锁的定义 为了体…

数据分析之Matplotlib 基础入门

目录 第一章 什么是Matplotlib 常见图表及其分类 Matplotlib 第一个绘图程序 第二章 Matplotlib 基础 Matplotlib 图表常用设置 颜色设置 线条样式和标记样式 画布设置 设置坐标轴标题 设置坐标轴刻度 设置坐标轴范围 设置网格线 设置文本标签和标题 添加图例 添…

Image Deconvolution with the Half-quadratic Splitting Method

Image Deconvolution with the Half-quadratic Splitting Method 在处理图像重建或者逆问题的时候,我们经常会看到一种称为 Half-quadratic Splitting(HQS)的方法,这是在优化领域里非常经典的一种方法,之前也断断续续…

【Cesium 编程第一篇】概述、环境搭建、界面介绍

年前年后一直在面试,发现一个奇怪的现象:很多互联网公司经受住三年的疫情冲击,反而在疫情放开的那一刻撑不住了,很多大厂都在批量的裁员:美国硅谷、北京字节、迪士尼中国等等。在北京的朋友也是年后到现在一直没有找到…

AI是一场革命,我真不是在跟风

AI是场革命,好像现在很多人都开始这么说,那么我说我不是在跟风,为什么?不好意思,又要翻翻旧贴 -> AI是一场革命,不要笑,我是认真的。2016年我就这样讲了,就如我常说的&#xff0c…

【《中国工业经济》论文复刻】“一带一路”倡议与中国企业升级

数据和变量描述 本部分介绍文章研究所使用的数据和关键变量。 数据来源:自主整理 时间范围:2012-2017年 变量说明: 相关变量见下表。 一. 摘要 近年来,中国应该如何实现产业升级受到学界的广泛关注,产业升级归根…

Widows下安装Nginx并设置开机自启

1 下载Nginx 下载地址:http://nginx.org/en/download.html 2 启动Nginx nginx的启动方式有两种:一种是直接点击nginx.exe启动,另一种是通过命令行启动 2.1 直接启动 找到nginx目录,双击nginx.exe 即可启动 2.2 命令行启动…

不卷不成魔,新时代的IT人员更需要卷,不卷不成活

简介 从2022年开始至今,IT界发生了很多巨大的变革带来了许多巨大的变化。 这些变革、这些变化导致了有人欢喜有人悲、有人迷茫有人焦虑。1年半来,迷茫、焦虑、精神内耗了也都差不多了,大家都已经认识到了现实,作为凡人的我们所能…

Moviepy模块之多图拼接为一个动图

文章目录前言项目场景项目素材1.jpg2.jpg3.jpg项目代码1. 引入库2. 读取存储图片的文件夹3. 获取文件夹中所有的.jpg结尾的图片文件名4. 按照文件名排序5. 读取所有图片并拼接成动图6. 保存动图问题描述原因分析解决方案最终效果前言 大家好,我是空空star&#xff0…

《花雕学AI》16:BingGPT桌面端的另外一个惊喜—完美整合了新Bing的AI作画功能

你是否曾经想过,如果你能用语言描述你想要的画面,就能让AI为你生成一幅美丽的图画,那该有多好?你是否曾经想过,如果你能在桌面端直接与新Bing进行智能、流畅、有趣的对话,而不需要打开浏览器或安装插件&…

好看的html登录界面,

界面效果&#xff1a; 代码&#xff1a; <!DOCTYPE html> <html><head><title>Login Page</title><style>body {background-color: #f2f2f2;font-family: Arial, sans-serif;}form {background-color: #fff;border-radius: 5px;box-shado…