【计算机视觉 | CNN】Image Model Blocks的常见算法介绍合集(一)

news2024/11/14 20:45:19

文章目录

    • 一、Residual Block
    • 二、Bottleneck Residual Block
    • 三、Dense Block
    • 四、Squeeze-and-Excitation Block
    • 五、Inception Module
    • 六、Non-Local Block
    • 七、Spatial Attention Module
    • 八、Spatial Transformer
    • 九、ResNeXt Block
    • 十、Fire Module
    • 十一、Inception-v3 Module
    • 十二、PnP
    • 十三、Channel Attention Module
    • 十四、Wide Residual Block
    • 十五、Axial Attention

图像模型块是用于图像模型(例如卷积神经网络)的构建块。 您可以在下面找到不断更新的图像模型块列表。

一、Residual Block

残差块是跳过连接块,它参考层输入学习残差函数,而不是学习未引用的函数。 它们是作为 ResNet 架构的一部分引入的。

在这里插入图片描述
直觉是,优化残差映射比优化原始的、未引用的映射更容易。 在极端情况下,如果恒等映射是最优的,则将残差推至零比通过一堆非线性层拟合恒等映射更容易。 跳过连接可以让网络更轻松地学习类似身份的映射。

请注意,在实践中,瓶颈残差块用于更深的 ResNet,例如 ResNet-50 和 ResNet-101,因为这些瓶颈块的计算强度较低。

在这里插入图片描述

二、Bottleneck Residual Block

瓶颈残差块是残差块的一种变体,它利用 1x1 卷积来创建瓶颈。 瓶颈的使用减少了参数和矩阵乘法的数量。 这个想法是使残差块尽可能薄以增加深度并具有更少的参数。 它们是作为 ResNet 架构的一部分引入的,并用作更深层次 ResNet(例如 ResNet-50 和 ResNet-101)的一部分。

在这里插入图片描述

三、Dense Block

密集块是卷积神经网络中使用的模块,它将所有层(具有匹配的特征图大小)直接相互连接。 它最初被提议作为 DenseNet 架构的一部分。 为了保持前馈性质,每个层从所有前面的层获取额外的输入,并将其自己的特征图传递到所有后续层。 与 ResNet 相比,我们在将特征传递到层之前从不通过求和来组合特征; 相反,我们通过连接特征来组合它们。

在这里插入图片描述
在这里插入图片描述

四、Squeeze-and-Excitation Block

挤压和激励模块是一个架构单元,旨在通过使其能够执行动态通道特征重新校准来提高网络的表示能力。 其过程是:

该块有一个卷积块作为输入。
使用平均池将每个通道“压缩”为单个数值。
ReLU 后面的密集层增加了非线性,并且输出通道复杂性按比例降低。
另一个密集层后面跟着一个 sigmoid 函数,为每个通道提供平滑的门控函数。
最后,我们基于侧网络对卷积块的每个特征图进行加权; “兴奋”。

在这里插入图片描述

五、Inception Module

Inception 模块是一个图像模型块,旨在近似 CNN 中的最佳局部稀疏结构。 简而言之,它允许我们在单个图像块中使用多种类型的滤波器大小,而不是仅限于单个滤波器大小,然后将其连接并传递到下一层。

在这里插入图片描述

六、Non-Local Block

非局部块是神经网络中使用的图像块模块,它包装了非局部操作。 我们可以将非本地块定义为:
在这里插入图片描述
在这里插入图片描述

七、Spatial Attention Module

空间注意力模块是卷积神经网络中用于空间注意力的模块。 它利用特征的空间关系生成空间注意力图。 与通道注意力不同,空间注意力关注哪里是信息丰富的部分,这与通道注意力是互补的。 为了计算空间注意力,我们首先沿着通道轴应用平均池化和最大池化操作并将它们连接起来以生成有效的特征描述符。

在这里插入图片描述
在这里插入图片描述

八、Spatial Transformer

空间变换器是一个图像模型块,它明确允许在卷积神经网络中对数据进行空间操作。 它使 CNN 能够根据特征图本身主动进行空间变换,无需任何额外的训练监督或对优化过程进行修改。 与感受野是固定且局部的池化层不同,空间变换器模块是一种动态机制,可以通过为每个输入样本生成适当的变换来主动对图像(或特征图)进行空间变换。 然后在整个特征图上(非局部)执行变换,并且可以包括缩放、裁剪、旋转以及非刚性变形。

在这里插入图片描述
在这里插入图片描述

九、ResNeXt Block

ResNeXt 块是一种残差块,用作 ResNeXt CNN 架构的一部分。 它使用类似于 Inception 模块的“拆分-转换-合并”策略(单个模块内的分支路径),即它聚合了一组转换。 与残差块相比,它暴露了一个新的维度,基数(转换集的大小)C,作为深度和宽度之外的一个重要因素。

在这里插入图片描述
在这里插入图片描述

十、Fire Module

Fire 模块是卷积神经网络的构建块,特别是用作 SqueezeNet 的一部分。 Fire 模块由以下部分组成:挤压卷积层(仅具有 1x1 滤波器),输入混合有 1x1 和 3x3 卷积滤波器的扩展层。 我们在 Fire 模块中公开了三个可调维度(超参数):

在这里插入图片描述
在这里插入图片描述

十一、Inception-v3 Module

Inception-v3 Module是Inception-v3架构中使用的图像块。 该架构用于最粗糙的 (8 × 8) 网格,以促进高维表示。

在这里插入图片描述

十二、PnP

PnP(或 Poll 和 Pool)是 DETR 类型架构的采样模块扩展,可自适应地分配其计算空间以提高效率。 具体来说,PnP模块将图像特征图抽象为精细的前景对象特征向量和少量的粗略背景上下文特征向量。 转换器对细-粗特征空间内的信息交互进行建模,并将特征转换为检测结果。

在这里插入图片描述

十三、Channel Attention Module

通道注意力模块是卷积神经网络中基于通道的注意力的模块。 我们通过利用特征的通道间关系来生成通道注意力图。 由于特征图的每个通道都被视为特征检测器,因此通道注意力集中在给定输入图像的情况下“什么”是有意义的。 为了有效地计算通道注意力,我们压缩输入特征图的空间维度。

在这里插入图片描述
请注意,仅具有平均池化的通道注意模块与挤压和激励模块相同。

在这里插入图片描述

十四、Wide Residual Block

宽残差块是一种残差块,它利用两个 3x3 卷积层(带有 dropout)。 这比残差块的其他变体(例如瓶颈残差块)更宽。 它被提议作为 WideResNet CNN 架构的一部分。

在这里插入图片描述

十五、Axial Attention

轴向注意力是自注意力的简单概括,它在编码和解码设置中自然地与张量的多个维度对齐。 它首先在 CCNet [1] 中提出,称为十字注意力,它收集其十字路径上所有像素的上下文信息。 通过进一步的循环操作,每个像素最终可以捕获全图像的依赖关系。 Ho等人[2]扩展了CCNet来处理多维数据。 所提出的层结构允许在解码期间并行计算绝大多数上下文,而无需引入任何独立性假设。 它是为高维数据张量(例如 Axial Transformers)开发基于自注意力的自回归模型的基本构建块。 它已在 AlphaFold [3] 中应用于解释蛋白质序列。

[1] 黄子龙,王兴刚,黄立超,黄昌,魏云超,刘文宇。 CCNet:语义分割的十字交叉注意力。 国际商业CV协会,2019。

[2] 乔纳森·何 (Jonathan Ho)、纳尔·卡尔奇布伦纳 (Nal Kalchbrenner)、德克·韦森博恩 (Dirk Weissenborn)、蒂姆·萨利曼 (Tim Salimans)。 arXiv:1912.12180

[3] Jumper J、Evans R、Pritzel A、Green T、Figurnov M、Ronneberger O、Tunyasuvunakool K、Bates R、Žídek A、Potapenko A、Bridgland A。使用 AlphaFold 进行高精度蛋白质结构预测。 自然。 2021 年 7 月 15:1-1。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1012974.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构与算法(C语言版)P2---线性表之顺序表

前景回顾 #mermaid-svg-sXTObkmwPR34tOT4 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-sXTObkmwPR34tOT4 .error-icon{fill:#552222;}#mermaid-svg-sXTObkmwPR34tOT4 .error-text{fill:#552222;stroke:#552222;}#…

拥有这个中文版CustomGPT,你也能定制自己的AI问答机器人

人工智能技术的快速发展为各行各业带来了前所未有的机会,其中之一就是定制化的问答机器人。这些机器人可以用于客户支持、知识管理、虚拟助手等多个领域,帮助企业提高效率,提供更好的用户体验。很多人可能都知道通过CustomGPT能够设计自己的人…

Golang使用sqlx报错max_prepared_stmt_count超过16382

文章目录 背景mysql的预处理查看实例预处理详情com_stmt_prepare开启performance_schema 本地查看预处理语句 预处理语句飙升的原因生成预处理语句但是不close执行sql过程中发生错误 go服务分析抓包分析发送给mysql的包debug查看预处理细节sqlx发送statement command指令sqlx关…

伦敦银时走势与获利机会

交易时间灵活、资金杠杆充沛是伦敦银交易的主要优势,投资者应该充分利用这个品种的制度优势,结合自己个人的作息时间,在工作、投资与生活三者之间取得平衡的前提下,借助国际白银市场的波动,通过交易逐步实现自己的财富…

外贸电商商品如何做好上架工作?

跨境电商业务的蓬勃发展已经成为互联网行业的热点话题之一。不论是将海外货源卖回国内,还是通过国内货源销往海外,跨境电商平台都面临着如何实现商品上架的关键问题。在这篇文章中,将探讨成功上架商品的关键步骤。 一、准备好接口。 跨境电商…

【LangChain系列 10】Prompt模版——Message的partial用法

原文地址:【LangChain系列 10】Prompt模版——Message的partial用法 本文速读: 字符串partial 方法partial partial是什么意思呢?简单来说:将一个prompt模版传入部分变量值而生成一个新的prompt模版,当使用新的promp…

小技巧!Python生成excel文件的三种方式!

在我们做平常工作中都会遇到操作excel,那么今天写一篇,如何通过python操作excel。当然python操作excel的库有很多,比如pandas,xlwt/xlrd,openpyxl等,每个库都有不同的区别,具体的区别&#xff0…

递归路由,怎么递归的?BGP4+

问题 R2上去往5::5的递归路由怎么生成的??? BGP4路由表 Destination : 5:: PrefixLength : 64 NextHop : 4::4 Preference : 255 Cost : …

sed命令在Mac和Linux下的不同

问题 &#xff08;1&#xff09;Windows系统里&#xff0c;文件每行结尾是<回车><换行>, \r\n &#xff08;2&#xff09;Mac系统里&#xff0c; 文件每行结尾是<回车>&#xff0c;即\r &#xff08;3&#xff09;Unix系统里&#xff0c; 文件每行…

Sleuth--链路追踪

1 链路追踪介绍 在大型系统的微服务化构建中&#xff0c;一个系统被拆分成了许多模块。这些模块负责不同的功能&#xff0c;组合成系统&#xff0c;最终可以提供丰富的功能。在这种架构中&#xff0c;一次请求往往需要涉及到多个服务。互联网应用构建在不同的软件模块集上&…

Python技巧---tqdm库的使用

文章目录 一、tqdm基本知识二、在pytorch中使用tqdm 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、tqdm基本知识 “tqdm” 是一个 Python 库&#xff0c;用于在命令行界面中创建进度条。 基本使用如下&#xff1a; from tqdm import tqdm impor…

linux安装nacos2.2.0

1、使用docker拉取镜像&#xff1a;docker pull nacos/nacos-server:v2.2.0 2、下载官方配置文件&#xff1a;https://github.com/alibaba/nacos/releases 3、修改配置文件的数据库连接信息&#xff0c;修改完成后将配置文件移至挂载目录/home/shixp/docker/nacos/conf&#xf…

无涯教程-JavaScript - ISNONTEXT函数

描述 如果指定的值引用的不是文本,则ISNONTEXT函数将返回逻辑值TRUE。否则返回FALSE。如果该值引用空白单元格,则该函数返回TRUE。 语法 ISNONTEXT (value)争论 Argument描述Required/OptionalvalueValue or expression or a reference to a cell.Required Notes 您可以在…

Echarts 饼图的详细配置过程

文章目录 饼图 简介配置步骤简易示例 饼图 简介 Echarts饼图是Echarts中常用的一种图表类型&#xff0c;也是数据可视化中常用的一种形式。饼图通过扇形的方式展示数据的比例和占比关系。 Echarts饼图的特点如下&#xff1a; 直观的数据占比展示&#xff1a;饼图通过不同大小…

Fast-MVSNet CVPR-2020 学习笔记总结 译文 深度学习三维重建

文章目录 6 Fast-MVSNet CVPR-20206.0 主要特点6.1 网络介绍6.2 稀疏高分辨率深度图预测6.3 深度图扩展6.4 -Newton 精细化MVSNet系列最新顶刊 对比总结6 Fast-MVSNet CVPR-2020 深度学习三维重建 Fast-MVSNet-CVPR-2020(源码、原文、译文、批注) 下载 6.0 主要特点 Spare …

数据结构与算法(三)--栈

一、前言 前两篇文章我们学习了第一个数据结构&#xff0c;数组&#xff0c;且从底层通过java实现了数组的构建和增删改查的操作功能&#xff0c;并且通过resize操作使我们的数组可以动态的扩容或者缩容。且我们知道数组最大的优点就是在索引有语义的情况下&#xff0c;查询和…

VS2013任意一个项目配置Tiff环境

1.包含目录库目录 2.链接器输出tiff.lib 3.文件夹里放一些东西

北邮22级信通院数电:Verilog-FPGA(1)实验一“跑通第一个例程” 过程中遇到的常见问题与解决方案汇总(持续更新中)

北邮22信通一枚~ 跟随课程进度更新北邮信通院数字系统设计的笔记、代码和文章 持续关注作者 迎接数电实验学习~ 获取更多文章&#xff0c;请访问专栏&#xff1a; 北邮22级信通院数电实验_青山如墨雨如画的博客-CSDN博客 目录 问题一&#xff1a;Verilog代码没有跑通 报…

如何维护物流中心电力系统?这个方法太炸裂了

物流中心是现代供应链管理中的关键环节之一&#xff0c;它承担着货物存储、分拣和分发的任务。而物流中心的正常运营离不开可靠的电力供应。 配电柜&#xff0c;作为电力系统的关键组成部分&#xff0c;负责分配电能到各个设备和区域&#xff0c;因此其运行状态至关重要。为了确…

Docker核心原理与实操

第一章、Docker基本概念 1、概念&#xff1a;Docker是一种容器技术&#xff0c;可以解决软件跨环境迁移问题。 2、实现原理&#xff1a;是一个分层复用的文件系统&#xff1b;每一层都是一个独立的软件&#xff1b; …