13种即插即用涨点模块分享!含注意力机制、卷积变体、Transformer变体

news2024/11/15 20:54:02

朋友们,你们想发paper的时候有没有被创新点、改模型、改代码折磨过?今天我想分享一个前期又快又省事的方法😆

就是即插即用的模块“缝合”,加入自己的想法快速搭积木炼丹。

这种方法可以简化模型设计,减少冗余工作,帮助我们快速搭建模型结构,不需要从零开始实现所有组件。除此以外,这些即插即用的模块都具有标准接口,意味着我们可以很方便地替换不同的模块进行比较,加快论文实验迭代的速度。

为方便大家理解和运用,这次给大家分享13个非常有用的即插即用模块!这些模块既有特别经典的,也有今年最新的,且原文和代码都有。除了源码,还给大家准备了经过提炼的简洁代码,使用起来更加方便。这些模块涵盖了各种注意力机制、卷积变体、Transformer变体等主题。

扫码关注公众号,回复“156

免费获取论文原文+模块源码


1.GAM 注意力模块

论文:Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions

全局注意力机制:保留信息以增强通道-空间交互

简介:各种注意力机制被研究用以提高不同计算机视觉任务的性能。然而,之前的方法忽略了保留通道和空间两个方面的信息以增强跨维度交互的重要性。因此,论文提出一种全局注意力机制,通过通道和空间双注意力减少信息损失,增强全局特征交互,从而提升视觉任务的性能。

图片

2.STN模块

论文:Spatial Transformer Networks

空间转换器网络

简介:卷积神经网络定义了一个非常强大的模型类,但仍受限于以计算和参数高效的方式对输入数据空间不变性的缺乏能力。在这项工作中,作者引入了一个新的可学习模块,即空间转换器,它明确地允许网络内的数据进行空间操作。该可微分模块可以插入现有的卷积架构中,赋予神经网络主动根据特征图自身对特征图进行空间变换的能力,而无需任何额外的训练监督或优化过程的修改。

图片

3.SENet 通道注意力模块

论文:Squeeze-and-Excitation Networks

挤压和激励网络

简介:卷积神经网络建立在卷积操作之上,通过在局部感受野内融合空间和通道信息来提取有效特征。为了增强网络的表示能力,几种最近的方法展示了增强空间编码的好处。在本文中,作者关注通道关系,并提出了一种新的架构单元“Squeeze-and-Excitation”(SE)模块,它通过明确建模通道之间的依赖关系,自适应地重新校准通道级特征响应。

图片

4.DConv动态卷积

论文:OMNI-DIMENSIONAL DYNAMIC CONVOLUTION

全维动态卷积

简介:全维动态卷积(ODConv)是一种新颖的卷积模块,可以作为常规卷积的直接替代,插入到许多CNN架构中。它利用多维注意力机制,沿卷积核的所有四个维度(空间大小、输入通道数、输出通道数和核数量)学习核的互补注意力,以获得更强的特征表达能力。ODConv可以显著提升各种CNN网络的性能,包括轻量级和大型模型,同时参数量不增。即使只用单核,它也可以匹敌或超过现有的多核动态卷积模块。

图片

5.完全注意力FANs

论文:Understanding The Robustness in Vision Transformers

理解视觉鹅transformer的鲁棒性

简介:最新的研究显示,视觉Transformer(ViTs)在处理各种图像损坏时表现出很强的鲁棒性。尽管这种鲁棒性部分归因于自注意力机制,但我们对其中的工作原理还不是很清楚。论文通过引入全注意力网络(FANs)中的注意力通道模块,加强了自注意力在学习鲁棒特征表示方面的作用。

图片

6.CA注意力

论文:Coordinate Attention for Efficient Mobile Network Design

移动网络设计的协同注意力机制

简介:移动网络中的通道注意力机制通常会忽略空间位置信息,这对生成位置敏感的注意力图很重要。本文提出了一种坐标注意力机制,将位置编码嵌入到通道注意力中,以获得对位置敏感的注意力。它将通道注意力分解成两个方向的1D特征编码,每个方向聚合一维的特征,这样就可以在一个方向上捕获长程依赖,同时在另一个方向保留精确的位置信息。

图片

7.自适应空间特征融合(ASFF)

论文:Learning Spatial Fusion for Single-Shot Object Detection

空间融合模块用于单镜头物体检测的学习

简介:为了处理物体检测中尺度变化的挑战,金字塔特征表示是常见的做法。但是,基于特征金字塔的单阶段检测器,不同尺度特征之间的不一致性是其主要局限。本文提出了一种新颖的数据驱动的金字塔特征融合策略,即自适应空间特征融合。它可以学习空间过滤冲突信息的方式来抑制不一致性,从而提高特征的尺度不变性,并增加很小的推理开销。

图片

扫码关注公众号,回复“156

免费获取论文原文+模块源码

8.全新多尺度融合(CFNet 2023年)

论文:DNET: A CASCADE ENCODER-DECODER NET-WORK FOR DENSE PREDICTION

DNET:用于稠密预测的级联编码器-解码器网络

简介:多尺度特征对稠密预测任务非常重要。现有方法通常在分类骨干网络提取多尺度特征后,采用轻量级模块融合,但因计算资源集中在分类骨干网络,多尺度特征融合往往推迟,导致特征融合不充分。论文提出了一种流线型的级联编码器-解码器网络CEDNet,所有阶段共享编码器-解码器结构,在解码器内进行多尺度特征融合。

9.无参数注意力机制(simAM)

论文:SimAM: A Simple, Parameter-Free Attention Module for Convolutional Neural Networks

SimAM:一种用于卷积神经网络的简单无参数注意力模块

简介:论文提出一个简单高效的卷积神经网络注意力模块SimAM。不同于现有逐通道或空间注意力,SimAM不增加网络参数就可以为层内特征图推断三维注意力。具体来说,作者定义一个能量函数并导出闭式解来发现每个神经元的重要性,用少于10行代码实现。SimAM运算符选择基于能量函数解得出,避免结构调优。

图片

10.卷积三重注意力模块

论文:Rotate to Attend: Convolutional Triplet Attention Module

卷积三元组注意力模块

简介:本文研究了一种轻量级但有效的注意力机制——三元组注意力,它通过三分支结构和旋转操作来捕获输入张量不同维度之间的交互,从而计算注意力权重。该方法可以轻松集成到典型的CNN模型中,对计算和参数量影响很小。

图片

11.Selective Query Recollection(SQR)

论文:Enhanced Training of Query-Based Object Detection via Selective Query Recollection

选择性查询回忆增强了基于查询的目标检测的训练

简介:这篇论文研究了基于查询的目标检测器在最后解码阶段预测错误而在中间阶段预测正确的现象。通过回顾训练过程,作者归因该现象于两个限制:后期阶段缺乏训练强调以及解码顺序导致的级联错误。为此,作者设计了选择性查询回忆(SQR)策略来增强基于查询的目标检测器的训练。该策略累积收集中间查询,并选择性地将其直接输入后期阶段,从而强调后期阶段的训练,并让后期阶段可以直接使用中间查询。

图片

12.CV自动数据增强插件(MedAugment)

论文:MedAugment: Universal Automatic Data Augmentation Plug-in for Medical Image Analysis

医学图像分析的通用自动数据增强插件

简介:本文提出了一个名为MedAugment的可即插即用的数据增强方法,以利用自动的数据增强来推动医学图像分析领域的发展。考虑到自然图像和医学图像的差异,作者将增强空间分为像素增强空间和空间增强空间,并设计了一种新的操作采样策略来从这两个空间中采样增强操作。

图片

13.域泛化语义分割模型

论文:Semantic-Aware Domain Generalized Segmentation

语义感知的域泛化分割

简介:本文提出了一个框架来解决语义分割的域泛化问题,其中分割模型在源域训练后需要在未见的数据分布不同的目标域上进行泛化。该框架包含两个新模块:语义感知正则化(SAN)和语义感知拉伸(SAW)。SAN通过类别级的特征中心对齐来促进不同域之间的域不变性。SAW在已经对齐的特征上施加分布对齐来增强类别间的区分度。

图片


扫码关注公众号,回复“156

免费获取论文原文+模块源码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1713058.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL 数据表的基本操作

文章目录 【 1. MySQL 创建数据表 】【 2. MySQL 查看表 】2.1 DESCRIBE/DESC 以表格的形式展示表2.2 SHOW CREATE TABLE 以SQL语句的形式展示表 【 3. 修改数据表 】3.1 修改表名3.2 修改表字符集3.3 添加字段在末尾添加字段在开头添加字段在中间添加字段 3.3 修改/删除字段修…

【java-数据结构19-队列的模拟实现】

上篇文章,小编已经带大家一起认识了队列,并且对队列的方法进行调用测试,下面我们将模拟实现一个队列,话不多说,上正文~ 1.队列的模拟实现 队列的实现方法和链表的实现方式一模一样,这里我们首选双链表&…

MT2075 礼物

思路: x,y为质数,若x2,y3,则xy的最小公倍数6既不能给A也不能给B。 所以假设共有V个数,在1-V中,可以选的个数为:V-⌊V/(x*y)⌋ 个。(⌊V/(x*y)⌋为V个数中有多少个xy的公倍数) 所以…

股票量化交易上手,一个特别简单却长期可用的交易策略,官方接口

股票实现程序化自动化交易的三个基础:获取数据、执行交易、查询账户。 以后说到策略示例的时候就不介绍接口的基础使用方法了,随便一个策略把过程写出来都会很啰嗦,尽量压缩内容吧,这些内容是面向新手的,大佬们忽略细节…

护眼落地台灯十大知名品牌哪款最好?十大经典落地灯品牌推荐

护眼落地灯十大知名品牌哪款最好?随着快经济时代的到来,人们在学业以及事业上的压力也日益增加,不少朋友反应在日常工作、学习是经常出现眼部疲劳的状况,甚至会时不时出现眼睛干涩、流泪,对学习、工作状态造成了极大的…

【全开源】知识付费问答社区(FastAdmin+ThinkPHP)

此系统是一款基于FastAdmin和ThinkPHP开发的知识付费问答社区系统,提供全部前后台无加密源代码,拥有强大的付费提问、付费阅读、付费查看、付费邀请、全文搜索等功能模块,其整合了强大的标签模块和专区模块,让问题和文章更好的归类…

删除的短信怎么恢复?专业与非专业方法的全面比较

在日常清理手机内存的过程中,我们可能会不小心删除短信。这些短信可能包含重要的数据和联系人信息。面对这种情况,许多人会感到困惑和无助。那么,删除的短信怎么恢复呢?本文将为您全面比较专业与非专业的方法,帮助您找…

【信息学奥赛】两个整型变量的值交换

【信息学奥赛】两个整型变量的值交换 💖The Begin💖点点关注,收藏不迷路💖 编写如下一个函数,用于将两个整型变量的值交换 输入: 两个数 输出: 交换后的两个数 样例输入: 3 2样…

Redis学习篇3:缓存更新策略与数据更新、淘汰策略

一、缓存更新策略 二、主动更新 三、过期策略 3.1 如何知道过期? 3.2 删除策略 四、内存淘汰策略 数据淘汰策略-使用建议 一、缓存更新策略 Redis是基于内存的数据库,它的优点就是在对数据进行操作的时候快,并且通过…

【全开源】驾校管理系统源码(FastAdmin+ThinkPHP)

一款基于FastAdminThinkPHP开发的驾校管理系统,驾校管理系统(DSS)主要面向驾驶学校实现内部信息化管理,让驾校管理者和工作人员更高效、更快捷的完成枯燥无味的工作,让工作更有条理。改变驾校传统的手工或半手工Excel文档管理的工作方式。多驾…

深入探索C++继承机制:从概念到实践的全面指南

目录 继承的概念及定义 继承的概念 继承的定义 定义格式 继承方式和访问限定符 继承基类成员访问方式的变化 默认继承方式 基类和派生类对象赋值转换 继承中的作用域 派生类的默认成员函数 继承与友元 继承与静态成员 继承的方式 菱形虚拟继承 菱形虚拟继承原理 继承…

vue项目关于loading问题

前言 因全局加loading会出现全白屏的遮罩层,影响美观,所以一般考虑局部加loading,比如是表格,表单等就加上loading 解决办法 v-loading“loading” element-loading-background“rgba(255, 255, 255, 0.6)” const loading re…

精酿啤酒:品质与口感在消费者选择中的权重分析

在啤酒市场中,消费者选择的影响因素众多,其中品质与口感是两个核心要素。对于Fendi club啤酒而言,品质与口感的权重分析在消费者选择中显得尤为重要。 品质是消费者选择啤酒的首要因素。随着消费者对啤酒认知的提高,他们对品质的…

论文《Sensor and Sensor Fusion Technology in Autonomous Vehicles: A Review》详细解析

论文《Sensor and Sensor Fusion Technology in Autonomous Vehicles: A Review》详细解析 摘要 该论文对自动驾驶汽车中的传感器和传感器融合技术进行了全面回顾。它评估了各种传感器(如相机、LiDAR、雷达)的能力和技术性能,并讨论了多传感…

c++11特性(详细)

文章目录 前言一、C11介绍二、列表初始化1.{}初始化2.initializer_list 三、auto与decltype四、STL中变化五、右值引用六.C中关于类的新功能七.可变参数模板八.lambda表达式总结 前言 在本篇文章,我们将会详细介绍一下C11新增的一些特性,其中最重要的是…

有1,2,3,4这四个数字,能组成多少个互不相同且无重复数字的三个数?分别是什么?

有1,2,3,4这四个数字,能组成多少个互不相同且无重复数字的三个数?分别是什么? 提示:123,321就是符合要求,数字既不相同,而且每个数字的个十百位也不重复;而121,212就不行&#xff0c…

Facebook海外三不限企业广告账户-Facebook的ROI是什么?

1. 什么是ROI? ROI是指投资回报率(Return on Investment),是衡量投资效益的一种指标。在市场营销领域,ROI是一个非常重要的概念,用于衡量营销活动的效果和价值。它通常用于评估一项投资的效益,即…

获取和设置代理的动态IP的方式

引言 大家好,今天我来给大家分享一下如何通过编程技术来获取和设置代理的动态IP。在网络世界中,代理和动态IP是非常常见的概念,尤其对于需要大规模访问网站或者需要隐藏真实IP地址的应用程序来说,更是必不可少的工具。接下来&…

钛媒体首发 | 百度沈抖回应大模型价格战:希望大家别再天天拉表格比价格

ITValue “有这个时间,不如去卷场景、卷应用。” 作者|张帅 编辑|盖虹达 首发|钛媒体APP ITValue 钛媒体App 5月28日消息,在2024智能经济论坛上,百度集团执行副总裁、百度智能云事业群总裁沈抖介绍了文心系…

视频监控业务平台LntonCVS运用国标协议对接视频汇聚管理综合平台应用方案

为了实现“以信息化推动应急管理能力现代化”的目标,应急管理部提出了加速现代信息技术与应急管理业务深度融合的计划。这一计划是国家加强和改进应急管理工作的关键举措,也是满足日益严峻的应急管理形势和人民群众不断增长的公共安全需求的紧迫需求。 为…