英文论文(sci)解读复现【NO.17】旋转至参加:卷积三重注意力模块

news2024/11/23 19:29:00
此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文,并对相应的SCI期刊进行介绍,帮助大家解答疑惑,助力科研论文投稿。解读的系列文章,本人会进行 创新点代码复现,有需要的朋友可关注私信我获取。

  一、摘要

由于注意力机制能够建立通道或空间位置之间的相互依赖关系,近年来,人们对注意力机制进行了广泛的研究,并在各种计算机视觉任务中得到了广泛的应用。本文研究了轻量化但有效的注意机制,提出了一种利用三分支结构捕获跨维相互作用来计算注意权值的新方法——三重注意。对于一个输入张量,三重注意通过旋转操作和残差变换建立维度间的依赖关系,并以可以忽略不计的计算开销对通道间和空间信息进行编码。我们的方法简单而高效,可以很容易地插入到经典骨干网作为
一个附加模块。我们证明了我们的方法在各种具有挑战性的任务上的有效性,包括在ImageNet-1k上的图像分类和在MSCOCO和PASCAL VOC数据集上的目标检测。此外,我们通过可视化检查GradCAM和GradCAM++的结果,对三重注意的表现提供了广泛的见解。我们方法的经验评估支持我们的直觉,即在计算注意力权重时,跨维度捕获依赖关系的重要性。本文的代码可以在https://github上公开访问。

二、网络模型及核心创新点

 1.重新审视CBAM的渠道关注

2.三重注意

  三、实验效果(部分展示)

在本节中,我们将详细介绍实验和结果,这些实验和结果证明了三重注意的性能和效率,并将其与之前提出的在几个具有挑战性的计算机视觉任务(如 ImageNet-1k[7]分类和PASCAL VOC[8]和MS COCO[22]数据集上使用标准网络架构(如 ResNet-50[12]和MobileNetV2[27])上的注意机制进行比较。

为了进一步验证我们的结果,我们为样本图像提供 Grad-CAM[28]和Grad-CAM++[3]结果,以展
示三重注意捕捉更确定性特征丰富表示的能力。所有 ImageNet 模型使用 8 个 Nvidia Tesla V100 gpu 进行训练,所有对象检测模型使用 4 个Nvidia Tesla P100 gpu 进行训练。我们没有观察到基线模型和那些增加了三重注意的模型之间的总壁时间有任何实质性的差异。

(1)消融实验

我们通过消融实验进一步验证了交叉维度相互作用的重要性影响分支的三重注意模块。在表 5中,空间关闭表示第三个分支(输入张量未进行排列)被关闭,通道关闭表示涉及输入张量排列的两个分支被关闭。如图所示,结果支持了我们的直觉,即三重注意的所有三个分支都被打开,表示全部,比普通版本和它的两个对应版本表现一致。

  (2)图像网络

为了训练基于ResNet[12]的模型,我们在每个瓶颈块的末尾添加了三重注意层。为了与其他方法进行一致和公平的比较,我们采用了精确的训练配置[12,14]。类似地,我们遵循[27]的方法来训练我们的基于MobileNetV2的架构。经过验证的体系结构的结果如下表5所示。

 四、实验结论

在本工作中,我们提出了一种新的注意层——三重注意,它捕捉张量中跨维度特征的重要性。三重注意是一种高效的注意计算方法,不存在任何信息瓶颈。我们的实验证明了这三联体注意提高了架构的基线性能,如 ResNet 和MobileNet 的任务,如 ImageNet 上的图像分类和MS COCO上的对象检测,而只引入最小的计算开销。
希望在计算注意力时,其他新的、健壮的获取跨维度依赖关系的技术可以改善我们的结果,同时降低成本。未来,我们计划研究在更复杂的架构(如Ef- fiicientnets[31])中添加三重注意的效果,并扩展我们在3D视觉领域的直觉。

注:论文原文出自Rotate to Attend: Convolutional Triplet Attention Module本文仅用于学术分享,如有侵权,请联系后台作删文处理。

解读的系列文章,本人已进行创新点代码复现,有需要的朋友欢迎关注私信我获取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/606233.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Elasticsearch第一天学习笔记

目录 一、Elasticsearch概述 二、elasticsearch入门 一、Elasticsearch概述 (一)elasticsearch是什么? The Elastic Stack, 包括 Elasticsearch 、 Kibana 、 Beats 和 Logstash (也称为 ELK Stack )。 Elaticsear…

数据库之主键、联合主键

参考文章:数据库之主键、联合主键 一、主键、联合主键简介 数据库主键是用来标记数据记录唯一性的列,不能为空,不能重复。 主键具有的特点:唯一性、非空性。 数据库联合主键:可以将多个列同时作为主键。&#xff0…

SQL语句之DQL语言

说明:DQL(Data Query Language,数据查询语言),用来查询数据库表中的记录。有的书中,会把DQL语言放入到DML(Data Manipulation Language,数据操作语言:数据的增删改&#…

金融数据获取:通过Ajax跳转的网页怎么爬?以东方财富基金净值数据为例

你是否碰到过点击网站上的按钮或链接,网页数据进行了刷新,但浏览器上显示的网址却没有任何变化的情况,这其实就是利用Ajax跳转的网页。本期笔者将以东方财富网为例展示如何获取Ajax跳转的网页内容,本文主要内容如下: 目…

MyBatis(多表查询,动态SQL的使用)

目录 多表查询 查询文章详情 查询一个用户底下的所有文章 动态SQL的使用 if 标签 trim 标签 where 标签 set 标签 foreach 标签 多表查询 现在有俩张表,一张是文章表,一张是用户表.如下: 查询文章详情 我们现在想查询得到一张表,表里面的内容和文章表大多一致,只是要在…

银行从业资格证(初级) 5天零基础拿证攻略【个人经历,亲测】

我的科目:《法律法规》、《个人理财》 方法 直接做真题,做真题错题总结归纳。 教材可买可不买,时间不够可以不看教材。 可以买天一金融的真题汇编,它附赠一个考点整理的小册子。 一定要自己整理知识框架。 看个人习惯选择网上做…

chatgpt赋能python:Python列表中随机抽取6个元素的简单方法

Python列表中随机抽取6个元素的简单方法 在Python编程中,列表是一种常用的数据类型,它允许我们存储和操作一系列数据。有时候,我们需要从列表中随机抽取一些元素,比如从一组名字中随机选择几个人参加抽奖等。本文将介绍如何使用P…

MIT 6.824 lab distributed system 分布式系统

https://youtu.be/cQP8WApzIQQ 概念 为什么需要分布式系统? high performanceparallelism:分布式系统可以实现CPU、内存、硬盘的并行运行fault tolerancephysical:security / isolated 分布式系统的困难 concurrency:各个并行的…

【unity小技巧】使用贝塞尔曲线实现导弹随机攻击敌人,也可以用于拾取物品

文章目录 先看效果代码实现1.导弹代码2.玩家生成导弹代码3.玩家挂载代码4.导弹挂载代码先看效果 代码实现 1.导弹代码 记得配置敌人为enemy标签 using System.Collections; using System.Collections.Generic; using

Nautilus Chain:独特且纯粹的创新型 Layer3

以 Layer3 架构为主要特点的模块化公链 Nautilus Chain 即将在近期上线主网,这也进一步引发了行业关于 Layer3 的讨论。 实际上,在2022年以太坊的创始人 Vitalik 提出了三大目标:Layer2 用于扩展,Layer3 用于定制功能,…

Transformer模型原理—论文精读

文章目录 前言模型架构Encoder和DecoderEncoderDecoder AttentionFFNEmbeddings和Positional EncodingEmbeddingsPositional Encoding 总结 前言 今天来看一下Transformer模型,由Google团队提出,论文名为《Attention Is All You Need》。论文地址。 正如…

Openwrt_XiaoMiR3G路由器_刷入OpenWrt

刷入Openwrt之前请保证小米R3G路由器已经刷入Breed控制台固件。 刷入Breed请参考: Openwrt_XiaoMiR3G路由器_刷入Breed固件 路由器具体配置参考 小米路由器3G参数 - 小米商城 既然要刷入OpwnWrt就需要线编译固件,使用lede的OpenWrt源码编译。 进入 …

K8S集群安装(二)

目录 1 安装说明.... 1 1.1 安装环境.... 1 1.2 生产环境可部署Kubernetes集群的两种方式.... 2 1.3 操作系统初始化配置.... 3 2 安装Docker/kubeadm/kubelet【所有节点】.... 4 2.1 安装Docker. 4 2.2 添加阿里云YUM软件源.... …

《Apollo 智能驾驶进阶课程》

来自 : https://www.bilibili.com/video/BV1G341117NQ/ https://apollo.baidu.com/ 主要学习资源如下: Apollo社区公众号,直接有整个视频教程的微信推文教程:链接一个CSDN博主记录的笔记: https://blog.csdn.net/qq_45…

08 redis经典五种数据类型及底层实现

redis是字典数据库KV键值对是什么 redis 是 key-value 存储系统,其中key类型一般为字符串,value 类型则为redis对象(redisObject)Redis定义了redisObjec结构体来表示string、hash、list、set、zset等数据类型 C语言struct结构体语法简介Redis 中每个对象…

【华为机试】死记硬背没思路?一般人我劝你还是算了吧

大家好,我是哪吒。 五月份之前,如果你参加华为OD机试,收到的应该是2022Q4或2023Q1,这两个都是A卷题。 5月10日之后,很多小伙伴收到的是B卷,那么恭喜你看到本文了,抓紧刷题吧。B卷新题库正在更…

Spring依赖注入解析

目录 依赖注入大致要点 依赖注入大致流程 Bean的预实例化 doGetBean createBean 完备Bean的创建过程 createBeanInstance populateBean 依赖注入大致要点 Spring在Bean实例的创建过程中做了很多精细化控制finishBeanFactoryInitialization方法里面的preInstantiateSing…

【计算机网络复习】第六章 局域网 LAN

局域网( LAN)概述 LAN的特点 • 覆盖范围小 房间、建筑物、园区范围 • 高传输速率 10Mb/s~1000Mb/s • 低误码率 10-8 ~ 10-11 • 拓扑:总线型、星形、环形 • 介质:UTP、Fiber、C…

6年测试经验之谈,为什么要做自动化测试?

一、自动化测试 自动化测试是把以人为驱动的测试行为转化为机器执行的一种过程。 个人认为,只要能服务于测试工作,能够帮助我们提升工作效率的,不管是所谓的自动化工具,还是简单的SQL 脚本、批处理脚本,还是自己编写…