每日Attention学习15——Cross-Model Grafting Module

news2025/1/16 17:53:30
模块出处

[CVPR 22] [link] [code] Pyramid Grafting Network for One-Stage High Resolution Saliency Detection


模块名称

Cross-Model Grafting Module (CMGM)


模块作用

Transformer与CNN之间的特征融合


模块结构

在这里插入图片描述


模块思想

Transformer在全局特征上更优,CNN在局部特征上更优,对这两者进行进行融合的最简单做法是直接相加或相乘。但是,相加或相乘本质上属于"局部"操作,如果某片区域两个特征的不确定性都较高,则会带来许多噪声。为此,本文提出了CMGM模块,通过交叉注意力的形式引入更为广泛的信息来增强融合效果。


模块代码
import torch.nn.functional as F
import torch.nn as nn
import torch


class CMGM(nn.Module):
    def __init__(self, dim, num_heads=8, qkv_bias=True, qk_scale=None):
        super().__init__()
        self.num_heads = num_heads
        head_dim = dim // num_heads
        self.scale = qk_scale or head_dim ** -0.5
        self.k = nn.Linear(dim, dim , bias=qkv_bias)
        self.qv = nn.Linear(dim, dim * 2, bias=qkv_bias)
        self.proj = nn.Linear(dim, dim)
        self.act = nn.ReLU(inplace=True)
        self.conv = nn.Conv2d(8,8,kernel_size=3, stride=1, padding=1)
        self.lnx = nn.LayerNorm(64)
        self.lny = nn.LayerNorm(64)
        self.bn = nn.BatchNorm2d(8)
        self.conv2 = nn.Sequential(
            nn.Conv2d(64,64,kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),
            nn.Conv2d(64,64,kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True)
        )
        
    def forward(self, x, y):
        batch_size = x.shape[0]
        chanel     = x.shape[1]
        sc = x
        x = x.view(batch_size, chanel, -1).permute(0, 2, 1)
        sc1 = x
        x = self.lnx(x)
        y = y.view(batch_size, chanel, -1).permute(0, 2, 1)
        y = self.lny(y)
        
        B, N, C = x.shape
        y_k = self.k(y).reshape(B, N, 1, self.num_heads, C // self.num_heads).permute(2, 0, 3, 1, 4)
        x_qv= self.qv(x).reshape(B,N,2,self.num_heads, C // self.num_heads).permute(2, 0, 3, 1, 4)
        x_q, x_v = x_qv[0], x_qv[1] 
        y_k = y_k[0]
        attn = (x_q @ y_k.transpose(-2, -1)) * self.scale
        attn = attn.softmax(dim=-1)
        x = (attn @ x_v).transpose(1, 2).reshape(B, N, C)

        x = self.proj(x)
        x = (x+sc1)

        x = x.permute(0,2,1)
        x = x.view(batch_size,chanel,*sc.size()[2:])
        x = self.conv2(x)+x
        return x, self.act(self.bn(self.conv(attn+attn.transpose(-1,-2))))
    

if __name__ == '__main__':
    x = torch.randn([1, 64, 11, 11])
    y = torch.randn([1, 64, 11, 11])
    cmgm = CMGM(dim=64)
    out1, out2 = cmgm(x, y)
    print(out1.shape)  # out feature 1, 64, 11, 11
    print(out2.shape)  # cross attention matrix 1, 8, 121, 121

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2074994.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

探索OpenCV:图像处理基础与实践

探索OpenCV:图像处理基础与实践 前言图像读取基础安装OpenCV库读取彩色与灰度图像 RGB颜色模型颜色通道解析单通道图像显示 感兴趣区域(ROI)图像处理进阶技巧图像打码图像组合图像缩放 结语 前言 在当今数字化时代,图像不仅是我们…

Grok-2 mini 性能翻倍,xAI开发团队获马斯克赞赏

硅纪元快讯栏目,每日追踪AI领域的最新动态,快速汇总最新科技新闻,助您时刻紧跟行业趋势。简明扼要的呈现资讯概要,让您快速了解前沿资讯。 1分钟速览新闻 《大都会》预告片风波:AI生成虚假影评人引言 微软图形学专家童…

【hot100篇-python刷题记录】【搜索二维矩阵】

R6-二分查找篇 印象题&#xff0c;直接把它转成一维来处理。 class Solution:def searchMatrix(self, matrix: List[List[int]], target: int) -> bool:nums[i for row in matrix for i in row]def binfind(the,target):low,high0,len(the)-1while low<high:mid(lowhigh…

htb-Beginner Track(轨道)详解

0x01 Lame nmap -sTCV -Pn 10.10.10.3 21端口 开启了ftp服务器&#xff0c;简单来说ftp就是一个供用户上传下载文件的一个文件存储器&#xff0c;通过ftp协议访问。 同时也开启了smb共享&#xff0c;nmap会自动去扫描是否存在游客登陆也就是guest&#xff0c;这里显然并没有开…

TOMCAT全解

目录 一 、WEB技术简介 HTTP协议 B/S 结构 前端三大核心技术简介 HTML CSS JavaScript 二 、WEB框架 web资源和访问 后台应用架构 三、tomacat的介绍 四、tomcat的部署 tomcat的反向代理 tomcat的负载均衡 memcached的安装与启动 tomcat的session会话保持 一 、WE…

入门Java编程的知识点—>面向对象(day07)

重点掌握什么是面向对象&#xff1f;重点掌握面向对象封装的意义&#xff1f;重点掌握类的封装,创建对象,访问对象&#xff1f; 面向对象 OO&#xff1a;&#xff08;Object Oriented&#xff09;面向对象 面向对象是一种编程思想,遵循面向对象设计原则可以写出高质量代码, …

nacos配置发布和服务订阅

nacos安装这里就不说了&#xff0c;官网看即可&#xff0c;以下为单机nacos &#xff08;一&#xff09;nacos客户端 &#xff08;1&#xff09; 配置管理配置列表 点击编辑页面如下&#xff1a; 点击详情页面如下&#xff1a; &#xff08;2&#xff09; 服务管理服务列…

Excel十进制度转为度分秒格式

最近写报告经常需要整理坐标表。 不同的情况往往需要不同的手段来实现。 其中一种情况是&#xff0c;ArcMap以单位度计算坐标字段&#xff0c;然后利用‘表转Excel’工具导出为xls表格。 通过这种方式导出的经纬度坐标是十进制度&#xff0c;比如37.702398675533。 而我需要…

汽车租赁|基于SprinBoot+vue的汽车租赁系统(源码+数据库+文档)

汽车租赁系统 目录 基于SprinBootvue的汽车租赁系统 一、前言 二、系统设计 三、系统功能设计 5.1系统功能模块 5.2管理员功能模块 5.3业务员功能模块 5.4用户功能模块 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&…

探索Git:分布式版本控制系统的力量(二)

&#x1f600;前言 本篇博文是关于分布式版本控制系统Git的一些基本介绍&#xff0c;希望你能够喜欢 &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#xff0c;希望我的文章可以帮助到大家&#xff0c;您的满意是我…

Wemos D1 Mini pro/ nodeMcu / ESP8266 驱动 240*320 ILI9341 SPI液晶屏

Wemos D1 Mini / nodeMcu / ESP8266 驱动 240*320 ILI9341 SPI液晶屏 效果展示器件硬件连接引脚连接原理图引脚对照表 安装TFT_eSPI库TFT_eSPI库中User_Setup.h文件的参数修改User_Setup.h文件的位置User_Setup.h文件中需要修改的参数User_Setup.h完成源码 例程 缘起&#xff1…

Python酷库之旅-第三方库Pandas(100)

目录 一、用法精讲 431、pandas.DataFrame.items方法 431-1、语法 431-2、参数 431-3、功能 431-4、返回值 431-5、说明 431-6、用法 431-6-1、数据准备 431-6-2、代码示例 431-6-3、结果输出 432、pandas.DataFrame.keys方法 432-1、语法 432-2、参数 432-3、功…

【BES2500x系列 -- RTX5操作系统】Battery模块 -- 邮箱线程诞生的第一视角 -- osThreadDef --(十三)

&#x1f48c; 所属专栏&#xff1a;【BES2500x系列】 &#x1f600; 作  者&#xff1a;我是夜阑的狗&#x1f436; &#x1f680; 个人简介&#xff1a;一个正在努力学技术的CV工程师&#xff0c;专注基础和实战分享 &#xff0c;欢迎咨询&#xff01; &#x1f49…

如何用短链接提高内容传播效率?C1N短网址的秘密!

咱都知道&#xff0c;在互联网时代&#xff0c;链接已经成为我们分享内容的标配。但有时候那些长得离谱又复杂的链接&#xff0c;实在是让人头疼。不仅容易出错&#xff0c;还大大降低了内容传播的效率。于是&#xff0c;短链接应运而生&#xff0c;成为现代数字营销中不可或缺…

免费分享一套Java协同过滤推荐算法的SpringBoot+Vue(图书)商城系统【论文+源码+SQL脚本】,帅呆了~~

大家好&#xff0c;我是java1234_小锋老师&#xff0c;看到一个不错的Java协同过滤推荐算法的SpringBootVue(图书)商城系统&#xff0c;分享下哈。 项目视频演示 【免费】Java协同过滤推荐算法的SpringBootVue(图书)商城系统 Java毕业设计_哔哩哔哩_bilibili 项目介绍 伴随着…

【精选】数码论坛系统设计与实现(计算机毕业设计福利,计算机毕业设计参考,JAVA毕业设计)

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…

环境搭建 | Windows中MinGW-w64及GCC的下载、安装与配置

本文将介绍 GNU、GCC、MinGW 等相关概念&#xff0c;并着重介绍 Windows 中 MinGW-w64 的下载、安装与配置。MinGW-w64 的安装方式有两种&#xff1a;安装程序安装、压缩包安装&#xff0c;压缩包既可在 SourceForge 上下载&#xff0c;也可在 GitHub 上下载。 前导概念 GNU …

模型 ORID思维

系列文章 分享 模型&#xff0c;了解更多&#x1f449; 模型_思维模型目录。"结构化思维&#xff0c;深入探讨&#xff0c;明智决策。 1 ORID思维的应用 1.1 提升员工绩效的ORID模型应用 某企业为了提高员工的工作效率和满意度&#xff0c;采用ORID模型进行绩效面谈&…

【Kubernetes】Containerd-得到好物

目录 一、前言二、好物分享1. nerdctl2. buildkit3. k3s4. k9s5. 镜像加速器 三、物料包下载四、总结 一、前言 小伙伴们好久不见鸭&#xff0c;今天小涛分享一些 Containerd容器运维 非常Amazing的工具&#xff0c;老铁们看看操练起来~ 附&#xff1a;最新可用容器镜像加速链…

150mw绿光激光模组主要用途

在现代科技高速发展的今天&#xff0c;激光技术作为一种高精度、高稳定性的技术手段&#xff0c;已经在众多领域展现出了其独特的优势。其中&#xff0c;150mw绿光激光模组作为激光技术的重要分支&#xff0c;以其卓越的性能和广泛的应用前景&#xff0c;备受瞩目。接下来给大家…