TGANet:用于改进息肉分割的文本引导注意力

news2024/11/17 17:22:49

文章目录

  • TGANet: Text-Guided Attention for Improved Polyp Segmentation
    • 摘要
    • 本文方法
      • 编码器模块
      • Feature Enhancement Module
      • Label Attention
      • decoder
      • Multi-scale Feature Aggregation
      • 损失函数
    • 实验结果

TGANet: Text-Guided Attention for Improved Polyp Segmentation

摘要

  1. 在训练过程中以文本注意力的形式利用了与大小相关和息肉数量相关的特征
  2. 引入了一个辅助分类任务来对基于文本的嵌入进行加权,该任务允许网络学习额外的特征表示,这些特征表示可以明显适应不同大小的息肉,并且可以适应多个息肉的情况。
  3. 实验结果表明,与最先进的分割方法相比,这些添加的文本嵌入提高了模型的整体性能。探索了四个不同的数据集,并为特定尺寸的改进提供了见解。我们提出的文本引导注意力网络(TGANet)可以很好地推广到不同数据集中的可变大小息肉
    代码地址

本文方法

在这里插入图片描述

编码器模块

TGANet建立在预先训练的ResNet50作为骨干编码器网络的基础上,我们使用它的四个不同编码块ei,i∈1,2,3,4。这些块被连续用于我们的辅助属性分类任务和主要息肉分割任务。

对于文本属性分类,我们将第四个编码器块的输出分别用作两个分类任务模块,即息肉的数量(一个或多个)及其大小(小、中、大)
多边形大小根据边界框面积与整个图像区域之间的比率r计算,小的指r<0.1,中等的指0.1≤r<0.3,大的指r≥0.3
这里,预测了softmax概率σnopolip(.)a n dσszpolyp(.)。对于主要的分割任务,我们从每个ResNet50块中获取输出,并将其通过特征增强模块(FEM,fi,i∈1,2,3,4),该模块负责通过应用多重扩张卷积和注意力机制来增强特征。

Feature Enhancement Module

主要就是空洞卷积结合

Label Attention

标签注意力模块旨在为我们的TGANet中解码器块的输出特征提供基于文本的学习注意力。在这里,我们使用三个标签注意模块li,i∈1,2,3作为对三个解码器输出的软通道注意,这使得能够对代表性特征进行更大的权重并抑制冗余特征。第一个标签注意力模块使用嵌入融合E(.)的输出,该嵌入融合E是通过softmax概率级联{σone,σmany,σsmall,σmedium,σlarg}与编码文本嵌入之间的逐元素点积获得的。假设,A={one,many,small,median,larg}是使用字节对编码(BPE,一种简单的数据压缩形式编码的属性,并由Aencode表示,其中{akj}作为长度为|k|的每个属性j的向量嵌入,则E(.)由下式给出:
在这里插入图片描述

decoder

所提出的TGANet中的解码器由三个不同的解码器块di,i∈1,2,3组成,其中每个解码器块利用输入特征对其进行上采样,并使其通过一些卷积层以产生输出。该输出使用标签注意力模块li进行细化,并传递给随后的解码器块di(见图1(c))。第一解码器块获取第四FEM f4的输出,以使用双线性插值将其上采样2倍,然后将其与来自第三FEM f3的输出特征级联。所得到的级联特征通过称为CBR的Conv1×1-BN-ReLU,然后是三个Conv3×3-BN的序列,进一步伴随着它们的多个残差连接和ReLU激活函数,随后的卷积块注意力模块表示为dcbami。对每个解码器块输出douti,i∈1,2,3使用S形函数进行n元素乘法,以允许来自计算的标签特征lf的额外软关注,由下式给出
在这里插入图片描述

Multi-scale Feature Aggregation

多尺度特征聚合(MSF A)模块(参见补充图1)用于在各种解码器输出douti,i∈1,2,3处融合多尺度特征表示,从而可以捕获学习的特征。我们取前两个特征{dout1,dout2},并将它们通过双线性上采样,以确保所有三个特征都具有精确的空间维度,然后在级联之前进行线性1×1卷积层、BN和ReLU激活。为了增强对非线性特征的捕获,我们进一步应用了一系列卷积层、BN和ReLU以及多个残差连接,以改善信息流

损失函数

我们以相等的权重联合最小化辅助分类任务(交叉熵损失,CEloss1,CEloss2)和分割任务(二进制交叉熵,BCLoss3和骰子损失,DSCloss4)的损失。

实验结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/509392.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023年湖北建设厅特种工报名需要什么条件?报名流程是什么?

2023年湖北建设厅特种工报名需要什么条件?报名流程是什么? 建设厅特种工现在已经开始报名考试安排计划了,想要报考建设厅特种工的现在可以了解一下具体的流程以及相关信息哟。为自己报名考试做准备,下面启程别就来给您介绍一下建设…

从入门到精通:接口自动化测试中加密、解密和Sign签名的完整指南

【专业解读】接口自动化测试安全机制剖析:加密、解密和sign签名技术原理与应用! 目录 摘要: 1. 加密 2. 解密 3. Sign签名 4. 示例 摘要: 在进行接口自动化测试时,加密、解密和sign签名是非常重要的步骤。这些过…

基于单片机的数字频率计设计

数字频率计概述 数字频率计是计算机、通讯设备、音频视频等科研生产领域不可缺少的测量仪器。它是一种用十进制数字显示被测信号频率的数字测量仪器。它的基本功能是测量正弦信号,方波信号及其他各种单位时间内变化的物理量。在进行模拟、数字电路的设计、安装、调试…

基于AT89C52单片机的温度检测设计与仿真

点击链接获取Keil源码与Project Backups仿真图: https://download.csdn.net/download/qq_64505944/87770153 源码获取 主要内容: 本设计是基于52系列的单片机进行的设计,可以完成温度的测控,可以实现实际温度与设定温度区域的比较,并在LED上相应的显示结果。设计过程在硬…

算法 DAY57 动态规划13 647. 回文子串 516.最长回文子序列

647. 回文子串 暴力解法:两层for循环,再加一个判断是否是回文子串,时间复杂度O(n3) 五部曲 1、 判断一个子字符串(字符串的下表范围[i,j])是否回文,依赖于,子字符串(下表范围[i 1,…

CLion安装(详细步骤+截图)

目录 一、CLion-2021.1.3.exe 下载 二、运行环境mingw-w64压缩包下载 三、 安装插件 ---- ide-eval-resetter-2.1.13压缩包下载 一、CLion-2021.1.3.exe 下载 Other Versions - CLion (jetbrains.com) 1、下载 2、更改路径 (不要放在含有中文的路径下&a…

【Java面试】Java基础-集合相关知识点(1)

文章目录 1. 集合有哪些类?2. ArrayList3. Map主要有哪些类? 容器主要包括 Collection 和 Map 两种,Collection 存储着对象的集合,而 Map 存储着键值对(两个对象)的映射表。 1. 集合有哪些类? 集合是一组相关对象的容…

ThreadLocal底层源码解析

线程隔离,保证多线性访问安全 每个线程拿到的值私有,相互不干扰 ThreadLocal是JDK包提供的,它提供线程本地变量,如果创建一乐ThreadLocal变量,那么访问这个变量的每个线程都会有这个变量的一个副本,在实际…

跳槽? 我只想多赚点罢了

前言 五一过后也就也就意味着今年的金三银四跳槽季正式结束了,不知道大家是否拿到了offer,面对金三银四的招聘旺季,如果没有精心准备那笔者认为那是对自己不负责任;就我们测试员来说,多数的公司总体上面试都是以自我介…

表的存储原理(数据库)

目录 一、内部存储概述 二、 数据行(记录)结构 1、定长记录 2、变长记录 一、内部存储概述 表是有关某个特定实例的数据集合,在关系数据库中处于核心地位。 创建一个表,就会有一行或多行插入到用来管理这个表的多个系统表里。…

如何压缩照片大小不大于200k

如何压缩照片大小不大于200k?有时候需要压缩照片大小不大于200k是因为在一些场景下,上传或传输大文件会受到限制,例如通过电子邮件发送、上传到云存储空间等等。在这种情况下,压缩照片可以让图片更容易地传输和分享,并…

基于simulink进行音频波束成形系统的多核仿真

一、前言 此示例展示了 Simulink中的音频波束成形系统仿真模型如何使用数据流域提高性能。它使用 Simulink 中的数据流域自动将通信系统的数据驱动部分划分为多个线程,从而通过在桌面的多个内核上执行模拟来提高仿真的性能。 二、介绍 数据流执行域允许您在计算密集…

Docker Overlay2占用大量磁盘空间解决

问题 最近项目的jenkins编译时报错 FATAL: Unable to produce a script filejava.io.IOException: No space left on deviceat java.io.UnixFileSystem.createFileExclusively(Native Method)at java.io.File.createTempFile(File.java:2024)at hudson.FilePath$CreateTextTem…

#vue项目冗余请求处理#http://localhost:8080/sockjs-node/info?t=1683604231866

目录 前言一、为什么会出现这个请求?二、解决方法1.修改源码 总结 前言 提示:本文要记录的大概内容: 在我的vue项目中,开发环境下,一直重复发请求:http://localhost:8080/sockjs-node/info?t16836042318…

《花雕学AI》33:如何用XMind制作AI思维导图、鱼骨图和组织结构图

思维导图是一种有效的思维工具,它可以帮助我们整理信息,激发创意,提高效率。思维导图是一种以中心主题为核心,以分支结构为形式,以关键词和图像为内容的图形表示法。它可以让我们一目了然地看到知识的层次和逻辑&#…

手把手教你Vue+ECharts+高德地图API实现天气预报数据可视化

前言 所谓数据可视化,我们可以理解为从宏观角度来看一眼就能看出来整个数据的占比,走向。对于数据可视化,很多互联网公司是很看重这一块的,包括大厂;就比如阿里的淘宝,双十一的时候往往就需要将消费者的一…

论文浅尝 | 句法丰富的判别训练:一种有效的开放信息抽取方法

笔记整理:杜苗增,东南大学硕士,研究方向为多模态信息抽取 链接:https://aclanthology.org/2022.emnlp-main.401.pdf 动机 开放信息提取(OIE)是信息提取(IE)的一个分支,专注于从非结构化自然语言文本中提取结构化信息。…

论文笔记_2017_RS_迈向高清 3D 城市测绘:基于道路特征的移动测绘系统和航空影像配准

基本情况 出处:Javanmardi M, Javanmardi E, Gu Y, et al. Towards high-definition 3D urban mapping: Road feature-based registration of mobile mapping systems and aerial imagery[J]. Remote Sensing, 2017, 9(10): 975.原文地址:Remote Sensin…

Postman生成代码的小技巧

描述 你还在使用postman吗?你还是一条条复制参数吗?你还是手动录入数据吗?对于一些不经常使用postman的人来说,这个小技巧可以帮助你导入请求,以及转换成开发语言。 教程 1 抓包接口 以CSDN热榜为例,直…