利用具有局部信息的引导自注意进行息肉分割

news2024/11/29 20:31:08

文章目录

  • Using Guided Self-Attention with Local Information for Polyp Segmentation
    • 摘要
    • 本文方法
      • PP-Guided Self-Attention
      • Local-to-Global Mechanism
      • 损失函数
    • 实验结果

Using Guided Self-Attention with Local Information for Polyp Segmentation

摘要

背景
自动准确的息肉分割对于癌症的早期诊断至关重要。现有的息肉分割方法大多基于卷积神经网络,通常利用全局特征通过精心设计的模块来增强局部特征,从而处理息肉的多样性。尽管基于CNN的方法取得了令人印象深刻的结果,但它们无力对显式的长期关系进行建模,这限制了它们的性能。与CNN不同的是,由于自注意力,Transformer具有很强的远程关系建模能力。然而,自注意力总是将注意力分散到意想不到的区域,并且Transformer的局部特征提取能力不足,导致定位不准确和边界模糊。为了解决这些问题,我们提出了用于精确息肉分割的PPFormer。
方法

  1. 首先采用浅层CNN编码器和深层Transformer编码器来提取丰富的特征
  2. 在解码器中,我们提出了PP引导的自注意力,该自注意使用预测图来引导自注意聚焦于硬区域,以增强模型对息肉边界的感知。
  3. 局部到全局机制旨在鼓励Transformer在局部窗口中捕获更多信息,以更好地定位息肉。
    在这里插入图片描述
    (a) 是输入图像,感兴趣的像素用“+”标记
    (b) 是标签
    (c) 显示了通过PPguided自我注意力学习到的注意力图
    (d) 展示了原生自我注意力学习到的注意力图

本文方法

在这里插入图片描述
总体而言,PPFormer是一种编码器-解码器架构,可生成不同级别的预测图。
PPFormer的编码器由两个并行分支组成:
(1)用于全局特征提取的Transformer编码器。我们采用卷积视觉转换器(CvT)来构建转换器编码器。由于CvT删除了位置编码,我们的模型支持各种大小的输入图像。
(2) CNN编码器用于获得更多的低级别特征,以实现更好的像素级分割。我们采用VGG-16的前两个块来构建它。

PPFormer的解码器包括两个阶段:
(1)在第一阶段,模型预测具有高级特征的粗略结果,并使用预测图来引导L2G PPFormer块中的自我注意
(2) 在第二阶段,应用来自CNN编码器的低级别特征来细化分割结果。

PP-Guided Self-Attention

使用高级特征来生成低分辨率的预测图(现在不使用sigmoid函数)。patch级分割结果对每个图像patch进行评分,绝对值得分高表示斑块可能属于前景(息肉)或背景。
相反,低分数表明patch的属性很难确定,这经常发生在息肉的边界上。因此,提出了引导注意力矩阵MGA来引导这些patch:
在这里插入图片描述
Pf调整大小并展平预测图,MGA重点关注不确定区域,并要求它们与高核心斑块而不是其他不确定区域建立关系,以确定其归属。然后,我们融合MGA和MSA来计算PP引导的自我注意:

在这里插入图片描述
与普通的自我注意相比,PP引导的自我注意利用预测图作为引导信息,使模型聚焦于硬区域

Local-to-Global Mechanism

为了降低内存和计算复杂度,CvT采用压缩卷积投影来获得k和v。然而,由于局部信息的丢失,它们不适合在解码器中使用。因此,我们设计了L2G机制,以低内存使用率在局部窗口中捕获更多信息
在这里插入图片描述
图3说明了L2G PPFormer块中的L2G机制,该块由局部窗口阶段和全局窗口阶段组成。在前一阶段,我们将输入特征图x∈RH×W×C拆分为s×s个非重叠窗口:x→ {x1,x2,…,xs×s},其中每个窗口的大小为H s×W s×C,s是全局窗口阶段的压缩卷积投影的步长。接下来,我们在每个局部窗口中独立执行PPFormer块。重要的是,我们在局部窗口阶段使用步长为1的卷积投影,以保留更多的局部特征,从而更好地定位息肉。在全局窗口阶段,另一个PPFormer块用于对长期关系进行建模。

损失函数

PFormer通过加权IoU损失和二进制交叉熵(BCE)损失进行端到端训练

实验结果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/523703.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Microsoft Edge是一款现代化的浏览器,它拥有众多功能和强大的性能

随着互联网的不断发展,浏览器已经成为我们日常生活中必不可少的工具之一。作为一款现代化的浏览器,Microsoft Edge拥有许多强大的功能,为用户带来更加流畅的浏览体验。最近,Edge推出了分屏功能,这项功能可以大大提高生…

STM32------ADC

ADC 1、ADC介绍 1、1介绍 ADC即模数转换器。 例如:电信号转化成数字量。 1、2 ADC类型 并联比较型、逐次逼近型 并联比较型如下: 分压部分比较部分编码部分。 ADC分辨率:三位(上图) 优点:转换速度快…

类和对象下

文章目录 一、初始化列表1、语法:2、初始化顺序 二、static成员三、友元1、友元函数2、友元类 四、拷贝对象时的编译器优化例1、例2、例3、 一、初始化列表 1、语法: 初始化列表: 以一个冒号开始,接着是一个以逗号分隔的数据成员…

【Python PyTorch】零基础也能轻松掌握的学习路线与参考资料

文章目录 一、PyTorch的基础知识二、PyTorch数据处理三、PyTorch模型构建四、PyTorch模型训练和评估五、总结 作为当前最流行的深度学习框架之一,PyTorch已成为许多数据科学家和深度学习工程师的首选。本文将提供一条针对初学者的完整的学习路线,包括PyT…

hnust 湖南科技大学 2023 安卓 期中考试 复习资料

前言 ★:录音中提到的致谢:hwl,lqx,ly,sw重点来源:7-8班 PPT和录音内容来源:PPT知识点大多很抽象,需要联系实际代码来理解多做1-9章课后习题,编程题可以不做获取最新版本…

【AI大模型】“讯飞星火”大模型计划10月底赶超ChatGPT

文章目录 前言你使用过这种对话式AI吗?有什么看法或感受?“讯飞星火大模型将超越chatgpt?”这类型的人工智能对现在的社会有什么意义?这类型的人工智能,未来前景如何?申请体验写在最后 前言 5月6日&#xf…

第十三章 使用Postfix与Dovecot部署邮件系统

文章目录 第十三章 使用Postfix与Dovecot部署邮件系统一、电子邮件系统1、常见的邮件协议2、注意事项 二、部署电子邮件系统1、部署基础的电子邮件系统(1)、配置服务器主机名称(2)、配置服务器的DNS地址(3)…

【LeetCode: 115. 不同的子序列 | 暴力递归=>记忆化搜索=>动态规划 | 位置对应】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

队列Queue和栈Stack

什么是队列queue? 先进先出表,是一种受限制的线性表.其限制是仅允许在表的队尾进行插入数据和表的队头进行删除数据. 队列的使用场景: 线程池ThreadPoolExecutor ThreadPoolExecutor源码中核心变量(前面3个是重点) corePoolSize线程池维护的最小线程数量,哪怕是空闲的BlockQ…

Carla仿真三:Traffic Manager交通管理器详解

CARLA Traffic Manager 一、什么是Traffic Manager1、Traffic Manager简介2、Traffic Manager框架3、Traffic Manager模块 二、Traffic Manager控制方法1、TM控制交通参与者的自动驾驶的规则2、TM控制交通参与者行为的API摘要3、TM控制交通参与者行为的API 三、Traffic Manager…

力扣sql中等篇练习(十九)

力扣sql中等篇练习(十九) 1 苹果和桔子的个数 1.1 题目内容 1.1.1 基本题目信息1 1.1.2 基本题目信息2 1.1.3 示例输入输出 a 示例输入 b 示例输出 1.2 示例sql语句 # 没有使用group by也可以使用sum函数,因为默认是所有数据行自成一组 SELECT SUM(b.apple_countIFNULL(c.…

[LeetCode周赛复盘] 第 104 场双周赛20230513

[LeetCode周赛复盘] 第 104 场双周赛20230513 一、本周周赛总结6366. 老人的数目1. 题目描述2. 思路分析3. 代码实现 6367. 矩阵中的和1. 题目描述2. 思路分析3. 代码实现 6369. 最大或值1. 题目描述2. 思路分析3. 代码实现 6423. 英雄的力量1. 题目描述2. 思路分析3. 代码实现…

C:sh: 总是爆出:1: pause: not found

在linux平台下应该使用:pause() 导入:#include unistd.h 也就是unix下的标准函数,而不是代码不跨平台,从其他语言转来的新手很不舒服 参考:sh: 1: pause: not found_yjyn1的博客-CSDN博客

mysql数据库的表约束

表的约束 5.1:表的约束的概念 定义: 数据库表约束是用于定义和实施数据完整性的规则或条件。它们被应用于数据库表中的列,以确保数据的一致性、有效性和准确性。表约束可以强制执行特定的规则,限制数据的插入、更新或删除操作&…

ChatGPT的诞生和发展

ChatGPT的诞生和发展 ChatGPT是一种基于GPT模型的聊天机器人。GPT模型是一种基于深度学习的自然语言处理模型,由OpenAI团队开发,可以生成与输入文本相关的连续文本。ChatGPT的诞生和发展,可以追溯到GPT模型的开发与应用。 一、GPT模型的开…

jdk与tomcat的安装-----linux软件的安装与配置

安装方式 jdk的安装 上传jdk压缩包解压 tar -zxvf jdk压缩包名字 -C 解压地址配置环境变量 vi /etc/profileJAVA_HOMEjdk解压地址 PATH$JAVA_HOME/bin:$PATY重新加载profile文件,使更改的配置生效 source /etc/profile 查看是否安装成功 java -verisontomcat的…

Android MMKV - 性能强悍的存储工具(腾讯出品)

MMKV 是基于 mmap 内存映射的 key-value 组件,底层序列化/反序列化使用 protobuf 实现,性能高,稳定性强。从 2015 年中至今在微信上使用,其性能和稳定性经过了时间的验证. 起源 微信作为一个即时通讯项目,需要记录数据比较多.需…

基于Android studio学生考勤签到系统app

功能详细介绍 客户端 签到:用户再登录软件后,可以点击签到,进行在线签到,以记录当天的考勤信息。 请假:用户点击请假后,可以在线申请请假,等待教师的查看审核。 我的班级:可以查看个…

软考A计划-真题-分类精讲汇总-第七章(项目管理)

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例 👉关于作者 专注于Android/Unity和各种游戏开发技巧,以及各种资源分享&am…

解决爬虫工程师的烦心事,【淘宝1688京东】API接口封装系列,商品详情页的采集,可高并发运行

API是应用程序的开发接口,在开发程序的时候,我们有些功能可能不需要从到到位去研发,我们可以拿现有的开发出来的功能模块来使用,而这个功能模块,就叫做库(libary)。比如说:要实现数据传输的安全&#xff0c…