交叉注意力一脚踹进医学图像分割!新成果精度、效率表现SOTA

news2024/10/7 8:25:39

为解决传统方法的局限性,研究者们提出了将交叉注意力机制应用于医学图像分割。

交叉注意力机制能更有效地整合来自不同模态/尺度的特征,让模型同时捕捉全局和局部信息,加速学习并减少干扰。这样不仅可以提高分割的精度,还可以减少训练时间,提高分割的效率。

因此这种策略成为了目前医学图像领域的重要研究方向,为我们实现更高的综合性能提供了新的解决思路。

本次分享8种最新的用交叉注意力做医学图像分割的创新方案,开源代码已附,论文创新点做了简单提炼,供大家参考学习寻找灵感。

论文原文以及开源代码需要的同学看文末

Dual Cross-Attention for Medical Image Segmentation

方法:论文介绍了一种用于医学图像分割的基于U-Net的架构中加强跳跃连接的Dual Cross-Attention (DCA)方法。DCA包括通道交叉注意力(CCA)和空间交叉注意力(SCA)模块,分别在通道和空间维度上捕捉远距离依赖关系。

创新点:

  • 提出了Dual Cross-Attention (DCA)机制,通过顺序捕捉通道和空间维度上的长程依赖关系,加强了U-Net-based架构中的跳跃连接。

  • 在融合策略上,通过比较三种融合策略(求和、串联和顺序融合),发现顺序融合策略的性能最好。顺序融合策略先进行CCA,再进行SCA,能够更好地提升性能。

  • 在补丁嵌入方面,通过比较简单的2D平均池化和卷积补丁嵌入,发现2D平均池化在性能上稍微优于卷积补丁嵌入。此外,卷积补丁嵌入需要额外的参数,而2D平均池化是无参数的,并且与1×1深度卷积投影结合时效果更好。

BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation

方法:本文提出了一种新的医学图像分割结构BEFUnet,BEFUnet包含三个主要模块:局部交叉注意力特征融合模块、双层融合模块和双分支编码器,实现了边缘分割的鲁棒性和精确性。BEFUnet模型能够准确地分割边界模糊、不规则和受干扰的器官区域,并具有强大的泛化能力。

创新点:

  • 引入了像素差异卷积的概念,将传统边缘编码器和深度CNN的优势结合起来。这种整合使得边缘分割更加稳健和精确。

  • 提出了一种名为BEFUnet的新型医学图像分割结构,该结构提取了身体和边缘特征,并有效地将它们集成在一起以增强分割性能。

CKD-TransBTS: Clinical Knowledge-Driven Hybrid Transformer With Modality-Correlated Cross-Attention for Brain Tumor Segmentation

方法:论文提出了一种新颖的基于临床知识驱动的脑肿瘤分割模型CKD-TransBTS。模型结构由双分支混合编码器和特征校准解码器组成。设计了一个具有所提出的模态相关交叉注意力块的双分支混合编码器来提取多模态图像特征。双分支混合编码器利用Transformer和CNN的优势,通过Modality-Correlated Cross-Attention模块进行跨模态特征提取。

创新点:

  • 提出了一种根据影像学原理对不同MRI序列进行重新分组的方法,将相关的图像模态组合在一起,使模型能够学习到更好的跨模态特征表示。

  • 提出了一种混合编码器的设计,将Transformer和CNN的优势相结合,通过引入卷积层在Transformer模型中实现归纳偏置和更好的局部特征表示。

  • 设计了一种特征校准解码器,通过Trans&CNN特征校准模块来弥合Transformer和CNN提取的特征之间的差距,从而获得更精确的分割结果。

CSAM: A 2.5D Cross-Slice Attention Module for Anisotropic Volumetric Medical Image Segmentation

方法:论文比较不同模型在医学图像分割中的性能,并提出了一种新的2.5D交叉切片注意机制(CSAM),该机制在前列腺分区分割中表现出优越性能,并且具有更少的参数。

创新点:

  • 引入了CSAM,该机制可以有效地学习和利用3D图像体积中的跨切片信息,从而改善体积分割的性能。

  • CSAM可以方便地插入到现有的2D CNN网络中,实现体积图像分割。通过对前列腺、胎盘和心脏MRI分割的广泛验证研究,证明了CSAM模型在性能上优于相应的2D、3D和之前最先进的2.5D方法。

 

关注下方《学姐带你玩AI》🚀🚀🚀

回复“注意力医学”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1846992.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

deepin 加入甲辰计划,共建 RISC-V 繁荣生态

内容来源:deepin(深度)社区 今日,deepin(深度)社区宣布正式加入甲辰计划,致力于在下一个丙辰年(2036龙年)之前,基于RISC-V实现从数据中心到桌面办公、从移动穿戴到智能物联网全信息产…

基于DPU的云原生裸金属网络解决方案

1. 方案背景和挑战 裸金属服务器是云上资源的重要部分,其网络需要与云上的虚拟机和容器互在同一个VPC下,并且能够像容器和虚拟机一样使用云的网络功能和能力。 传统的裸金属服务器使用开源的 OpenStack Ironic 组件,配合 OpenStack Neutron…

Go语言开发框架GoFly已集成数据可视化大屏开发功能,让开发者只专注业务开发,本文指导大家如何使用

前言 框架提供数据大屏开发基础,是考虑当前市场软件应用有一大部分是需要把业务数据做出大屏,很多政府项目对大屏需求特别高,还有生产企业项目也对大屏有需求,没有提供基础规范的后台框架,在开发大屏需要很多时间去基…

MySQL数据库初体验+数据库管理(其一)

【1】 操作系统介绍: Linux操作系统有 RedHat CentOS Debian Ubuntu OpenSUSE 信创标准 国产系统 : 华为(欧拉) 阿里(龙蜥) 腾讯 (tencentOS) 麒麟&#xf…

媒体访谈 | 广告变现痛点有新解,俄罗斯市场成大热门?

今年一季度,中国自主研发游戏在海外市场实际销售收入达到了40.75亿美元,环比和同比均实现了超过5%的增长,出海,仍是游戏产品近些年来最主要的发展模式之一。 当今的市场环境正经历一系列深刻变革,移动游戏广告市场呈现…

npm语义化版本和版本运算符

版本号组成 一个完整的版本号,由三部分组成:主版本号(major)、次版本号(minor)、修订版本号(patch),简称X.Y.Z,具体含义: 主版本号(major):项目&#xff08…

【C++】类的六个默认成员函数

文章目录 类的六个默认成员函数一、构造函数二、析构函数三、拷贝构造函数四、赋值运算符重载五、const成员六、取地址及const取地址操作符重载 类的六个默认成员函数 如果一个类中什么成员都没有,称为空类。空类中真的什么都没有吗?并不是,…

【windows】字体安装手册

windows字体安装手册 1 下载字体文件 百度搜索XXX字体ttf文件进行下载 附:宋体gb2312下载地址: https://www.downza.cn/soft/7780.html 2 字体安装 1.搜索字体 2.将下载的ttf文件拖拽添加 3.关闭办公软件重新打开后,outlook、word、…

html做一个分组散点图图的软件

在HTML中创建一个分组散点图,可以结合JavaScript库如D3.js或Plotly.js来实现。这些库提供了强大的数据可视化功能,易于集成和使用。下面是一个使用Plotly.js创建分组散点图的示例: 要添加文件上传功能,可以让用户上传包含数据的文…

前端新手小白的Vue3入坑指南

昨天有同学说想暑假在家学一学Vue3,问我有没有什么好的文档,我给他找了一些,然后顺带着,自己也写一篇吧,希望可以给新手小白们一些指引,Vue3欢迎你。 目录 1 项目安装 1.1 初始化项目 1.2 安装初始化依…

如何保护表格部分内容不被修改!

你是否还在为辛苦做的表格,收回来的表格总是被人随意修改,不是表头变了样,就是设置好的格式、公式都乱了,苦恼、崩溃..... 别急,今天刘小生教你一招解决烦恼! 0.案例效果 【案例】现收集员工个人信息表&a…

canal 服务安装

简介:Canal 是阿里巴巴开源的一个基于 MySQL 数据库增量日志解析的中间件,用于提供准实时的数据同步功能。 准备工作 1.修改配置文件 ,需要先开启 Binlog 写入功能,配置 binlog-format 为 ROW 模式,my.cnf 中配置如下&#xf…

【目标检测】图解 DETR 系统框图

简略版本 Backbone:CNN backbone 学习图像的 2D 特征Positional Encoding:将 2D 特征展平,并对其使用位置编码(positional encoding)Encoder:经过 Transformer 的 encoderDecoder:encoder 的输出…

重磅来袭,表格数据显示的快捷方式和注意事项!

今天分享数据表格常见的两个问题,如何“快速去除小数点”和“快速显示万位数”,及日常工作计算常见问题,今天刘小生跟大家一起排雷! 1. 快速去除小数点 问题:经数据计算后出现小数位数,想要在整体数据展示…

Rust这5个自动验证工具,你知道几个?

自动验证是一种有助于检查程序是否满足某些属性的技术,例如内存安全性和避免在运行时错误。此外,自动验证工具使你能够验证并发代码的正确性,这很难手工测试。 自动验证对Rust特别重要,因为它可以帮助确保正确使用unsafe的代码。…

NTFS和exFAT哪个性能好 U盘格式化NTFS好还是exFAT好 mac不能读取移动硬盘怎么解决

文件系统的选择对存储设备的性能和兼容性有着重要影响。而NTFS和EXFAT作为两种常见的文件系统,它们各有特点,适用于不同的使用场景。我们将深入探讨NTFS和EXFAT的区别,帮助大家选择最适合自己需求的文件系统。 NTFS:稳定与性能的平…

代理网络基础设施 101:增强安全性、速度和可扩展性

编辑代理网络在现代网络架构中发挥着重要作用,充当管理和重新路由数据流的中介。它们处理的数据可以是各种类型,包括搜索查询和潜在的敏感客户信息,这凸显了它们在数据安全方面的作用。 然而,代理的好处不仅限于安全性。它们为用…

Apifox 中如何处理加密或编码过的响应数据?

接口返回的响应数据有时是经过编码或加密处理的,要转换成可读的明文,可以使用 Apifox 内置的 JS 类库、或者通过调用外部编程语言 (如 Python、JavaScript 等) 来进行处理。 例如,一个经过 Base64 编码的数据可以通过…

【开源项目】智慧北京案例~超经典实景三维数字孪生智慧城市CIM/BIM数字孪生可视化项目——开源工程及源码!

飞渡科技数字孪生北京管理平台, 依托实景数字孪生底座,以城市感知网络为硬件基础,以城市大数据为核心资源,以数字孪生、云计算、人工智能为关键技术,实现城市产业规划、资产安全管理、城市能耗监控等一体化空间融合。 …