APAUNet

news2025/1/21 15:25:37

Title:APAUNet: Axis Projection Attention UNet for Small Target in 3D Medical Segmentation

摘要:

在医学分割中,小目标分割对于诊断至关重要。在本文提出了轴向投影注意力网络,用于三维医学图像分割,特别是小目标。考虑到背景在三维特征空间中所占比例较大。本文引入了一种投影策略,将三维特征投影到三个正交的2D平面当中,以捕捉来自不同视角的上下文注意力,这样我们就可以过滤掉冗余的特征信息,并减轻3D扫描中小病灶的关键信息损失。然后利用了一种维度混合策略来融合来自不同轴的关注度的3D特征,并通过加权求和来合并他们,以自适应的学习不同视角的重要性。

最后在APA解码器中,我们在2D投影过程连接高分辨率和低分辨特征,从而获得更精确的多尺度信息。

Introduction:

我们提出了一个轴投影注意(APA) UNet,命名为APAUNet,它利用正交投影策略和维度杂交策略来克服上述挑战。具体来说,我们的APAUNet遵循3D-UNet的既定设计。但用我们的APA编码器/解码器模块替换了主要的功能组件,即基于3D卷积的编码器/解码器层。在APA编码器中,初始3D特征图被投影到三个正交的2D平面,即矢状、轴向和冠状视图。这种投影操作可以减轻3D扫描中小病灶的关键信息的损失。然后,我们沿着投影特征提取局部上下文2D注意,以执行不对称特征提取并将其与原始3D特征融合。最终,三个轴的融合特征通过三个可学习因子相加作为最终输出,如下图所示:

相应地,我们的APA解码器遵循与APA编码器相同的原理,但从两个分辨率级别获取输入特征。这样,解码器可以有效地利用多尺度特征的上下文信息。

 综上所述,本文的贡献有3点:1)本文提出了Axis Projection Attention UNet。APAUNet利用正交投影策略来增强不对称投影注意和特征提取2)引入了一种新的维度混合策略来融合2D和3D注意图,以在编码器和解码器中获得更好的上下文表示

注意力机制在医学图像分割上的应用

注意力机制已经广泛应用于分割网络,分割网络可以分为两个分支。第一个分支是Hard attention,它通过使用由粗到细的框架来完成分割任务。利用两个并行的fcn首先检测输入特征的ROI,然后对这些裁剪后的ROI块进行细粒度分割,用于体医学图像分割。第二个分支是采用自注意力机制。

方法

下图说明了网络的整体架构

我们的APAUNet由几个具有五个分辨率步长的轴投影注意力(APA)编码器/解码器模块组成。

轴投影注意编码器和解码器

APA编码器旨在从不同视角提取多个分辨率级别的上下文信息,APA编码器的结构如图左边所示。在实践中给定3D医学图像,APA编码器提取不同分辨率尺度, 对于第I级,输入特征Xi被并行地馈送到三个内部编码器(IE)块,以从三个不同的角度捕捉上下文注意力。为了更有效的捕获小目标特征,原始的3D特征将被投影到三个正交的2D平面,以提取2D空间注意力。然后,将学习到的2D注意力和3D特征图聚合以增强特征表示。在获得三个轴的融合特征之后,我们使用三个可学习的参数βi,a来获得增强特征的加权和:

 

其中IE()是IE块的操作,a表示三个正交轴。

这种聚集函数可以进一步帮助网络自适应地学习不同投影方向的重要性,以实现非对称信息提取。然后,应用另一个1 × 1 × 1卷积和2 × 2 × 2平均池来执行下采样操作,以获得下一级的输入特征Xi+1。

类似的,APA解码器模块用于提取和融合多分辨率特征以生成分割结果。详细设计如图3所示(右部)。APA解码器模块具有与APA编码器模块相似的结构,但是采用两个具有不同分辨率的特征作为输入。具体来说低和高分辨率的特征被同时送到APA解码器模块当中。其中低分辨率的特征映射来自第i+1级,高分辨率特征为之后内部编码器ID模块聚合高分辨特征和低分辨特征,以根据这三个特征生成2D上下文注意。然后将3D特征图与2D注意融合,以获得3D上下文化特征,类似于APA编码器中的特征。为此,小尺度前景信息被更好地保留,避免丢失至关重要的特征。最后,我们将三个3D上下文化特征的加权和作为下一级的输出特征。

内部编码器和解码器模块

 内部编码器和解码器结构如下图所示:

正交投影策略。在内部编码器模块。为了更好地过滤不相关的背景并放大小病灶的关键信息,我们首先将输入的3D特征投影到三个2D平面。特别地,3D输入特征X ∈ RH×W ×D×C被投影到笛卡尔坐标系的矢状面、轴面和冠状面,以生成关键字(K)和查询(Q),而值(V)保持3D形状。以矢状面视图为例,将输入X投影到2D得到键和查询:K,Q ∈ RC×W ×D,而V ∈ RC×H×W ×D是通过单次1 × 1 × 1卷积得到的。这里,我们采用沿着期望轴(在这种情况下为H)的全局平均汇集(GAP)和全局最大汇集(GMP)的总和作为投影算子:

维度混合策略:

在正交投影之后,在K上使用组大小为4的3×3组卷积来提取局部注意力L ∈ RC×W ×D,其包含与相邻键相关的局部空间表示。然后,我们将局部注意力L与Q连接起来,通过两个连续的1×1 2D卷积和维数扩展进一步得到注意力矩阵G ∈ RC×1×W ×D

 

接下来基于全局注意力图G,计算混合注意力图

最后,通过选择性注意[24]将获得的混合注意图与输入特征X融合,以获得输出特征Y

 多分辨率融合解码器

 为了更好的从多分辨率的特征中获取多尺度上下文特征,本文将上采样操作集成到注意力提取过程中。

ID(内部解码器)类似于上述的IE(内部编码器块),但是采用不同分辨率级别的两个输入,其中采用来自编码器的高分辨率特征来产生q,采用来自先前解码器的低分辨特征产生Key值和上采样的值,然后,应用3×3×3转置卷积对键进行上采样以获得局部注意力l。因此,解码器可以从各种尺度完全捕捉混合注意力。随后的上下文提取操作类似于IE块。最后,我们将混合注意力图与高分辨率特征X0融合以生成输出特征Y。

损失函数

 使用DiceLoss和交叉熵损失函数,具体的损失函数公式为:

总结:

在本文中,我们提出了一个强大的网络三维医学分割任务,称为轴投影注意网络(APAUNet)。为了处理高度不平衡的目标和背景,我们利用正交投影策略和维度杂交策略来建立我们的APAUNet。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/26281.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

什么是PCB中的光学定位点,不加可不可以?

什么是PCB中的光学定位点,不加可不可以? 这个问题在我平时的教学答疑出现的频次非常高,很多新手在初次接触这个概念的时候往往分不清楚这个光学定位点作用什么?从而导致他根本不知道什么时候该加,什么时候不加。 今天我…

物流通知:您的快递即刻送达!

“双11”购物狂欢节刚刚过去 “双12”马上就要到啦! 回想双11期间 隔日达、次日达的快递 让买买买的快乐直接翻倍 也大大提升了消费者们 双12的再消费欲望 飞奔的物流背后有什么秘密武器? 来跟着小翼一探究竟! 物流行业的飞速发展给…

Android App开发之利用JNI实现加密和解密操作实战(附源码 简单易懂)

运行有问题或需要源码请点赞关注收藏后评论区留言~~~ 一、JNI实现加密和解密 在实际开发中 JNI主要应用于以下场景 1:对关键业务数据进行加密和解密 Java代码容易遭到破解,JNI加密更加安全 2:底层的网络操作与设备操作 Java作为一门高级…

智慧农业建设方案中的物联网技术

物联网即“物物相联之网”,指通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把物与物,人与物进行智能化连接,进行信息交换和通讯,以实现智能化识别、定…

一分钟给大量视频褪色并加马赛克

剪辑视频的时候,想给大量的视频进行褪色处理,并且添加马赛克,可以用什么简单的操作方法吗?今天小编就来给大家安利一个可以快速批量这样进行操作的方法,下面就来看看具体的操作吧! 首先大家在浏览器搜索下载…

【VTK+有限元后处理】节点属性值查询

功能 有限元在后处理过程中,我们如果想获取某一个节点的属性数据值,最直接的方法就是点击这个节点,然后显示其属性数据。 代码实现 首先我们需要使用到VTK的点拾取类vtkPointPicker类。 从需求可知,我们需要与窗口进行交互&am…

STM32开发_利用SPI协议读写SD卡、介绍SD卡SPI时序

一、​ SD卡引脚接口功能介绍 1.1 SD卡引脚 目录 一、​ SD卡引脚接口功能介绍 1.1 SD卡引脚接口图 1.2 SPI方式驱动SD卡介绍 1.3 开发板接口定义 二、MMC卡、SD卡介绍 2.1 SD卡和MMC两者间区别 2.2 SD卡版本说明 2.3 SD卡常用的指令表 三、向SD卡发送命令的步骤介…

【数据结构】堆的拓展延伸 —— 堆排序 和 TopK问题

文章目录前言堆排序TopK问题结语前言 上篇博客,我们实现了堆。那么堆到底有什么应用情景?今天的内容就是堆的两个应用,堆排序和TopK问题。话不多说,我们这就开始。 堆排序 堆排序,是根据堆的结构而设计出的一种排序…

Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks

原文链接:https://aclanthology.org/D19-1410.pdf 概述 问题: BERT和RoBERT模型在进行语义匹配的时候,需要将每个可能的组合都输入到模型中,会带来大量的计算(因为BERT模型对于句子对的输入,使用[SEP]来标记…

C++11、17、20的内存管理-指针、智能指针和内存池从基础到实战(中)

C11、17、20的内存管理-指针、智能指针和内存池从基础到实战(中)第三章 分配器allocator和new重载1、重载operator的new和delete包括数组如果我们访问的是一个数组2、类成员操作符new重载和放置placement_newplacement new(放置内存&#xff…

并发编程(三)原子性(1)

【认识原子性】: 一个小程序认识原子性: package T05_YuanZiXing;import java.util.concurrent.CountDownLatch; import java.util.concurrent.locks.Lock; import java.util.concurrent.locks.ReentrantLock;public class T00_00_IPlusPlus {private …

Android源码相关面试专题

Android源码相关面试专题 1、Android属性动画实现原理 工作原理:在一定时间间隔内,通过不断对值进行改变,并不断将该值赋给对象的属性,从而实现该对象在该属性上的动画效果。 正在上传…重新上传取消 1)ValueAnimato…

Do Transformers Really Perform Bad for Graph Representation?

Do Transformers Really Perform Bad for Graph Representation? 论文中提出了Graphormer,它建立在标准的Transformer架构之上,并且在广泛地图表示学习任务重获得了优异的成绩。同时,作者也提出了一些简单但是有效的结构编码方法来帮助Grap…

【支付宝生态质量验收与检测技术】

如何验收和检测海量的支付宝生态小程序的质量,是一个很重要的课题。本次分享会简单介绍如何通过平台化的方式在小程序入驻环节进行准入验收,以及使用前端自动化测试技术和智能化算法对小程序质量进行检测。希望能对小程序质量的验收和测试提供参考。讲师…

计算机网络-应用层(应用层概述,网络应用模型(C/S模型,P2P模型),DNS域名协议)

文章目录1. 应用层概述2. 网络应用模型3. 域名系统(DNS)1. 应用层概述 应用层概述:应用层对应用程序的通信提供服务。 应用层协议定义: 应用进程交换的报文类型,请求还是响应各种报文类型的语法,如报文中…

分布式锁-简单入门

状态不是很好,记一下以前学过的分布式锁吧。 样例简介 不谈大概念,就是简单入门以及使用。 为什么要用分布式锁呢? 假设我需要一个定时操作,每天在某个点,我要处理一批数据,要先从数据库中查询出来&…

云计算-Hadoop-2.7.7 最小化集群的搭建(3台)

云计算-Hadoop-2.7.7 最小化集群的搭建(3台) 文章目录云计算-Hadoop-2.7.7 最小化集群的搭建(3台)一、环境依赖下载二、部署概要三、hadoop101模板机配置1. 更新 & 升级2. 安装好用的vim VimForCpp3. 安装必要依赖4. 关闭防火…

nginx配置https访问 生成ssl自签名证书,浏览器直接访问

问题 nginx配置自签名ssl证书,来支持https访问nginx,在浏览器中访问nginx时,提示有风险。而访问其他各大网站时,也是使用了https协议,为什么可以直接访问,而不提示有风险呢? 解疑 先从ssl证书…

MyBatis--动态SQL

Emp类 1.if标签 通过test属性中的表达式判断标签中的内容是否有效 (是否会拼接到SQL中) 接口 映射 测试 2.Where标签 where标签的三个作用 若where标签中有条件成立 , 会自动生成where关键字会自动将where标签中内容前多余的and去掉 , 但是其中内容后多余的and无法去掉若where标…

mysql explain和DESC性能分析

mysql explain和DESC 根据执行时间去只可以粗略的判断sql的性能,我们如果想去查看一条sql语句的性能还需要explain去查看sql的执行计划。 EXPLAIN 或者 DESC 命令获取 MySQL 如何执行 SELECT 语句的信息,包括在 SELECT 语句执行过程中表如何连接和连接的…