DeU-Net: 用于三维心脏mri视频分割的可变形(Deformable)U-Net

news2024/9/19 10:55:51

论文链接:https://arxiv.org/abs/2007.06341

代码链接:文章都看完了实在找不到代码!好崩溃!好崩溃!已经发邮件联系作者!

摘要

心脏磁共振成像(MRI)的自动分割促进了临床应用中高效、准确的体积测量。然而,由于分辨率各向异性和边界模糊(如右心室心内膜),现有方法在心脏MRI三维视频分割中存在准确性和鲁棒性下降的问题。在本文中,我们提出了一种新的可变形U-Net (DeUNet)来充分利用3D心脏MRI视频的时空信息,包括一个时间可变形聚合模块(TDAM)和一个可变形全局位置注意(DGPA)网络。首先,TDAM以心脏MRI视频片段作为输入,并通过偏移预测网络提取时间信息。然后通过时间聚合可变形卷积对提取的时间信息进行融合,生成融合特征图。此外,为了聚合有意义的特征,我们采用可变形注意力U-Net设计了DGPA网络,该网络可以将更大范围的多维上下文信息编码为全局和局部特征。实验结果表明,我们的DeU-Net在常用的评估指标上达到了最先进的性能,特别是在心脏边缘信息(ASSD和HD)方面。

背景

在本文中,我们提出了一种新的变形U-Net (DeU-Net)来解决上述问题,通过充分利用三维心脏MRI视频的时空信息并聚合时间信息来提高分割性能。DeU-Net由两个部分组成:时间变形聚合模块(TDAM)可变形全局位置注意网络(DGPA)。为了解决[13,14]中RV的部分体积效应,TDAM利用MRI视频片段的时空信息,通过时间聚合可变形卷积产生融合的特征图。为了解决[6]中的细微结构问题,基于U-Net的DGPA网络将更广泛的多维上下文信息联合编码为全局和局部特征,保证了每个分割图的边界清晰连续。定量和定性的实验结果表明,我们的建议在常用的指标上达到了最先进的性能,特别是对于心脏边缘信息(ASSD和HD)。

方法

DeU-Net的架构如图1所示,包括一个时态可变形聚合模块(TDAM)一个可变形全球位置注意(DGPA)网络。提出的TDAM包括两个阶段:一个是时间可变形卷积,另一个是基于U-Net的偏移量预测网络,用于预测可变形偏移量。将TDAM产生的融合特征输入到DGPA中,得到最终的分割结果。同样以U-Net为骨干的DGPA网络为编码器引入了可变形卷积,并利用可变形注意块来增加空间采样位置。

Temporal Deformable Aggregation Module(TDAM)

许多现有的方法设计了非常复杂的神经网络来实现性能增益。然而,大多数方法忽略了3D MRI视频的时空信息,并将每一帧视为一个单独的对象,从而导致性能下降。此外,在数据采样过程中,由于心脏边界的快速变化和规则的卷积,可能会丢失视频片段的各种语义细节,不可避免地会扭曲视频局部细节和帧之间逐像素的连接。因此,我们提出了一个时间变形聚合模块(TDAM)来自适应地提取图像解释的时间信息(运动场)。

提出的TDAM以目标帧及其相邻参考帧作为输入,共同预测偏移场。然后,通过时间聚合可变形卷积将增强的上下文信息融合到目标帧中

我这里先略写一下因为我主要要看的部分是DGPA...后面再补吧

Deformable Global Position Attention(DGPA)

正则卷积受核大小和固定几何结构的限制,在几何变换建模中性能有限。在实践中,由于心脏实例之间的边界不明确,很难减少假阳性预测。

为了解决这些问题,我们提出了一个可变形的全球位置注意(DGPA)网络来捕获足够大的接受野和语义全球上下文信息。DGPA通过额外的偏移量来增加模块中的空间采样位置,这是为了模拟复杂的几何变换。因此,可以收集远程上下文信息,这有助于获得更具辨别性的心脏边界,用于像素级预测。

 如图1所示,将融合的局部特征I 2 R NXHXW作为DGPA块的输入,其中N表示输入通道数,H和W分别表示输入特征的高度和宽度。(到时候再对比一下Deformable Conv原论文中插入的位置好了)

我们首先为输入特征I提供一个3X3可变形的卷积层来捕获心脏的几何信息。公式如下:

其中是特征图,

K是可变形卷积核,l是卷积核大小,δ’是deformable offset

将输入特征映射重构为三个新的特征映射B,C,D ∈ R NXM

式中M为像素数(M = HXW)。

为了利用心脏边界的高级特征,在B和c的转置之间进行点积,然后将结果应用到softmax层中计算注意力图P∈ R NXN↓  其中pji表示第i个像素对第j个像素的影响。两个像素的特征表示越相似,表明它们之间的相关性越强。

然后我们在P和D的转置之间进行矩阵乘法,将结果重塑为R NXHXW。

最后,对变形块中的特征映射O进行逐元素求和运算,得到输出特征Z ∈ R NXHXW如下:

式中α为属于位置亲和矩阵(position affinity matrix)的尺度参数。Z中的每个元素是全局特征的加权和,并选择性地聚合输入特征i。计算特征映射的远程依赖关系,以提高类内紧凑性和语义一致性。

 

实验

设备是NVIDIA GTX 1080Ti GPU。对于训练集,进一步使用标准数据增强(即镜像、轴向翻转或旋转)来更好地利用训练样本。我们使用Adam优化器来更新网络参数。初始学习率设置为2 10􀀀4,权值衰减为1 10􀀀4。我们使用的批量大小至少为12。设公式1中的参考帧数r为1。如果骰子分数没有增加20次,训练将停止。在我们的实验中,我们进行了5次交叉验证。

结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/988792.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业密码安全:ADSelfService Plus 提升密码管理的千里之行

在当今数字化时代,企业的密码安全变得至关重要。密码是保护企业敏感信息和数据的第一道防线,而有效的密码管理对于确保网络安全至关重要。ADSelfService Plus是一款强大的密码管理和自助服务解决方案,它在提供密码安全方面走在了前沿。 ADSel…

动态表单设计

动态表单设计 背景方案讨论基于上面分析,对比调研,自定义动态表单数据模型表单详解(一) 表单模板:jim_dynamic_form(二)表单数据类型:jim_form_data_type(三)…

前端面试经典题--页面布局

题目 假设高度已知&#xff0c;请写出三栏布局&#xff0c;其中左、右栏宽度各为300px&#xff0c;中间自适应。 五种解决方式代码 浮动解决方式 绝对定位解决方式 flexbox解决方式 表格布局 网格布局 源代码 <!DOCTYPE html> <html lang"en"> <…

vue优化首屏加载时间优化-gzip压缩

前言 为什么要进行首屏加载优化&#xff0c;因为随着我们静态资源和第三方包和代码增加&#xff0c;压缩之后包会越来越大 随着网络的影响&#xff0c;在我们第一输入url请求资源时候&#xff0c;网络阻塞&#xff0c;加载时间长&#xff0c;用户体验不好 仔细观察后就会发现…

解锁在线教育新机遇|V-More在线教育行业沙龙圆满落幕!

AIGC技术的渗透&#xff0c;也将为在线教育领域带来新的模式创新。面对以上增长机遇与潜在挑战&#xff0c;在线教育企业想要做好用户增长和技术降本并不简单。 9月1日&#xff0c;由火山引擎、AMD与msup联合举办的在线教育行业私享会成功举办&#xff0c;40余位在线教育行业的…

如何利用ProcessOn 做资产管理流程图

资产管理 是一家公司最重要的管理活动。好的资产管理可以让资源最优化利用&#xff0c;实现资产价值的最大化。可以帮助组织管理和降低风险。同时当需要决策的时候&#xff0c;对资产数据进行分析和评估&#xff0c;也可以帮助做出更明智的决策&#xff0c;如优化资产配置、更新…

YOLOV7改进-添加P2和P6检测层(以YOLOV7-Tiny为例)

下载三个配置文件地址 1、加p6 1、配置文件添加 2、让它自己利用k-means算法进行聚类 3、如果从8或9出来&#xff0c;在这里改 完整

NoUniqueBeanDefinitionException: expected single matching bean but found 2

文章目录 前言一、错误现象二、原因分析三、解决办法总结 前言 看到这个错误,大致也能猜出错误的原因,就是spring中注入的bean重复了,本来应该是单利的bean,但是现在却找到了两个,那么导致这个问题的原因是什么?如何解决呢? 一、错误现象 运行项目或者运行junit测试,直接报…

修改Docker镜像默认下载地址

1、安装完docker desktop后&#xff0c;先不要打开 2、新建目录 D:\ProgramData\Docker 3、在C:\Users\你的用户名\AppData\Local下&#xff0c;打开cmd或者powershell执行以下命令&#xff0c;命令语法略有不同。 powershell命令&#xff1a; cmd /c mklink /J Docker D:\Pro…

知识图谱实战应用27-基于多模态数据的洪涝灾害知识图谱构建与实际应用

大家好,我是微学AI,今天给大家介绍一下知识图谱实战应用27-基于多模态数据的洪涝灾害知识图谱构建与实际应用。今年以来,很多省份都经历了暴雨肆虐,并造成了洪涝灾害,洪涝灾害是一种常见而严重的自然灾害,对人类社会和环境造成了巨大的影响。为了有效地应对洪涝灾害,构建…

Foxboro FBM232 P0926GW以太网通信模块

以太网通信&#xff1a;FBM232 P0926GW 模块支持以太网通信&#xff0c;可用于与其他设备、传感器、执行器和监控系统进行数据交换。 通信协议&#xff1a;模块通常支持多种通信协议&#xff0c;如Modbus TCP/IP、EtherNet/IP 等&#xff0c;以便与不同类型的设备和系统进行通…

3.xaml Label TextBox PasswordBox Button

1. Label TextBox PassWordBox Button a.运行图片 b.Xaml源码 <Grid><!--VerticalAlignment 控件竖直--><!--HorizontalAlignment 控件水平--><!--VerticalConte

etcd选举源码分析和例子

本文主要介绍etcd在分布式多节点服务中如何实现选主。 1、基础知识 在开始之前&#xff0c;先介绍etcd中 Version, Revision, ModRevision, CreateRevision 几个基本概念。 1、version 作用域为key&#xff0c;表示某个key的版本&#xff0c;每个key刚创建的version为1&#…

切片机制和MR工作机制

InputFormat基类 TextInputFormat&#xff1a;TextInputFormat是默认的FileInputFormat实现类。按行读取每条记录。键是存储该行在整个文件中的起始字节偏移量&#xff0c; LongWritable类型。 CombineTextInputFormat&#xff1a;CombineTextInputFormat用于小文件过多的场景…

什么是正向代理和反向代理

一、什么是正向代理 正向代理&#xff08;Forward Proxy&#xff09;是一种代理服务器&#xff0c;它位于客户端和服务端之间&#xff0c;代表客户端向其他服务器发送请求。 一般使用的场景就是&#xff0c;当客户端无法直接访问某些资源时&#xff0c;可以通过正向代理来访问…

QML实现文件十六进制数据展示

前言 将一个二进制文件直接拖放到Qt Creator中可以直接查看到以十六进制显示的数据格式&#xff0c;如&#xff1a; 要实现一个这样的效果&#xff0c;还是要花不少时间的。 在网上找了挺多示例&#xff0c;其中一个开源代码效果不错&#xff08;参考这里&#xff09;&#…

Linux:【Mysql】Centos7安装mysql8.0

目录 一、环境及版本介绍 二、安装前准备 三、开始安装 一、环境及版本介绍 Linux环境&#xff1a;Centos7 Mysql版本&#xff1a;8.0.26 安装时使用的用户&#xff1a;root 二、安装前准备 1.1、下载Centos7镜像 网上寻找相关资源即可 1.2、下载VMwareWorkstation Pro并…

cpolar内网穿透

目录 一、引言二、什么是cpolar三、内网穿透四、如何使用cpolar1、下载cpolar软件安装包2、注册cpolar账号3、使用cpolar 一、引言 当我们完成了一个tomcat的web项目之后&#xff0c;如果我们想让其他电脑访问到这个项目&#xff0c;我们可以让其他电脑和本机连接到同一个局域…

python如何学习

功能如此强大、高效的Python&#xff0c;却非常的简单好学&#xff0c;这让学它的同学爱不释手&#xff0c;也让越来越多的互联网企业开始用Python来做主要的开发语言&#xff0c;比如谷歌、Facebook&#xff08;现Meta&#xff09;、豆瓣、知乎等知名互联网公司都在使用Python…