【Diffusion分割】MedSegDiff-v2:Diffusion模型进行医学图像分割

news2024/9/25 12:54:38

MedSegDiff-V2: Diffusion-Based Medical Image Segmentation with Transformer

摘要: 

       最近的研究揭示了 DPM 在医学图像分析领域的实用性,医学图像分割模型在各种任务中表现出的出色性能就证明了这一点。尽管这些模型最初是以 UNet 架构为基础的,但通过整合视觉Transformer机制,仍有可能提高其性能。然而,我们发现,简单地将这两个模型结合在一起会导致性能不佳。为了将这两种尖端技术有效地整合到医学图像分割中,我们提出了一种新颖的基于变换器的扩散框架,称为 MedSegDiffV2。我们在 20 个不同图像模式的医学图像分割任务中验证了它的有效性。通过综合评估,我们的方法证明优于先前的最先进(SOTA)方法。

Introduction

        我们为医学图像分割设计了一种新颖的基于变换器的扩散框架,称为 MedSegDiff-V2。在扩散过程中,我们在原始图像的主干上采用了两种调节技术。一种是锚定条件(Anchor Condition),它将条件分割特征整合到扩散模型编码器中,以减少扩散方差我们设计了一种新颖的 "确定空间注意力"(U -SA),一种是整合机制,它放宽了具有更多不确定性的条件分割特征,从而为扩散提供了更大的灵活性,以进一步校准预测结果另一种是将条件嵌入整合到扩散嵌入中的语义条件。为了有效弥合这两种嵌入之间的差距,我们提出了一种新颖的转换机制,称为频谱-空间转换器(SS-Former),用于嵌入整合。SSFormer 是一个频域交叉注意链,每次都有一个时间步长自适应神经带通滤波器(NBP-Filter)来对齐噪声和语义特征

        -我们首次将变换器集成到基于扩散的模型中,用于普通医学图像分割。

        -我们提出了一种带有 U-SA 的锚条件,以减轻扩散方差。

        -我们提出了语义条件与 SS-Former 模型,以模拟分割噪声和语义特征的相互作用。

Related Work

Diffusion Model for Medical Segmentation

        最近,扩散模型在包括医学图像在内的各种分割任务中展现出巨大潜力(Armato III 等人,2011 年;Caron 等人,2021 年;Cao 等人,2022 年;Chen、Ma 和 Zheng,2019 年)。事实上,这些模型利用随机抽样过程生成隐含的分割集合,从而提高了分割性能(Zhai 等人,2022 年)。然而,如果不对多样性进行有效控制,集合往往难以收敛,导致多次耗时的采样迭代。此外,这些分歧样本不仅无法达到预期目标,还会引入噪声,影响分割质量。因此,提高每次采样迭代的采样精度至关重要。

Method

Diffusion Process of MedSegDiff-V2 

        我们的模型是根据(Ho、Jain 和 Abbeel,2020 年)中提到的扩散模型设计的。扩散模型是一种生成模型,由两个阶段组成:正向扩散阶段和反向扩散阶段。通过一系列步骤 T,高斯噪声被逐渐添加到分割标签 x0 中。在反向过程中,神经网络经过训练,通过逆转噪声添加过程来恢复原始数据。这可以用数学方法表示如下:

 

        按照 DPM 的标准实现方法,我们利用编码器-解码器网络进行学习。为了实现分割,我们根据原始图像的先验信息对阶跃估计函数ε进行调节。这个条件可以表示为:

 

这里,T ransF 表示基于变换器的注意力机制。EI t 表示条件特征嵌入,在我们的例子中,它对应于原始图像的嵌入。Ex t 表示当前步骤的分割图特征嵌入。这两个部分通过变换器整合在一起,并通过 UNet 解码器 D 进行重构步骤索引 t 与嵌入和解码器的组合特征整合在一起,每个步骤索引按照(Ho、Jain 和 Abbeel,2020 年)中描述的方法,使用共享学习的查找表进行嵌入

Overall Architecture 

        MedSegDiff-V2 的整体流程如图 1 所示。 为了介绍该流程,请考虑扩散流程的单步 t。首先将噪声掩膜 xt 输入一个称为扩散模型的 UNet扩散模型由从原始图像中提取的分割特征通过另一个标准 UNet(称为条件模型)进行调节。扩散模型采用两种不同的调节方式:锚点条件和语义条件。按照输入流程,锚点条件首先施加到扩散模型的编码器上。它将锚分段特征(即条件模型的解码分段特征)整合到扩散模型的编码特征中。这样,扩散模型就可以通过一个粗略但静态的参考来初始化,从而有助于减少扩散差异然后将语义条件强加给扩散模型的嵌入,从而将条件模型的语义分割嵌入整合到扩散模型的嵌入中。这种有条件的整合是通过 SS 变压器实现的,它在噪声嵌入和语义嵌入之间架起了一座桥梁,并利用变压器的全局和动态特性优势抽象出了一种更强的表示方法。

 

        MedSegDiff-V2 采用标准噪声预测损失 Ln(DPM,Ho、Jain 和 Abbeel,2020 年)和监督条件模型的锚损失 Lanc 进行训练。Lanc 是软骰子损失 Ldice 和交叉熵损失 Lce 的组合。具体来说,总损失函数表示为 :

其中,t ≡ 0 (mod α) 通过超参数 α 控制对条件模型的监督次数,交叉熵损失通过超参数 β 加权,分别设为 5 和 10。

Anchor Condition with U -SA

        没有卷积层的感应偏差,变压器块具有更强的表示能力,但在训练数据有限的情况下,对输入方差也更加敏感(Naseer 等,2021 年)。在扩散模型中直接添加变换器块会导致每次输出的方差过大。为了克服这一负面影响,我们对 MedSegDiff(Wu 等,2022e)的结构进行了调整,并在扩散模型中引入了锚定条件操作

        锚定条件提供了条件模型中的粗略锚定特征,并将其整合到扩散模型中这为扩散模型提供了一个正确的预测范围,同时也允许它进一步完善结果。具体来说,我们将条件模型的解码分割特征整合到扩散模型的编码器特征中。我们为特征融合提出了 U-SA 机制,以表示给定条件特征的不确定性。从形式上看,我们将最后一个条件特征 f -1 c 融合到第一个扩散特征 f0 d 中。U -SA 可以表示为:

其中,∗ 表示滑动窗口核操作,- 表示一般元素操作。在等式中,我们首先在 f -1 c 上应用可学习的高斯核 kG 来平滑激活,因为 f -1 c 可作为锚点,但可能并不完全准确。然后,我们选择平滑图与原始特征图之间的最大值,以保留最相关的信息,从而得到平滑锚特征 fanc然后,我们将 fanc 整合到 f0 d 中,得到增强特征 f ′0 d。具体来说,我们首先应用 1 × 1 卷积 k1×1conv 将锚特征通道还原为 1,并与 Sigmoid 激活后的 f 0 d 相乘,然后将其添加到 f 0 d 的每个通道中,类似于空间注意力的实现(Woo 等人,2018 年)。 

Semantic Condition with SS-Former

         扩散模型预测了来自噪声掩码输入的冗余噪声,导致其嵌入与条件分割语义嵌入之间存在域差距。在使用矩阵操作(stranded transformer)时,这种差距会影响性能。我们提出了一种新颖的频谱空间变换器(SS-Former)。我们的主要想法是学习条件语义特征和扩散噪声特征在频域中的相互作用。我们使用一种名为神经带通滤波器(NBP-Filter)的滤波器将它们调整到统一的频率范围,即频谱。神经带通滤波器在限制其他频谱的同时,学会通过特定的频谱。我们根据扩散时间步骤自适应地学习该频谱,因为噪音水平(频率范围)对每个步骤都是特定的。这样就可以根据频率亲和性混合特征,并根据扩散步骤对其进行调整

        SS-Former 的鸟瞰图如图 1 (b)所示,它由 N 个共享相同架构的区块组成。本文设定 N = 4。每个区块由两个类似交叉注意的模块组成。第一个模块将扩散噪声嵌入编码为条件语义嵌入,下一个对称模块将最后一个语义嵌入编码为扩散噪声嵌入。这样,模型就能学习噪声和语义特征之间的相互作用,从而获得更强的表示能力。从形式上看,c0 是条件模型的最深特征嵌入e 是扩散模型的最深特征嵌入。我们首先将 c0 和 e 转移到傅立叶空间,分别表示为 F (c0) 和 F (e)。请注意,特征图都是按照标准的视觉变换器方法进行修补和衬垫投影的。然后,我们以 e 为查询,以 c0 为关键,在傅立叶空间上计算亲和权重图,可表示为 M = (F (c0)Wq)(F (e)Wk)T其中 Wq 和 Wk 是傅立叶空间中可学习的查询权重和关键权重

        然后,我们应用 NBP 过滤器来调整频率的表示。我们注意到,M 中的每个点现在都代表一个特定的频率,由于我们需要控制一个连续的频率范围,因此直观的做法是建立一个从特征图位置到频率大小的平滑投影。为此,我们使用神经网络从坐标图中学习权重图。通过这种方法,网络的归纳偏差将促进平滑投影的学习,因为相似的输入自然会产生相似的输出(Sitzmann 等,2020 年;Wu 和 Fu,2019 年)。这一想法被广泛应用于三维视觉任务中,并被称为神经辐射场(NeRF)(Mildenhall 等,2020 年)。但与最初的 NeRF 不同的是,我们进一步用时间步长信息对其进行调节。具体来说,该网络将坐标图作为输入,并生成一个注意力图作为滤波器,两者的大小相同,都是 M。为了用时间步信息对网络进行调节,我们使用扩散模型的时间步嵌入对归一化特征进行缩放和移动。我们使用两个 MLP 层将当前的时间步嵌入投影到代表均值和方差的两个值上,这两个值分别用于缩放和移动。我们总共堆叠了 R = 6 个这样的块和一个 Sigmoid 函数,以生成最终的滤波器。最后,滤波器与管道中的亲和图 M 按元素顺序相乘。NBP-Filter 是通过整个流水线以端到端的方式进行训练的。

        滤波后的亲和力图 M′通过反快速傅立叶变换(IFFT)转回到欧几里得空间,并应用于值条件特征:f = F -1(M ′)(c0wv),其中 W v 是可学习的值权重。我们还使用 MLP 进一步完善注意力结果,得到最终特征 ̃ c0。下面的注意力模块与第一个模块对称,但使用综合特征̃ c0 作为查询,并使用噪声嵌入 e 作为键和值,以便将分割特征转换到噪声域。转换后的特征 c1 将作为下一个区块的条件嵌入。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2163599.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

低代码BPA(业务流程自动化)技术探讨

一、BPA流程设计平台的特点 可视化设计工具 大多数BPA流程设计平台提供直观的拖拽式界面,用户可以通过图形化方式设计、修改及优化业务流程。这种可视化的方式不仅降低了门槛,还便于非技术人员理解和参与流程设计。集成能力 现代BPA平台通常具备与其他系…

My_String完善

#include "my_string_ok.h" My_string_Ok::My_string_Ok():size(20) { len 0; ptr new char[size]; ptr[len] \0; } My_string_Ok::My_string_Ok(int num,char c) { cout<<"有参构造"<<endl; ptr new char [20] ; len 0; for…

K8s安装部署(v1.28)--超详细(cri-docker作为运行时)

1、准备环境 ip角色系统主机名cpumem192.168.40.129mastercentos7.9k8smaster48192.168.40.130node1centos7.9k8snode148192.168.40.131node2centos7.9k8snode248192.168.40.132node3centos7.9k8snode348 2、系统配置&#xff08;所有节点&#xff09; 重要&#xff1a;首先…

怎么更换自己的ip地址?多种方法可实现

在当今的数字化时代&#xff0c;IP地址作为我们在网络世界中的“身份证”&#xff0c;扮演着举足轻重的角色。然而&#xff0c;有时候出于隐私保护、网络安全或是访问特定服务等需求&#xff0c;我们可能需要更换自己的IP地址。那么&#xff0c;如何实现这一目标呢&#xff1f;…

2024年10月2-4日(星期三-星期五)骑行(石林-老圭山)

2024年10月2-4日 (星期六&#xff09;骑行&#xff08;石林-大草坪---长坪---石头寨---海邑镇---老圭山&#xff09;&#xff0c;早8:30到9:00&#xff0c;新螺蛳湾客运站正门&#xff0c;地铁二号线南部客运站站出口集合&#xff0c;9:30装车&#xff0c;10:00出发。偶遇地点:…

网络安全前景大好,转行这些职位成了“香饽饽”

网络安全就业前景 大数据、人工智能、云计算、物联网、5G等新兴技术的高速发展&#xff0c;蒸蒸日上。但是随之也出现了许多问题&#xff0c;比如&#xff1a;政府单位、企业、个人信息泄露&#xff0c;网络安全问题日益严峻&#xff0c;网络空间安全建设刻不容缓。 网络安全…

【unity进阶知识3】封装一个事件管理系统

前言 框架的事件系统主要负责高效的方法调用与数据传递&#xff0c;实现各功能之间的解耦&#xff0c;通常在调用某个实例的方法时&#xff0c;必须先获得这个实例的引用或者新实例化一个对象&#xff0c;低耦合度的框架结构希望程序本身不去关注被调用的方法所依托的实例对象…

亲测好用,吐血整理 ChatGPT 3.5/4.0新手使用手册~

都知道ChatGPT很强大&#xff0c;聊聊天、写论文、搞翻译、写代码、写文案、审合同等等&#xff0c;无所不能~ 那么到底怎么使用呢&#xff1f;其实很简单了&#xff0c;国内AI产品发展也很快&#xff0c;很多都很好用了~ 我一直在用&#xff0c;建议收藏下来~ 有最先进、最…

古代的“契丹人”在今天属于哪个民族

在中国古代&#xff0c;自从我国历史上的夏朝建立以来&#xff0c;一共出现了二十多个朝代。随着朝代的不断更替&#xff0c;社会也在不断前进。如今&#xff0c;封建社会已经成为过去&#xff0c;朝代和政权已不再是同一个概念。例如&#xff0c;在三国时期&#xff0c;魏、蜀…

可视掏耳勺鸡肋吗?高清可视掏耳勺牌子推荐!

很多人习惯在洗漱完顺手拿一根棉签掏耳朵&#xff0c;但是棉签的表面直径大且粗糙&#xff0c;不易将耳朵深处的耳垢挖出&#xff0c;耳垢堆积在耳道深处长时间不清理会导致堵塞耳道&#xff0c;引起耳鸣甚至感染。而可视掏耳勺作为一种新型的挖耳工具&#xff0c;它的安全性也…

羽毛球场馆预约系统,便捷管理预约

全国羽毛球运动的热度不断上升&#xff0c;在健身行业中掀起了一股羽毛球热潮。同时羽毛球运动的风靡&#xff0c;也吸引了不少人入局&#xff0c;各种大大小小的羽毛球馆不断出现&#xff0c;为大众的羽毛球喜好提供了场地。 随着互联网的发展&#xff0c;羽毛球馆也开始向线…

程序员转型攻略:数据分析师、AI大模型工程师、产品经理、云计算工程师,哪个更适合你?

先给结论再说理由&#xff1a;数据分析师、AI大模型工程师、产品经理和云计算工程师。 这些领域不仅因应了当前技术发展的趋势&#xff0c;也为程序员提供了转型的广阔舞台和职业发展的新机遇。 一起来看看吧&#xff01; 数据分析师&#xff1a;数据驱动决策的关键 程序员…

开源大模型技术路线及趋势

1. 三个维度 大模型研发力量 学术机构 大模型创业公司 科技大厂 旗舰开源模型的形态/模态 基础大模型 -> instruct大模型 -> 多模态&#xff08;VL大模型 -> 类gpt-4o大模型&#xff09; 时间线 23年上半年 23年下半年 24年 25年 2. 核心观察 学术机构及…

帮助中心:如何搭建有效解决客户问题的内容

在竞争激烈的市场环境中&#xff0c;优质的客户服务是企业脱颖而出的关键之一。而搭建一个高效、全面的帮助中心&#xff0c;提供有效解决客户问题的内容&#xff0c;则是提升客户满意度和忠诚度的重要途径。本文将探讨如何搭建这样一个帮助中心&#xff0c;以确保客户在遇到问…

机器学习_神经网络_深度学习

【神经网络——最易懂最清晰的一篇文章 - CSDN App】https://blog.csdn.net/illikang/article/details/82019945?type=blog&rId=82019945&refer=APP&source=weixin_45387165 参考以上资料,可对神经网络有初步了解。接下来可参考书籍等投身实际项目中使用。 书…

7大网络安全机构真实测评:零基础转行网安这么选就对了~

最近有不少零基础的朋友想学网络安全&#xff0c;但网络一搜索&#xff0c;各大品牌的课程都跳出来&#xff0c;让人看得眼花缭乱&#xff0c;真不知道怎么选。 今天就比较几家主流的7大网络安全机构课程&#xff0c;综合对了对比测评。不知道怎么选的朋友们&#xff0c;千万别…

稳定日入100,分享一个适合练手的AI绘画副业赛道

现在的AI玩法真的太多了&#xff0c;以前搞副业的人坚定的贯彻了把AI当作工具的思想&#xff0c;开发出各种各样有意思的AI副业玩法。 比如最近这种用AI做的女生的漫画Vlog视频就特别的火 更多实操教程和AI绘画工具,可以扫描下方,免费获取 1.爆款分析 这类账号为什么比较容易…

为什么现在很多人对网络空间安全专业持劝退态度?

知乎上有网友提问&#xff1a; 为什么现在很多人对网络空间安全专业持劝退态度&#xff1f; 来自某中部985网安大三本科的自述&#xff1a; 当初报志愿的时候第一志愿计科&#xff0c;第二志愿网安&#xff0c;结果就录到网安了。 但其实这两年感受下来&#xff0c;网安和计科…

GESP等级考试C++二级-do...while语句

与《GESP等级考试C二级-while语句》中提到的while语句类似&#xff0c;do...while语句也是用于循环执行某些语句。 1 do...while语句的格式 do...while语句的格式如图1所示。 图1 do...while语句的格式 该语句首先执行do中的“若干操作”&#xff0c;之后判断while语句中的“…

nginx+keepalived健康检查案例详解(解决nginx出现故障却不能快速切换到备份服务器的问题)

文章目录 简介配置过程前置环境请看创建健康检查脚本结果测试 简介 在我们通过nginxkeepalived实现高可用后&#xff0c;会发现nginx出现故障的时候keepalived并不会将虚拟ip切换到备份服务器上其原理就是nginx和keepalived是两个独立的服务&#xff0c;Nginx的故障状态不会触…