无监督医学图像翻译与对抗扩散模型| 文献速递-深度学习结合医疗影像疾病诊断与病灶分割

news2024/11/10 13:20:35

Title

题目

Unsupervised Medical Image Translation With Adversarial Diffusion Models

无监督医学图像翻译与对抗扩散模型

01

文献速递介绍

多模态成像对于全面评估人体解剖结构和功能至关重要[1]。通过各自模态捕获的互补组织信息,有助于提高诊断准确性并改善下游成像任务的性能。然而,由于经济和劳动成本的挑战,多模态协议的广泛应用面临困难。

医学图像翻译是一个强大的解决方案,涉及在已获得的源模态的指导下合成缺失的目标模态。考虑到跨模态之间组织信号的非线性变化,这种恢复是一个病态问题。

在这个关键时刻,基于学习的方法通过整合非线性数据驱动的先验来改善问题的条件,提供了性能的飞跃。

学习-based的图像翻译涉及训练网络模型来捕获给定源图像的目标条件分布的先验。近年来,由于它们在图像合成中的出色逼真性,生成对抗网络(GAN)模型已被广泛采用于翻译任务。

通过捕获关于目标分布的信息,鉴别器同时指导生成器从源图像到目标图像的一次性映射,基于这种对抗机制,GAN在多种翻译任务中报告了最新的结果,包括跨MR扫描仪的合成,多对比MR合成,以及跨模态合成。

虽然强大,GAN模型通过生成器和鉴别器的相互作用间接表征目标模态的分布,而不评估可能性。这种隐式表征可能容易受到学习偏差的影响,包括早期收敛和模式崩溃。此外,GAN模型通常采用快速的一次性采样过程,没有中间步骤,从根本上限制了网络执行的映射的可靠性。反过来,这些问题可能限制合成图像的质量和多样性。

作为一个有希望的替代方法,最近的计算机视觉研究采用基于明确可能性表征和逐渐采样过程的扩散模型,以改善无条件生成建模任务中的样本保真度。然而,扩散方法在医学图像翻译中的潜力仍然大部分未被探索,部分原因是图像采样的计算负担和常规扩散模型非配对训练的困难。

Abstract

摘要

Imputation of missing images via source-to**target modality translation can improve diversity in medicalimaging protocols. A pervasive approach for synthesizingtarget images involves one-shot mapping through generative adversarial networks (GAN). Yet, GAN models thatimplicitly characterize the image distribution can suffer fromlimited sample fidelity. Here, we propose a novel methodbased on adversarial diffusion modeling, SynDiff, forimproved performance in medical image translation. To capture a direct correlate of the image distribution, SynDiffleverages a conditional diffusion process that progressivelymaps noise and source images onto the target image. Forfast and accurate image sampling during inference, largediffusion steps are taken with adversarial projections in thereverse diffusion direction. To enable training on unpaireddatasets, a cycle-consistent architecture is devised withcoupled diffusive and non-diffusive modules that bilaterallytranslate between two modalities. Extensive assessmentsare reported on the utility of SynDiff against competingGAN and diffusion models in multi-contrast MRI and MRICT translation. Our demonstrations indicate that SynDiffoffers quantitatively and qualitatively superior performanceagainst competing baselines.

通过源到目标模态转换来填补缺失图像可以改善医学成像协议的多样性。合成目标图像的普遍方法涉及通过生成对抗网络(GAN)进行一次性映射。然而,隐式表征图像分布的GAN模型可能存在样本保真度有限的问题。在这里,我们提出了一种基于对抗扩散建模的新方法SynDiff,用于改善医学图像翻译的性能。为了捕捉图像分布的直接相关性,SynDiff利用逐步映射噪声和源图像到目标图像的条件扩散过程。在推断过程中,为了快速准确地进行图像采样,采用了大的扩散步骤和反向扩散方向的对抗投影。为了在非配对数据集上进行训练,设计了一个循环一致的架构,其中包括耦合的扩散和非扩散模块,双向地在两种模态之间进行翻译。在多对比MRI和MRI CT转换中,我们对SynDiff与竞争的GAN和扩散模型进行了广泛评估。我们的演示表明,SynDiff在量化和定性性能上均优于竞争基准。

Method

方法

We demonstrated SynDiff on two multi-contrast brain MRIdatasets (IXI,1 BRATS [61]), and a multi-modal pelvic MRICT dataset. In each dataset, a three-way split wasperformed to create training, validation and test sets with nosubject overlap. While all unsupervised medical image translation models were trained on unpaired images, performanceassessments necessitate the presence of paired and registeredsource-target volumes. Thus, in the validation and test sets,separate volumes of a given subject were spatially registered toenable calculation of quantitative metrics. Registrations wereimplemented in FSL via affine transformation and mutualinformation loss. In each subject, each imaging volumewas separately normalized to a mean intensity of 1. Themaximum voxel intensity across subjects was then normalizedto 1 to ensure an intensity range of  Cross-sectionalimages were zero-padded as necessary to attain a consistent256 × 256 image size in all datasets prior to modeling.

我们在两个多对比脑部MRI数据集(IXI、BRATS)和一个多模态盆腔MRI CT数据集  上展示了SynDiff。在每个数据集中,进行了三路分割,以创建训练、验证和测试集,并确保主体之间没有重叠。尽管所有无监督医学图像翻译模型都是在非配对图像上训练的,性能评估需要配对并注册的源-目标体积。因此,在验证和测试集中,给定主体的不同体积被空间配准,以便计算定量指标。配准是通过FSL中的仿射变换和互信息损失实现的 。在每个主体中,每个成像体积都被单独归一化到平均强度为1。然后,跨主体的最大像素强度被归一化为1,以确保强度范围为。在建模之前,根据需要对横截面图像进行零填充,以达到所有数据集中一致的256 × 256图像大小。

Conclusion

结论

In this study, we introduced a novel adversarial diffusionmodel for medical image translation between source andtarget modalities. SynDiff leverages a fast diffusion processto efficiently synthesize target images, and a conditionaladversarial projector for accurate reserve diffusion sampling.Unsupervised learning is achieved via a cycle-consistent architecture that embodies coupled diffusion processes between thetwo modalities. SynDiff achieves superior quality comparedto state-of-the-art GAN and diffusion models, and it holdsgreat promise for high-fidelity medical image translation. Thefast conditional diffusion process in SynDiff might also offerperformance benefits over GANs in other applications such asdenoising and super-resolution.

在本研究中,我们引入了一种新颖的对抗性扩散模型,用于医学图像在源和目标模态之间的翻译。SynDiff利用快速扩散过程有效合成目标图像,并使用条件对抗投影器进行准确的逆向扩散采样。通过循环一致的架构实现了无监督学习,该架构体现了两种模态之间耦合的扩散过程。与最先进的GAN和扩散模型相比,SynDiff实现了更高质量的图像合成,对高保真度的医学图像翻译具有巨大潜力。SynDiff中的快速条件扩散过程在其他应用(如去噪和超分辨率)中也可能比GAN提供更好的性能优势。

Results

结果

We demonstrated SynDiff for unsupervised MRI contrasttranslation against state-of-the-art non-attentional GAN(cGAN, UNIT, MUNIT), attentional GAN (AttGAN,SAGAN), and regular diffusion (DDPM, UNIT-DDPM)models. First, experiments were performed on brain imagesfrom healthy subjects in IXI.

我们展示了SynDiff在无监督MRI对比度翻译上的性能,与最先进的非注意力GAN(cGAN、UNIT、MUNIT)、注意力GAN(AttGAN、SAGAN)和普通扩散(DDPM、UNIT-DDPM)模型进行了对比。首先,在IXI健康主题的脑部图像上进行了实验。

Figure

图片

Fig. 1. a) Regular diffusion models gradually transform between actual image samples for the target modality (x0) and isotropic Gaussian noise (x**T)in T steps, with T on the order of thousands. Each forward step (right arrows) adds noise to the current sample to create a noisier sample with forwardtransition probability q

Fig. 1. a) 普通扩散模型在数千个步骤(T)中逐渐在目标模态(x₀)的实际图像样本和各向同性高斯噪声(xᵀ)之间进行转换。每个正向步骤(右箭头)向当前样本添加噪声,以创建一个更嘈杂的样本,其正向转移概率为q

图片

Fig. 2. For unsupervised learning, SynDiff leverages a cycle-consistent architecture that bilaterally translates between two modalities (A, B). Forsynthesizing a target image ˆx A0of modality A, the diffusive module in Fig. 1b requires guidance from a source image y B of modality B for the sameanatomy. However, a paired source image of the same anatomy might be unavailable in the training set. To enable training on unpaired images,SynDiff uses a non-diffusive module to first estimate a paired source image ˜y B from x A0. Similarly, for synthesizing a target image ˆx B0of modality B withthe diffusive module, the non-diffusive module first estimates a paired source image ˜y A from x B0. a) To do this, the non-diffusive module comprisestwo generator-discriminator pairs (Gφ A,B, Dφ A,B) that generate initial translation estimates for x A0 → ˜y B (orange) and x B0 → ˜y* A (green). b) Theseinitial translation estimates ˜y A,B are then used as guiding source-modality images in the diffusive module. For cycle-consistent learning, the diffusivemodule also comprises two generator-discriminator pairs (Gθ A,B, Dθ A,B) to generate denoised image estimates for (x At, ˜yB , t) → ˆx A−k (yellow) and(x Bt, ˜y A , t) → ˆx Bt−k (blue).

Fig. 2. 对于无监督学习,SynDiff利用了一个循环一致的架构,在两种模态(A,B)之间双向进行翻译。为了合成模态A的目标图像ˆx A0,如图1b中的扩散模块所需,需要来自模态B的同一解剖结构的源图像y B的指导。然而,在训练集中可能找不到同一解剖结构的配对源图像。为了在非配对图像上进行训练,SynDiff使用非扩散模块首先从x A0估计配对的源图像˜y B。类似地,对于合成模态B的目标图像ˆx B0,非扩散模块首先从x B0估计配对的源图像˜y A。

a) 非扩散模块包括两个生成器-鉴别器对(Gφ A,B,Dφ A,B),用于生成x* A0 → ˜y B(橙色)和x B0 → ˜y A(绿色)的初始翻译估计。

b) 这些初始翻译估计˜y A,B然后在扩散模块中作为引导源模态图像。为了循环一致学习,扩散模块还包括两个生成器-鉴别器对(Gθ A,B,Dθ A,B),用于为(x At, ˜y B, t)→ ˆx At−k(黄色)和(x Bt, ˜y A, t)→ ˆx Bt−k(蓝色)生成去噪图像估计。

图片

Fig. 3. SynDiff was demonstrated on IXI for translation between MRI contrasts. Synthesized images from competing methods are displayed alongwith the source and the ground-truth target (reference) images for representative a) T1→T2, b) T2→PD tasks. Display windows of a) [0 0.65],b) [0 0.80] are used. Compared to baselines, SynDiff yields lower noise and artifacts, and maintains higher anatomical fidelity.

Fig. 3. 在IXI数据集上展示了SynDiff在MRI对比度之间的翻译。显示了来自竞争方法的合成图像,以及代表性任务的源图像和目标(参考)图像:a) T1→T2,b) T2→PD。显示窗口分别为a) [0 0.65],b) [0 0.80]。与基线相比,SynDiff产生的图像噪声和伪影更少,保持了更高的解剖学保真度。

图片

Fig. 4. SynDiff was demonstrated on BRATS for translation between MRI contrasts. Synthesized images are displayed along with the source andthe ground-truth target (reference) images for representative a) T1→T2, b) T2→FLAIR tasks. Display windows of a) [0 0.75], b) [0 0.80] are used.SynDiff lowers noise/artifact levels and more accurately depicts detailed structure compared to baselines.

Fig. 4. 在BRATS数据集上展示了SynDiff在MRI对比度之间的翻译。显示了合成图像,以及代表性任务的源图像和目标(参考)图像:a) T1→T2,b) T2→FLAIR。显示窗口分别为a) [0 0.75],b) [0 0.80]。与基线相比,SynDiff降低了噪声/伪影水平,并更准确地描绘了详细结构。

图片

Fig. 5. SynDiff was demonstrated on the pelvic dataset for multi-modal MRI-CT translation. Synthesized images are displayed along with the sourceand the ground-truth target (reference) images for representative a) T2→CT, b) accelerated T1→CT tasks. Display windows of a) [-1000 1050] HU,and b) [-1000 1000] HU are used. Compared to diffusion and GAN baselines, SynDiff achieves lower artifact levels, and more accurately estimatesanatomical structure near diagnostically-relevant regions.

Fig. 5. 在盆腔数据集上展示了SynDiff进行多模态MRI-CT翻译。显示了合成图像,以及代表性任务的源图像和目标(参考)图像:a) T2→CT,b) 加速T1→CT。显示窗口分别为a) [-1000 1050] HU,b) [-1000 1000] HU。与扩散和GAN基线相比,SynDiff实现了更低的伪影水平,并更准确地估计了与诊断相关区域附近的解剖结构。

图片

Fig. 6. Performance of competing methods as a function of added noise level on source-modality images. Results shown for the representative

T2→CT task in terms of PSNR (left), SSIM (right).

Fig. 6. 竞争方法在添加到源模态图像的噪声水平函数上的性能。以PSNR(左)和SSIM(右)显示了代表性的T2→CT任务的结果。

图片

Fig. 7. The adversarial projector in SynDiff with T/k=4 steps wascompared against a variant model using an ℓ1-loss based projector withT/k=4 and T/k=1000. Image samples are shown for the unconditionalsynthesis tasks: a) T1 in IXI, b) T2 in BRATS and c) CT in pelvicdatasets. Display windows of a) [0 0.90], b) [0 0.80] for MRI images, andc) [-1000 1300] HU for CT images are used.

Fig. 7. 在SynDiff中,使用T/k*=4步的对抗投影器与使用基于ℓ1损失的投影器的变体模型进行了比较,其中T/k*=4和T/k=1000。显示了无条件合成任务的图像样本:a) IXI中的T1,b) BRATS中的T2,c) 盆腔数据集中的CT。MRI图像的显示窗口分别为a) [0 0.90],b) [0 0.80],CT图像为c) [-1000 1300] HU。

Table

图片

TABLE I description of variables related to images, diffusion processes, networks and probability distributions. throughout the manuscript, vectorial quantities are annotated in bold font

表 I图像、扩散过程、网络和概率分布相关变量描述。

在整篇文章中,向量量用粗体字体标注。

图片

TABLE II performance for multi-contrast mri translation tasks in ixi. psnr (db) and ssim (%) are listed as mean±std across the test set. boldface marks the top-performing model in each task

表II在IXI数据集中多对比MRI翻译任务的性能。PSNR(分贝)和SSIM(百分比)列出了在测试集上的平均±标准差。粗体字标记了每个任务中表现最佳的模型。

图片

TABLE III performance for multi-contrast mri translation tasks in brats. psnr (db) and ssim (%) listed as mean±std across the test set

表III在BRATS数据集中多对比MRI翻译任务的性能。PSNR(分贝)和SSIM(百分比)列出了在测试集上的平均±标准差。

图片

TABLE IVperformance for multi-modal mri-ct translation tasks in the pelvic dataset. psnr (db) and ssim (%) listed as mean±std across the test set.‘acc.’ stands for accelerated

表 IV在盆腔数据集中多模态MRI-CT翻译任务的性能。PSNR(分贝)和SSIM(百分比)列出了在测试集上的平均±标准差。“ACC.”代表加速。

图片

TABLE Vaverage training times per cross-section (sec), inference times per cross-section (sec) and memory load (gigabytes)

表 V每个横截面的平均训练时间(秒)、推断时间(秒)和内存负载(GB)。

图片

TABLE VI  performance of variant models in unconditional synthesis tasks. fid is listed across the training set

表VI变体模型在无条件合成任务中的性能。FID(生成图像分布之间的Frechet距离)列出了在训练集上的值。

图片

TABLE VII performance of variant models ablated of adversarial loss, cycle-consistency loss and the diffusive module. psnr and ssim listed as mean±std across the test set

表 VII变体模型在去除对抗损失、循环一致性损失和扩散模块后的性能。PSNR和SSIM列出了在测试集上的平均±标准差。

图片

TABLE VIII performance of variant models for varying number of steps t/k and varying loss-term weights (λ₁φ, λ₁θ, λ₂φ, λ₂θ).psnr and ssim listed as mean±std across the test set

表VIII变体模型在不同步骤T/k数和不同损失项权重(λ1φ、\λ1θ、λ2φ、\λ2θ)下的性能。PSNR和SSIM列出了在测试集上的平均±标准差。

图片

TABLE IX performance of variant models as mean±std across the test set. the non-diffusive module was pretrained in variant models. in pretrained-frozen, the non-diffusive module was not updated while training the diffusive module. in pretrained-trained, the non-diffusive module was also updated while training the diffusive module

表 IX 变体模型在测试集上的平均±标准差性能。非扩散模块在变体模型中进行了预训练。在预训练-冻结中,非扩散模块在训练扩散模块时未更新。在预训练-训练中,非扩散模块在训练扩散模块时也进行了更新。

图片

TABLE X performance of variant models as mean±std across the test set. in variant models, the non-diffusive module was only trained for nₙD epochs while the diffusive module was fully trained

表 X 变体模型在测试集上的平均±标准差性能。在变体模型中,非扩散模块仅在nₙ₋D个时期内进行训练,而扩散模块则进行了完全训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1840471.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

安装免费版的jfrog artifactory oss

1、下载 软件,本案例安装的是 jfrog-artifactory-oss-7.59.11-linux.tar.gz https://releases.jfrog.io/artifactory/bintray-artifactory/org/artifactory/oss/jfrog-artifactory-oss/ 2、解压下载下来的压缩包 tar zxf jfrog-artifactory-oss-7.59.11-linux.tar…

护眼台灯选购:台灯怎么选对眼睛好?

如今孩子们的学习压力越来越大,熬夜学习已成常态,视力问题也日益凸显。尽管没有详细的地域数据,但整体而言,中国青少年的近视率已经高居世界第一位,且不同地区的近视率可能存在一定的差异。眼睛健康愈发受到关注&#…

探索数据分析无限潜能:vividime Desktop助力企业智能决策

在数字化浪潮席卷全球的今天,数据已经成为企业最宝贵的资产之一。通过对海量数据的深度挖掘和分析,企业能够洞察市场趋势、优化运营流程、提升用户体验,从而在激烈的市场竞争中脱颖而出。永洪科技的vividime Desktop作为一款功能强大、操作简…

Survival Animations

一套生存游戏的动画集,包括采集、建造、捕鱼、剥皮/鞣制、篝火等更多内容。 总动画数:89 建造/制作 30 篝火 28 饮水 3 水壶 3 觅食 2 治疗 3 空闲 1 原始捕鱼 7 剥皮 1 矛捕鱼 4 伐木 5 下载:​​Unity资源商店链接资源下载链接 效果图:

docker容器内部网络不通,宿主机有网

在docker容器中能ping www.baidu.com 但是curl www.baidu.com没有反应。 最终排查看到是mtu设置的问题。 MTU( Maximum Transmission Unit,最大传输单位),用来设置描述网络接口的最大传输量,需要注意的是,每个网络接…

【桌面运维 1.0】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1、Windows系统安装 卡在 网络连接怎么办 1、Windows系统安装 卡在 网络连接怎么办 关键步骤 : shift F10,调出运行框,输入以下…

边缘微型AI的宿主?—— RISC-V芯片

一、RISC-V技术 RISC-V(发音为 "risk-five")是一种基于精简指令集计算(RISC)原则的开放源代码指令集架构(ISA)。它由加州大学伯克利分校在2010年首次发布,并迅速获得了全球学术界和工…

从粉丝基础到带货数据:全方位解读TikTok带货达人的选择之道

在如今的数字营销时代,TikTok已成为品牌推广和产品销售的重要平台。通过与合适的TikTok带货达人合作,品牌可以迅速吸引大量的潜在客户,实现销售转化。然而,选择合适的TikTok达人需要慎重考虑多个因素。本文Nox聚星将和大家详细阐述…

再进一步!deepin V23成功适配SpacemiT MUSE™ Box

内容来源:deepin(深度)社区 deepin作为国内领先的Linux操作系统发行版,一直致力于为用户提供更广泛的硬件支持,并积极投身于蓬勃发展的RISC-V生态建设。自deepin-ports SIG(特别兴趣小组)成立以…

企业设备管理现状与解决方案

在当今企业运营中,设备管理作为保障生产稳定、提升效率的重要环节,其复杂性和挑战性日益凸显。无论是生产车间、石油化工、物业小区,还是消防器材、建筑施工等领域,都面临着设备故障频发、维修流程繁琐等共性问题。 为了帮助企业…

PostgreSQL源码分析——口令认证

认证机制 对于数据库系统来说,其作为服务端,接受来自客户端的请求。对此,必须有对客户端的认证机制,只有通过身份认证的客户端才可以访问数据库资源,防止非法用户连接数据库。PostgreSQL支持认证方法有很多&#xff1…

商淘云:服装实体店引流会员营销方案

服装零售实体店面临着越来越大的挑战,尤其是在吸引和保持忠诚顾客方面。为了应对这一挑战,制定一套有效的引流会员营销方案显得尤为重要。商淘云将探讨如何通过创新的营销策略和增强的顾客体验,提升实体店的会员数量和销售业绩,从…

酒店会员寄存酒水管理方法,佳易王酒水寄存管理系统一卡管理多个商品操作教程

酒店会员寄存酒水管理方法,佳易王酒水寄存管理系统一卡管理多个商品操作教程 一、前言 以下软件操作教程以,佳易王酒店酒水寄存管理软件为例说明 软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 1、会员项目设置操作教程 点击 导…

地图上绘制地铁线路

需求背景 不管是之前的pms 地铁还是location都会有需求涉及到地图上绘制地铁线路,来查看当前位置是否靠近地铁口,常规的交互可以看下高德地图,如图所示: 需求分析 不管是高德地图还是百度地图都提供了简易版的地铁线路图&#x…

从零开始! Jupyter Notebook的安装教程

🚀 从零开始! Jupyter Notebook的安装教程 摘要 📄 Jupyter Notebook 是一个广受欢迎的开源工具,特别适合数据科学和机器学习的开发者使用。本文将详细介绍从零开始安装 Jupyter Notebook 的步骤,包括各种操作系统的安装方法&am…

Fisnar Liquid Control 操作维修手LC Pump Manual Twinmixer Maintenance 中文

Fisnar Liquid Control 操作维修手LC Pump Manual Twinmixer Maintenance 中文

python读取excel中的图片超链接,批量下载到本地

1、代码 import xlrd import requestsread_path C:\\Users\\asus\\Desktop\\大法\\公务员\\国考\\行测\\1-推理判断\\URLs.xlsx bk xlrd.open_workbook(read_path) shxrange range(bk.nsheets) sh bk.sheet_by_name("Sheet2") nrows sh.nrows ncols sh.ncols …

Linux安装kvm虚拟机

kvm是基于内核的虚拟机,为什么要用kvm不用vmware、virtual box… 只有一个原因,它非常快!本机使用linux开发也是因为它快!linux在老电脑上都能流畅运行,更别说现代电脑,如果你觉得装Linux并没有比win快多少…

【网络安全学习】漏洞扫描:-01- 漏洞数据库searchsploit的使用

漏洞数据库是收集和存储各种软件漏洞信息的资源库。 漏洞数据库通常包含漏洞的名称、编号、描述、影响范围、危害等级、解决方案等信息,有些还提供漏洞的分析报告、演示视频、利用代码等内容。 1.常用的在线漏洞库: 国家信息安全漏洞共享平台 https:/…

pytorch基础【4】梯度计算、链式法则、梯度清零

文章目录 梯度计算计算图(Computational Graph)梯度求导(Gradient Computation)函数与概念 示例代码更多细节梯度求导的过程梯度求导的基本步骤示例代码注意事项总结 链式法则是什么?链式法则的数学定义链式法则在深度…