HiDiff: 用于医学图像分割的混合扩散框架| 文献速递-基于深度学习的多模态数据分析与生存分析

news2024/12/23 7:22:27

Title

题目

HiDiff: Hybrid Diffusion Framework for Medical Image Segmentation

HiDiff: 用于医学图像分割的混合扩散框架

01

文献速递介绍

医学图像分割是将医学图像数据转化为有意义的、空间结构化的信息,如器官和肿瘤。随着深度学习(DL)技术的快速发展,这一领域取得了显著进步。基于深度学习的分割方法在划分器官/肿瘤和减少人工成本方面显示了有效性。目前,现有的基于深度学习的分割方法,包括基于卷积神经网络和视觉transformer的变体,通常使用交叉熵或Dice损失来学习从输入医学图像到分割掩码的映射函数。这种范式通常被称为判别方法,直接学习图像像素的分类概率。尽管这种方法很流行,但它们仅关注在像素特征空间中学习类之间的决策边界,而未能捕捉底层数据分布,因此未能捕捉内在的类特征。此外,它们学习到的特征空间不稳定,当远离决策边界时性能迅速下降,使得处理模糊边界和微小物体变得具有挑战性。

相比之下,基于生成的方式首先建模输入数据和分割掩码的联合概率,然后利用学习到的联合概率评估给定输入图像的分割掩码的条件分布,最后输出掩码预测。众多理论和实证研究表明,基于生成的方法由于直接建模底层数据分布,具有缓解其判别对手相关限制的潜力。然而,值得注意的是,现代生成模型也面临挑战,包括训练不稳定和推理速度慢。这些挑战促使人们探索结合判别和生成分割方法的集成方法,以缓解这些问题。

Abstract

摘要

医学图像分割随着深度学习(DL)技术的快速发展取得了显著进步。现有的基于深度学习的分割模型通常是判别性的;即,它们旨在学习从输入图像到分割掩码的映射。然而,这些判别方法忽视了底层数据分布和内在类别特征,导致特征空间不稳定。在这项工作中,我们提出用生成模型的底层数据分布知识来补充判别性分割方法。为此,我们提出了一种用于医学图像分割的新型混合扩散框架,称为HiDiff,它可以协同现有判别性分割模型和新生成扩散模型的优势。HiDiff包含两个关键组件:判别分割器和扩散优化器。

首先,我们利用任何常规训练的分割模型作为判别分割器,可以为扩散优化器提供分割掩码先验。其次,我们提出了一种新颖的二元伯努利扩散模型(BBDM)作为扩散优化器,通过建模底层数据分布,有效、高效和互动地优化分割掩码。第三,我们以交替协作的方式训练判别分割器和BBDM,使它们相互促进。

在腹部器官、脑肿瘤、息肉和视网膜血管分割数据集上进行的大量实验结果,涵盖了四种广泛使用的模态,证明了HiDiff在现有医学分割算法(包括最先进的基于transformer和扩散模型的算法)上的优越性能。此外,HiDiff在分割小物体和推广到新数据集方面表现出色。源码可在https://github.com/takimailto/HiDiff获得。

Method

方法

To effectively, efficiently, and interactively synergize thestrengths of existing discriminative segmentors and the proposed BBDM, we propose a novel hybrid diffusion frameworkfor medical image segmentation, as shown in Fig. 2. In thissection, we first elaborate on existing discriminative segmentors and the proposed diffusion refiner in Secs. II-A and II-B,respectively. Finally, we detail our hybrid diffusion frameworkwith an alternate-collaborative training strategy in Sec. II-C.

为了有效、高效且互动地协同现有判别分割器和提出的BBDM的优势,我们提出了一种用于医学图像分割的新型混合扩散框架,如图2所示。在本节中,我们首先分别在II-A和II-B节详细说明现有的判别分割器和提出的扩散优化器。最后,我们在II-C节详细介绍了我们的混合扩散框架及其交替协作的训练策略。

Conclusion

结论

This paper proposed a novel hybrid diffusion framework,HiDiff, for medical image segmentation, which can synergizethe strengths of existing discriminative segmentation modelsand new generative diffusion models, i.e. BBDM. The noveltyof our BBDM lies in three-fold: (i) effective: Bernoulli-baseddiffusion kernel to enhance the diffusion models in modelingthe discrete targets of the segmentation task, (ii) efficient: thebinarized diffusion refiner to significantly improve efficiencyfor inference with negligible computational costs, and (iii)interactive: cross transformer to enable interactive exchangebetween the diffusion generative feature and the discriminativefeature. We train HiDiff in an alternate-collaborative manner,which can mutually boost the discriminative segmentor andthe diffusion refiner during training. Extensive experimentalresults and detailed ablation studies validated the superior performance of HiDiff and the effectiveness of key componentsin HiDiff. We highlight that HiDiff is a principled frameworkfully compatible with existing DL-based segmentation models.

本文提出了一种用于医学图像分割的新型混合扩散框架 HiDiff,它能够协同现有判别分割模型和新的生成扩散模型(即 BBDM)的优势。我们的 BBDM 的创新之处在于以下三点:(i) 有效性:基于伯努利的扩散核以增强扩散模型在分割任务离散目标建模中的能力;(ii) 高效性:二值化扩散优化器显著提高推理效率,同时几乎不增加计算成本;(iii) 交互性:交叉转换器实现了扩散生成特征和判别特征之间的互动交换。我们以交替协作的方式训练 HiDiff,在训练过程中相互促进判别分割器和扩散优化器。大量实验结果和详细的消融研究验证了 HiDiff 的卓越性能和关键组件的有效性。我们强调,HiDiff 是一个与现有基于 DL 的分割模型完全兼容的基本框架。

Figure

图片

Fig. 1. Conceptual illustration of our HiDiff. We train our HiDiff in analternate-collaborative manner to synergize the strengths of existingdiscriminative segmentation and generative diffusion models.

图 1. HiDiff 的概念示意图。我们以交替协作的方式训练 HiDiff,以协同现有判别分割模型和生成扩散模型的优势。

图片

Fig. 2. Overview of the proposed HiDiff for medical image segmentation. Our HiDiff involves two key components: discriminative segmentor anddiffusion refiner, where the discriminative segmentor provides a segmentation mask prior for diffusion models while the diffusion refiner effectively,efficiently, and interactively refines the segmentation mask. Furthermore, we binarize our diffusion refiner and introduce a binary cross transformerto interactively exchange the discriminative and diffusion generative features, effectively refining the segmentation mask with negligible resources.

图 2. 提出的 HiDiff 用于医学图像分割的概述。HiDiff 包含两个关键组件:判别分割器和扩散优化器。判别分割器为扩散模型提供分割掩码先验,而扩散优化器则有效、高效且互动地优化分割掩码。此外,我们将扩散优化器二值化,并引入二值交叉转换器,以互动方式交换判别和生成扩散特征,从而以极少的资源有效地优化分割掩码。

图片

Fig. 3. Illustration of the proposed binarized cross transformer block and its constituent binarized cross multi-head attention modules.

图 3. 提出的二值交叉转换器块及其组成的二值交叉多头注意力模块的示意图。

图片

Fig. 4. Qualitative results of different segmentation methods for two cases, 0038 and 0008, from the Synapse testing set.

图 4. 来自 Synapse 测试集的两个案例(0038 和 0008)的不同分割方法的定性结果。

图片

Fig. 5. Qualitative results of different segmentation methods for four cases from the BraTS testing set

图 5. 来自 BraTS 测试集的四个案例中不同分割方法的定性结果。

图片

Fig. 6. Qualitative results of different segmentation methods for fourcases from the Kvasir-SEG and CVC-ClinicDB testing sets.

图 6.来自 Kvasir-SEG 和 CVC-ClinicDB 测试集的四个案例中不同分割方法的定性结果。

图片

Fig. 7. Qualitative results of different segmentation methods for fourcases from the Drive and CHASE DB1 testing sets.

图 7.来自 DRIVE 和 CHASE_DB1 测试集的四个案例中不同分割方法的定性结果。

图片

Fig. 8. Cross-dataset qualitative results of different segmentationmethods for four cases from the MSD testing set.

图 8. 不同分割方法在 MSD 测试集中四个案例的跨数据集定性结果。

图片

Fig. 9. Cross-dataset qualitative results of different methods on thepolyps segmentation task.

图 9. 在息肉分割任务中,不同方法的跨数据集定性结果。

图片

Fig. 10. Qualitative results of different segmentation methods for threecases from the small organ subset of the Synapse testing set.

图 10. 来自 Synapse 测试集小器官子集的三个案例中不同分割方法的定性结果。

图片

Fig. 11. Qualitative results of different segmentation methods for threecases from the small tumor subset of the BraTS testing set.

图 11. 来自 BraTS 测试集小肿瘤子集的三个案例中不同分割方法的定性结果。

图片

Fig. 12. Quantitative results of our HiDiff with three different discriminative segmentors: U-Net, SwinU-Net, and MERIT. HD95 is representedas HD95(NaN Ratio).

图 12. 我们的 HiDiff 与三种不同判别分割器(U-Net、SwinU-Net 和 MERIT)的定量结果。HD95 以 HD95(NaN 比率) 表示。

图片

Fig. 13. Qualitative case study on the effectiveness of diffusion refinement process for four cases from the Synapse testing set (0025, 0004, 0002,and 0036).

图 13. 来自 Synapse 测试集(0025、0004、0002 和 0036)的四个案例中扩散优化过程有效性的定性案例研究。

Table

图片

TABLE Iquantitative results on the synapse testing set. the hd95 is represented as hd95(nan ratio). i, ii, and iii represent discriminative, generative diffusion, and integrated methods, respectively.

表 ISynapse 测试集上的定量结果。HD95 以 HD95(NAN 比率) 表示。I、II 和 III 分别代表判别方法、生成扩散方法和集成方法。

图片

TABLE II  quantitative results on the brats testing set. hd95 is represented as hd95(nan ratio). i, ii, and iii represent discriminative, generative diffusion, and integrated methods, respectively.

表 II  BraTS 测试集上的定量结果。HD95 以 HD95(NAN 比率) 表示。I、II 和 III 分别代表判别方法、生成扩散方法和集成方法。

图片

TABLE III quantitative results on the kvasir-seg and cvc-clinicdb testing sets. nan ratios are omitted because they are all 0.

表 III KVASIR-SEG 和 CVC-CLINICDB 测试集上的定量结果。NAN 比率省略,因为它们均为 0。

图片

TABLE IVquantitative results on the drive and chase_db1 testing sets. nan ratios are omitted because they are all 0.

表 IVDRIVE 和 CHASE_DB1 测试集上的定量结果。NAN 比率省略,因为它们均为 0。

图片

TABLE Vcross-dataset quantitative results of ct organ segmentation task. nan ratios are omitted because they are all 0.

表 VCT 器官分割任务的跨数据集定量结果。NAN 比率省略,因为它们均为 0。

图片

TABLE VI cross-dataset quantitative results of the polyps segmentation task using the kvasir-seg and cvc-clinicdb datasets. hd95 is represented as hd95(nan ratio).

表 VI使用 KVASIR-SEG 和 CVC-ClinicDB 数据集进行息肉分割任务的跨数据集定量结果。HD95 以 HD95(NAN 比率) 表示。

图片

TABLE VII quantitative results on a small organ subset of the synapse testing set. the hd95 is represented as hd95(nan ratio).

表 VIISynapse 测试集小器官子集上的定量结果。HD95 以 HD95(NAN 比率) 表示

图片

TABLE VIIIquantitative results on a small tumor subset of the brats testing set. the hd95 is represented as hd95(nan ratio).

表 VIIIBraTS 测试集小肿瘤子集上的定量结果。HD95 以 HD95(NAN 比率) 表示。

图片

TABLE IX ablation results of diffusion refinement. nan ratios are omitted because they are all 1.04%

表 IX扩散优化的消融结果。NAN 比率省略,因为它们均为 1.04%。

图片

TABLE X  ablation results of training strategy, focal loss, x-former, and binarization. v1, v2, v3, v4, and v5 represent 5 implementations. nan ratios are omitted because they are all 1.04%.

表 X训练策略、Focal Loss、X-Former 和二值化的消融结果。V1、V2、V3、V4 和 V5 代表 5 种实现。NAN 比率省略,因为它们均为 1.04%。

图片

TABLE XI flops (×1010) and storage (mb) of different methods. note that for integrated methods, flops are presented as flops of discriminative segmentor + flops of a single forward process of the diffusion refiner × diffusion steps, and storage is presented as storage of discriminative segmentor + storage of diffusion refiner.

表 XI不同方法的 FLOPS(×1010)和存储(MB)。注意,对于集成方法,FLOPS 表示为判别分割器的 FLOPS + 单次前向过程的扩散优化器 FLOPS × 扩散步骤,存储表示为判别分割器的存储 + 扩散优化器的存储。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1937802.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

primeflex教学笔记20240720, FastAPI+Vue3+PrimeVue前后端分离开发

练习 先实现基本的页面结构&#xff1a; 代码如下&#xff1a; <template><div class"flex p-3 bg-gray-100 gap-3"><div class"w-20rem h-12rem bg-indigo-200 flex justify-content-center align-items-center text-white text-5xl">…

RESTful API设计指南:构建高效、可扩展和易用的API

文章目录 引言一、RESTful API概述1.1 什么是RESTful API1.2 RESTful API的重要性 二、RESTful API的基本原则2.1 资源导向设计2.2 HTTP方法的正确使用 三、URL设计3.1 使用名词而非动词3.2 使用复数形式表示资源集合 四、请求和响应设计4.1 HTTP状态码4.2 响应格式4.2.1 响应实…

新能源汽车空调系统的四个工作过程

汽车空调制冷系统组成 1.汽车空调制冷系统组成 以R134a为制冷剂的汽车空调制冷系统主要包括压缩机、电磁离合器、冷凝器、 散热风扇、储液于燥器、膨胀阀、蒸发器、鼓风机、制冷连接管路、高低压检测 连接接头、调节与控制装置等组成。 汽车空调的四个过程 1压缩过程 传统车…

nginx的access.log日志输出请求总数、QPS和平均带宽

适用格式 #log_format main $remote_addr - $remote_user [$time_local] "$request" # $status $body_bytes_sent "$http_referer" # "$http_user_agent" "$http_x_forwarded_for"; 形如&#…

差分进化算法原理及其MATLAB/Python代码

1.算法简介 引用自&#xff1a;Storn R, Price K. Differential evolution–a simple and efficient heuristic for global optimization over continuous spaces[J]. Journal of global optimization, 1997, 11: 341-359. 今天给大家带来的是一个非常经典的智能优化算法–差分…

buu做题(6)

目录 [GWCTF 2019]我有一个数据库 [WUSTCTF2020]朴实无华 [GWCTF 2019]我有一个数据库 什么都没有, 尝试用dirsearch扫一下目录 可以扫到一个 /phpmyadmin 可以直接进入到数据库里面 但里面没什么东西 可以看到它的版本不是最新的, 搜一下相关的漏洞 phpMyAdmin 4.8.1后台文…

OCR识别采购单小程序管理助手

千呼新零售2.0系统是零售行业连锁店一体化收银系统&#xff0c;包括线下收银线上商城连锁店管理ERP管理商品管理供应商管理会员营销等功能为一体&#xff0c;线上线下数据全部打通。 适用于商超、便利店、水果、生鲜、母婴、服装、零食、百货、宠物等连锁店使用。 详细介绍请…

nodejs学习之process.env.NODE_ENV

简介 process对象是 Node 的一个全局对象&#xff0c;提供当前 Node 进程的信息。它可以在脚本的任意位置使用&#xff0c;不必通过require命令加载。该对象部署了EventEmitter接口。 process.env 属性返回包含用户环境的对象 使用 pnpm init新建index.js const { env } r…

在win10上通过WSL和docker安装Ubuntu子系统,并配置Ubuntu可成功使用宿主机GPU

本文主要记录win10系统上,通过WSL的Ubuntu系统以及Docker使用GPU的全部过程。 文章目录 1、 启用hyper-v2、 安装docker3、 安装WSL3.1 安装WSL23.1.1 检查是否安装了WSL23.1.1 安装和配置 WSL 23.2 安装Ubuntu 子系统3.3 检查并修改WSL版本4、docker配置ubuntu20.04 LTS5、下…

linux系统下,matplotlib无法显示中文字体的解决办法

1.查看自己系统是否安装了中文字体 看是否有这个目录&#xff0c;如果没有的话&#xff0c;则进行安装 2.安装中文的字体 sudo apt-get install ttf-wqy-zenhei3.测试matplotlib进行显示中文字体 from matplotlib.font_manager import FontProperties font FontProperties…

什么?突降福利假日——Windows全球蓝屏!

在科技界,任何大型软件公司的产品出现问题都可能成为头条新闻,而当这个问题是“蓝屏死机”(Blue Screen of Death, BSOD),并且影响范围覆盖全球时,其影响力更是无法估量。 近日,微软公司就经历了一场史无前例的全球性蓝屏事件,这一事件不仅考验了微软的技术应对能力,也…

员工泄密公司资料起诉有用吗或者用什么软件管控防止

员工泄密公司资料时&#xff0c;公司采取法律行动起诉员工确实是一种有效的应对方式&#xff0c;尤其是当泄密行为对公司造成了显著的经济或名誉损失时。 因为法律有专门的条款规定。 法律界定 民事责任 当员工泄密对公司造成经济损失时&#xff0c;公司可以依据《中华人民共…

pytorch的17个Loss和10个优化函数

pytorch的17个Loss和10个优化函数 一、 17个Loss 函数二、10个优化器 一、 17个Loss 函数 二、10个优化器 开始&#xff1a;

C#定时发送邮件功能

C#定时发送邮件功能 背景 自动运维监控客户端在自动关闭时&#xff0c;需要给实施同学发送提醒邮件。支持163邮箱、qq邮箱、火狐邮箱等各种通用邮箱。 定时器发送邮件 代码 邮件功能模块 using ITSLog.LogManage; using System; using System.Collections.Generic; using…

FLINK-运行架构

为什么要学习Flink运行架构&#xff1f; 虽然现在大厂的开发工具都非常高效、只需要进行参数配置、Flink-sql写业务逻辑&#xff0c;但是在资源配置逻辑优化上不可避免需要了解底层的组件配置。面试时可能也会被问到FLINK是如何进行资源分配、作业运行的等。 以下是在学习时记录…

【一刷《剑指Offer》】面试题 34:丑数

力扣对应题目链接&#xff1a;264. 丑数 II - 力扣&#xff08;LeetCode&#xff09; 牛客对应题目链接&#xff1a;丑数_牛客题霸_牛客网 (nowcoder.com) 一、《剑指Offer》对应内容 二、分析题目 根据题意&#xff0c;每个丑数都可以由其他较小的丑数通过乘以 2 或 3 或 5 …

C++字体库开发之fontconfig使用五

代码 #include <cassert> #include <algorithm> #include "fontconfig/fontconfig.h" #include <stdexcept> #include <iostream>#define HAS_FALLBACK_CONFIGURATIONenum FontStyle : uint16_t {Regular 0,Italic 0x01,Bold 0x02, };en…

如何在 Mac 上恢复丢失或删除的文件

也许您放错了 Mac 上的某个文件&#xff0c;或者永久删除了现在需要的文件。根据您丢失或删除文件的时间&#xff0c;有多种方法可以恢复 MacOS 上的项目。 我们从最快、最简单的方法开始&#xff0c;然后逐渐采用更耗时或更昂贵的方法来恢复 Mac 上的文件、文件夹和其他项目。…

MySQL添加索引时会锁表吗?

目录 简介Online DDL概念Online DDL用法总结 简介 在MySQL5.5以及之前的版本&#xff0c;通常更改数据表结构操作&#xff08;DDL&#xff09;会阻塞对表数据的增删改操作&#xff08;DML&#xff09;。 MySQL5.6提供Online DDL之后可支持DDL与DML操作同时执行&#xff0c;降低…

CentOS 7 yum官方源失效

问题 2024年7月&#xff0c;官方对centos 7停止了维护&#xff0c;yum的源网址mirror.centos.org也已经无法访问。 在此情况下&#xff0c;无法正常使用yum进行安装和更新工具。 在尝试了更换阿里源之后&#xff0c;仍然有部分工具库无法访问。 通用解决方案 1. 打开/etc/y…