【技术追踪】UNest:一种用于非配对医学图像合成的新框架(MICCAI-2024)

news2024/10/5 15:32:28

  前天看了一篇文章图像分割用diffusion,今天看了篇文章图像合成不用diffusion,你说说这~

  传送门:【技术追踪】SDSeg:医学图像的 Stable Diffusion 分割(MICCAI-2024)

  UNest:UNet结构的Transformer,一种用于非配对医学图像合成的新框架,涵盖三种模态(MR、CT和PET),在六项医学图像合成任务中将最近的方法改进了19.30%。


论文:Structural Attention: Rethinking Transformer for Unpaired Medical Image Synthesis
代码:https://github.com/HieuPhan33/MICCAI2024-UNest (即将开源)


0、摘要

  非配对医学图像合成的目的是为准确的临床诊断提供补充信息,并解决获得对齐的多模态医学扫描的挑战。
  由于Transformer能够捕获长期依赖关系,他们在图像转换任务中表现非常出色,但只是在监督训练中有效,在非配对图像转换中性能下降,特别是在合成结构细节方面。
  本文的经验证明,在缺乏成对数据和强归纳偏差的情况下,Transformer会收敛到非最优解。为了解决这个问题,本文引入了UNet结构Transformer(UNet Structured Transformer,UNest)—— 一种新的架构,它包含了结构归纳偏差,用于非配对的医学图像合成。
  本文利用SAM模型来精确地提取前景结构,并在主要解剖结构中实施结构注意。这会指导模型学习关键的解剖区域,从而在缺乏监督的非配对训练中改进结构合成。
  在两个公共数据集上进行评估,涵盖三种模态(MR、CT和PET),在六项医学图像合成任务中将最近的方法改进了19.30%。


1、引言

1.1、图像合成的意义

  医学影像具有多个模态,不同模态可提供互补的信息,但多次扫描可能是耗时、昂贵的,且有辐射暴露的风险,医学图像合成是一种新思路。(格局打开~

1.2、现有合成方法局限

  (1)大多数合成方法基于有监督的Pix2Pix方法,需要成对数据,不好获取;
  (2)CycleGAN是非配对图像转换的开创性工作;
  (3)以往的方法采用带有局部归纳偏置的卷积算子,指导模型提取局部特征。这限制了它们捕捉远程空间上下文的能力;

1.3、ViT方法的不足

  (1)ViT可建模全局依赖,在分割、超分任务上表现优异;然而,ViT模型在应用于未配对的医学图像合成时很困难;
  (2)由于没有归纳偏置,ViT的样本效率较低,在低数据条件下无法注意到鉴别特征;

(a)目前的ViT方法无法在鼻腔内合成复杂的解剖结构;
(b)Transformer方法倾向于关注不太相关的背景特征;
在这里插入图片描述

1.4、本文贡献

  (1)本文发现,加入结构引导偏差使Transformer能够专注于鉴别区域,从而增强了非配对图像合成中解剖结构的合成;
  (2)提出UNest框架,应用了双重注意策略:前景的结构注意和背景的局部注意;
  (3)对MR、CT和PET三种模态的六种图像转换任务进行评估,UNest显著提高了各种解剖结构的准确性;


2、方法

UNest整体框架图:
在这里插入图片描述

2.1、CycleGAN概述

  基于CycleGAN,UNest有两个生成器: G X Y {G_{XY}} GXY G Y X {G_{YX}} GYX,学习 X {X} X Y {Y} Y 两个域之间的前向和向后映射。

   G X Y {G_{XY}} GXY G Y X {G_{YX}} GYX 被训练来欺骗鉴别器 D Y {D_{Y}} DY D X {D_{X}} DX,训练损失为对抗损失:
在这里插入图片描述
  针对未配对的训练,CycleGAN施加了循环一致性损失:

在这里插入图片描述

整体上还是CycleGAN模式:

在这里插入图片描述

2.2、非配对图像合成中的Transformer模型分析

  常规的 self-attention 是在整个图中做的:
在这里插入图片描述
  本文考虑CNN的局部归纳偏差,从查询(Q) tokens 周围的 m × m {m×m} m×m 窗口中聚合 tokens:

在这里插入图片描述

ResViT和UNETR采用的全局注意使髋关节结构变形,而Swin UNETR采用的局部注意产生伪影:
在这里插入图片描述

2.3、UNet Structural Transformer

  与之前的全局注意或局部注意不同,本文的结构注意聚集在主要解剖结构中,在划分patch之后,采用轻量级分类器实现对patch的分类标注。
  怎么训练patch分类器呢,使用SAM提取原图的分割结果,取前景最大部分为mask,计算与真实标签的BCE损失,优化patch分类器:
在这里插入图片描述
  最终损失为三个损失的加权:
在这里插入图片描述

UNest由Structural Transformer(ST)块和一个具有跳跃连接的卷积解码器组成:
在这里插入图片描述

2.4、Structural Transformer模块细节

  为了在非配对训练下引导 Transformer,本文采用双重注意策略。对于前景,利用结构注意来学习解剖区域内的关系。对于背景,进行局部关注,实现前景和背景特征之间的有效信息交换。(具体实施还是后面看代码比较直观~

分别对前景 tokens 和背景 tokens 实施双重注意策略:
在这里插入图片描述


3、实验与结果

3.1、数据集与实施细节

  (1)MRXFDG数据集:MR-to-CT、MR-to-PET,37例,224×224;
  (2)AutoPET数据集:PET-to-CT,310例,256×256;
  (3)两数据集划分:8:1:1;
  (4)显卡: 2块 NVIDIA RTX 3090 GPUs ;
  (5)优化器:Adam;
  (6)epoch:100;
  (7)学习率:0.0001,在最后50个epoch线性衰减到0;

3.2、评价指标

  (1)平均绝对误差(MAE)
  (2)峰值信噪比(PSNR)
  (3)结构相似性(SSIM)
  (4)报告结果运行5次,与其他方法比较采用 t {t} t 检验,显著性差异 p < 0.05 {p<0.05} p0.05

3.3、与先进技术比较

  四个转换任务,三种网络类型(卷积类,Transformer类,混合类):

在这里插入图片描述

  可视化结果:在没有引导偏差的情况下,UNETR倾向于产生更模糊的细节,而Swin-UNETR则扭曲了大脑皮层下结构的细节;

在这里插入图片描述

  AutoPET数据集结果:

在这里插入图片描述

3.4、消融实验

  表2可以看出,双重注意和结构注意FG-S + BG-S在PET-CT上对UNETR和Swin UNETR的MAE分别提高了12.18%和10.98%。(百分数表示实在是妙啊~

整体注意关注较少相关的BG tokens,而结构注意则自适应地关注解剖特征:
在这里插入图片描述


  在图像合成领域diffusion盛行的时候,还有transformer的一席之地~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1875573.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

收银系统源码-千呼新零售【分销商城】

千呼新零售2.0系统是零售行业连锁店一体化收银系统,包括线下收银线上商城连锁店管理ERP管理商品管理供应商管理会员营销等功能为一体,线上线下数据全部打通。 适用于商超、便利店、水果、生鲜、母婴、服装、零食、百货、宠物等连锁店使用。 详细介绍请…

帮助某服务业公司制定发展战略与未来规划

在集团公司高速发展、业务范围不断扩大时,组织往往对公司未来的发展方向感到迷茫,不知道如何进行更好的规划,找到合适的发展战略,为企业提供更长远的发展空间,带来更多是利益。面对这个问题,华恒智信认为企…

【知识学习】Unity3D中Post Processing的概念及使用方法示例

Unity3D中的Post Processing(后处理)是一种在渲染管线的最后阶段对最终图像进行处理的技术。它允许开发者添加各种视觉效果,如模糊、颜色分级、镜头光晕等,以增强场景的视觉表现力。 Post Processing 的基本概念 Post Processin…

【递归、搜索与回溯】记忆化搜索

记忆化搜索 1.记忆化搜索2.不同路径3.最长递增子序列4. 猜数字大小 II5.矩阵中的最长递增路径 点赞👍👍收藏🌟🌟关注💖💖 你的支持是对我最大的鼓励,我们一起努力吧!😃😃…

eclipse基础工程配置( tomcat配置JRE环境)

文章目录 I eclipse1.1 工程配置1.2 编译工程1.3 添加 JRE for the project build pathII tomcat配置JRE环境2.1 Eclipse编辑tomcat运行环境(Mac版本)2.2 Eclipse编辑tomcat运行环境(windows版本)2.3 通过tomcat7W.exe配置运行环境(windows系统)I eclipse 1.1 工程配置 …

PPT中的文字跟随Excel动态变化,且保留文字格式

今天协助客户解决了一个有趣的问题,这里记录一下,以此共勉。 目录 1. 提出问题2. 此功能的应用场景3. 开始制作4. 注意事项5. 若遇到任何问题 1. 提出问题 PPT的图表是可以引用Excel的,那PPT的文本是否可以引用Excel实现动态更新呢&#xff…

Unidbg调用-补环境V3-Hook

结合IDA和unidbg,可以在so的执行过程进行Hook,这样可以让我们了解并分析具体的执行步骤。 应用场景:基于unidbg调试执行步骤 或 还原算法(以Hookzz为例)。 1.大姨妈 1.1 0x1DA0 public void hook1() {

精品UI知识付费系统源码网站EyouCMS模版源码

这是一款知识付费平台模板,后台可上传本地视频,批量上传视频连接, 视频后台可设计权限观看,免费试看时间时长,会员等级观看,付费观看等功能, 也带软件app权限下载,帮助知识教育和软件…

OpenHarmony开发实战:GPIO控制器接口

功能简介 GPIO(General-purpose input/output)即通用型输入输出。通常,GPIO控制器通过分组的方式管理所有GPIO管脚,每组GPIO有一个或多个寄存器与之关联,通过读写寄存器完成对GPIO管脚的操作。 GPIO接口定义了操作GP…

Java应用cpu过高如何分析

1. 查看进程cpu使用情况 top 2. 根据PID查看指定进程的各线程的cpu使用情况 top -H -p PID

Zookeeper节点ACL权限设置—digest模式

ACL全称为Access Control List(访问控制列表),用于控制资源的访问权限。ZooKeeper使用ACL来控制对其znode(ZooKeeper数据树的数据节点)的访问。 zk利用ACL策略控制节点的访问权限: CREATE c 可以创建子节点 DELETE …

2024年每个月有哪些数学建模和数学挖掘竞赛?

文章目录 2024年每个月有哪些竞赛?2024年32个数学建模和数据挖掘竞赛重磅来袭!!!2024年数学建模和数学挖掘竞赛时间目录汇总数学建模助手使用一月二月三月四月五月六月七月八月九月十月十一月十二月 2024年每个月有哪些竞赛&#…

甄选版“论软件系统架构评估”,软考高级论文,系统架构设计师论文

论文真题 对于软件系统,尤其是大规模的复杂软件系统来说,软件的系统架构对于确保最终系统的质量具有十分重要的意义,不恰当的系统架构将给项目开发带来高昂的代价和难以避免的灾难。对一个系统架构进行评估,是为了:分析现有架构存在的潜在风险,检验设计中提出的质量需求,…

大跨度气膜综合馆:未来建筑的新标杆—轻空间

在当今建筑技术迅速发展的时代,气膜结构作为一种新型的建筑形式,正在被广泛应用于各种场所。大跨度气膜综合馆,以其独特的设计理念和先进的技术手段,成为现代建筑中的一颗新星。这类建筑不仅具有经济性和实用性,还在环…

[图解]企业应用架构模式2024新译本讲解18-活动记录2

1 00:00:00,940 --> 00:00:04,890 接下来,就是要把这个列表输出到控制台 2 00:00:06,490 --> 00:00:12,280 这里面有3个 3 00:00:15,420 --> 00:00:17,480 Id有了,姓 4 00:00:18,600 --> 00:00:28,500 一个一个取,ID&#xff…

读AI新生:破解人机共存密码笔记15辅助博弈

1. 辅助博弈 1.1. assistance game 1.2. 逆强化学习如今已经是构建有效的人工智能系统的重要工具,但它做了一些简化的假设 1.2.1. 机器人一旦通过观察人类学会了奖励函数,它就会采用奖励函数,这样它就可以执行相同的任务 1.2.1.1. 解决这…

Firefox 编译指南2024 Windows10- 定制化您的Firefox(四)

1. 引言 定制化您的Firefox浏览器是一个充满乐趣且富有成就感的过程。在2024年,Mozilla进一步增强了Firefox的灵活性和可定制性,使得开发者和高级用户能够更深入地改造和优化浏览器以满足个人需求。从界面的微调到功能的增强,甚至是核心代码…

Elasticsearch初识与 index+mapping+document 基操

前言 在21年多少有使用过es 当时是在艺术赛道的一个教育公司,大概流程就是 将mysql中的各种课程数据通过logstash汇总到es 然后提供rest接口出去。由于在职时间较短(很不幸赶上了教育双减),所以对es的了解其实仅仅是些皮毛,当然elk在我的任职…

推荐一款免费的GIF编辑器——【ScreenToGif编辑器】

读者大大们好呀!!!☀️☀️☀️ 👀期待大大的关注哦❗️❗️❗️ 🚀欢迎收看我的主页文章➡️木道寻的主页 文章目录 🔥前言🚀素材准备🚀逐帧制作🚀保存图片⭐️⭐️⭐️总结 &#…

使用Jetpack Compose实现具有多选功能的图片网格

使用Jetpack Compose实现具有多选功能的图片网格 在现代应用中,多选功能是一项常见且重要的需求。例如,Google Photos允许用户轻松选择多个照片进行分享、添加到相册或删除。在本文中,我们将展示如何使用Jetpack Compose实现类似的多选行为,最终效果如下: 主要步骤 实现…