TarGAN:多模态医学图像转换GAN

news2024/11/17 15:52:35

TarGAN

    • 核心思想
      • 网络结构

 


核心思想

论文:https://arxiv.org/abs/2105.08993

代码:https://github.com/2165998/TarGAN

  1. 解决的问题:传统多模态医学图像转换通常,在生成高质量图像方面存在问题,特别是在关键目标区域或兴趣区域(ROI)如特定器官等。这些图像可能模糊、变形或包含不现实的纹理。

  2. TarGAN的特色

    • 无需配对数据的多模态图像转换学习:TarGAN 能够学习多模态医学图像的转换,而不依赖于成对的数据,毕竟获取成对的多模态医学图像(如CT和MRI图像)成本高且困难
    • 借助目标区域标签提高目标区域生成质量:TarGAN 通过特定的目标区域标签,来增强图像中关键部位的生成质量,同时保持整体图像质量。

这是通过将全局和局部映射整合到,一个跨损失(crossing loss)中实现的。

  1. 创新点
    • 双层次映射学习:TarGAN 的生成器同时学习两种映射 —— 整体图像转换映射、目标区域转换映射。
    • 交叉损失:这两种映射通过交叉损失相互关联,以优化目标区域的转换效果。

关键方法 - 跨损失(Crossing Loss):这是一个新颖的概念,它允许模型在转换整个图像时同时专注于目标区域。

这样做可以显著提高目标区域的图像质量,而不会牺牲整体图像的质量。

网络结构

双输入-输出流的生成器,结合多种损失函数

  • 双输入-输出流:允许同时处理整体图像和目标区域的转换。
  • 使用循环一致性损失(cycle-consistency loss)、形状一致性损失(shape-consistency loss)和跨损失(crossing loss)来优化生成的图像质量,优化生成图像的质量。

对应上图:

  1. 生成器结构(图a):生成器G的结构,它包括两个编码器(Encoder_s, Encoder_t)和两个解码器(Decoder_x, Decoder_r),以及一个共享模块(Shared Block)。

    生成器接收源模态图像xs和对应的目标区域图像rs,这两个输入通过深度级联(Depth-wise concatenation)与目标模态标签t结合。

    共享块使得生成器能够在转换整体图像的同时也专注于目标区域。

  2. TarGAN框架(图b):这部分展示了整个 TarGAN 框架,包括四个主要模块:生成器G,形状控制器S,以及两个判别器 Dx 和 Dr。

    生成器 G 负责将源图像 xs 和目标区域图像 rs 转换为目标模态图像 xt 和 rt。

    形状控制器 S 生成一个二进制掩码以表示合成图像的前景区域。

    判别器 Dx 和 Dr 分别判断整个图像和目标区域图像是否真实,以及它们来自哪种模态。

整个框架使用多种损失函数来训练和优化:

  • 对抗损失( L a d v − x 和 L a d v − r L_{adv-x} 和 L_{adv-r} LadvxLadvr
  • 形状一致性损失( L s h a p e − x 和 L s h a p e − r L_{shape-x} 和 L_{shape-r} LshapexLshaper
  • 重建损失( L r e c − x 和 L r e c − r L_{rec-x} 和 L_{rec-r} LrecxLrecr
  • 模态分类损失(实际图像的 L c l s − x r 和 L c l s − r r L_{cls-x}^{r} 和 L_{cls-r}^{r} LclsxrLclsrr,合成图像的 L c l s − x f 和 L c l s − r f L_{cls-x}^{f} 和 L_{cls-r}^{f} LclsxfLclsrf
  • 交叉损失( L c r o s s L_{cross} Lcross

这些损失函数共同工作,帮助模型在转换图像时保持目标区域的特征,同时也保证整体图像的质量。

每一行代表一种模态到其他模态的转换:

  • 第一行显示的是CT 到 T1w和T2w的转换
  • 第二行显示的是T1w 到 T2w和CT的转换

StarGAN 和 CSGAN 、ReMIC 方法在某些转换中引入了额外的纹理(红框标记)和结构变形(蓝框标记)。

StarGAN:

  • 不适用于CT到T1w的图像转换,因为它在MRI到CT转换中产生许多伪影。
  • 原因 - StarGAN在处理不同模态间的复杂转换时存在局限性。

CSGAN:

  • 在目标区域有时会添加多余的纹理,但保留目标形状。
  • 原因 - CSGAN在保留形状的同时,可能会在纹理细节上过度处理。

ReMIC:

  • 能够生成相对真实的合成图像,但在大多数情况下会改变目标区域的结构。
  • 原因 - ReMIC在追求图像真实性时,可能会牺牲目标区域的结构完整性。

TarGAN:

  • 生成高视觉质量的翻译结果,并妥善保留目标结构。其提出的交叉损失有助于联合学习目标区域和整个图像的映射,从而提高目标区域的质量。

  • 原因 - TarGAN通过交叉损失在不同模态之间学习,同时专注于改善目标区域,从而在综合性能上优于其他方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1410950.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

nginx安装ssl模块http_ssl_module

查看nginx安装的模块 /usr/local/nginx/sbin/nginx -V若出现“–with-http_ssl_module”说明已经安装过,否则继续执行下列步骤 进入nginx源文件目录 cd /usr/local/nginx/nginx-1.20.2重新编译nginx ./configure --with-http_ssl_module如果组件linux缺少&…

利用Burp Suite观察https通联

对使用 HTTPS 协议的应用程序进行测试时,常使用 bp 观察流量,为能成功建立HTTPS联接,在将bp设置居代理的同时,还必须导入bp伪证书,这样才能修改请求和响应,加密和解密流量,成功模拟浏览的各种动…

Web3创业:去中心化初创公司的崛起

随着Web3时代的到来,去中心化技术的崛起不仅令人瞩目,也为创业者带来了前所未有的机遇。在这个新的时代,一批去中心化初创公司正崭露头角,重新定义着商业和创新的边界。本文将深入探讨Web3创业的趋势,以及去中心化初创…

Your lDE is missing natures to properly support your projects

错误提示 Your lDE is missing natures to properly support your projects. Some extensions on the Eclipse Marketplace can be installed to support those natures.解决方案 打开项目文件,找到.project 文件,用编辑器打开 找到 把下图效果图中相关…

自然语言处理-文本标注

文本标注 现在让我们考虑词元级任务,比如文本标注(text tagging),其中每个词元都被分配了一个标签。在文本标注任务中,词性标注为每个单词分配词性标记(例如,形容词和限定词)。 根据…

【iOS ARKit】人脸追踪之挂载虚拟元素

人脸跟踪(Face Tracking)是指将人脸检测扩展到视频序列,跟踪同一张人脸在视频序列中的位置。是论上讲,任何出现在视频中的人险都可以被跟踪,也即是说,在连续视频帧中检测到的人脸可以被识别为同一个人。人脸…

单片机面向对象思维的架构:时间轮片法

今天分享一篇单片机程序框架的文章。 程序架构重要性 很多人尤其是初学者在写代码的时候往往都是想一点写一点,最开始没有一个整体的规划,导致后面代码越写越乱,bug不断。 最终代码跑起来看似没有问题(有可能也真的没有问题),但…

vue3创建多种遥感底图的网页教程

创建一个能调用多种遥感底图的网页教程 简介 大家好,我是锐多宝。 最近我正在使用vue3,这里记录一下我是如何使用vue3调用多种遥感底图。当然,如果你觉得安装vue麻烦,也可以直接使用原生的JavaScript,方法大同小异。…

机器学习:多元线性回归闭式解(Python)

import numpy as np import matplotlib.pyplot as pltclass LRClosedFormSol:def __init__(self, fit_interceptTrue, normalizeTrue):""":param fit_intercept: 是否训练bias:param normalize: 是否标准化数据"""self.theta None # 训练权重系…

【Chrome】浏览器怎么清除缓存并强制刷新

文章目录 1、正常刷新:正常刷新网页,网页有缓存则采用缓存。 F5 或 刷新键2、强制刷新:忽略缓存刷新,重新下载资源不用缓存。 CtrlF5 或 ShiftF5 或 CtrlShiftR3、在浏览器的设置里面清除所有数据

哪些 3D 建模软件值得推荐?

云端地球是一款免费的在线实景三维建模软件,不需要复杂的技巧,只要需要手机,多拍几张照片,就可以得到完整的三维模型! 无论是大场景倾斜摄影测量还是小场景、小物体建模,都可以通过云端地球将二维数据向三…

MTP与管理壳(AAS)有异曲同工之妙

在过去的几年中,流程工业中的不同部门(例如制药、精细化学品以及食品和饮料部门)遇到了一系列共同且可比较的新兴挑战。这些挑战包括: 新产品的需求迅速接连不断,更快交货和更低价格的压力,更多定制产品&a…

【wvp】关于码率等的相关流程设计

目录 流程设计 前端UI大致设计 终端上的相关修改界面参考 流程设计 前端UI大致设计 终端上的相关修改界面参考

【WPF.NET开发】WPF中的双向功能

本文内容 FlowDirectionFlowDocumentSpan 元素非文本元素的 FlowDirection数字替换 与其他任何开发平台不同,WPF 具有许多支持双向内容快速开发的功能,例如,同一文档中混合了从左到右和从右到左的数据。 同时,WPF 也为需要双向功…

文件IO讲解

💕"跑起来就有意义"💕 作者:Mylvzi 文章主要内容:文件IO讲解 一.与文件相关的基本概念 1.什么是文件 文件从广义上来说就是操作系统对其所持有的硬件设备和软件资源的抽象化表示,但是在日常生活中我们所提到的文件就…

《Visual Tree Convolutional Neural Network in Image Classification》阅读笔记

论文标题 《Visual Tree Convolutional Neural Network in Image Classification》 图像分类中的视觉树卷积神经网络 作者 Yuntao Liu、Yong Dou、Ruochun Jin 和 Peng Qiao 来自国防科技大学并行和分布式处理国家实验室 初读 摘要 问题: 在图像分类领域&…

1.25号c++

1.引用 引用就是给变量起别名 格式: 数据类型 &引用名 同类型的变量名 (& 引用符号) eg: int a 10; int &b a; //b引用a,或者给a变量取个别名叫b int *p; //指针可以先定义 后指向 p &a; //int &a…

谷歌推出 AutoRT 机器人代理大规模编排的具体基础模型,远程操作和收集 77,000 个机器人事件

演示 AutoRT 向多个建筑物中的20多个机器人提出指令,并通过远程操作和自主机器人策略收集77,000个真实的机器人事件。实验表明,AutoRT 收集的此类“野外”数据明显更加多样化,并且 AutoRT 使用 LLMs 允许遵循能够符合人类偏好的数据收集机器人…

Jenkins全局工具配置

目录 Jenkins全局工具全局工具配置Settings 文件配置Maven配置JDK配置Git配置 Jenkins全局工具 我们在安装了Jenkins之后,就可以开始使用Jenkins来进行一些自动化构建发布工作,但是开始之前我们还需要进行全局工具的配置,Jenkins全局工具配置…

QT入门篇---无门槛学习

1.1 什么是 Qt Qt 是⼀个 跨平台的 C 图形⽤⼾界⾯应⽤程序框架 。它为应⽤程序开发者提供了建⽴艺术级图形界⾯所需的所有功能。它是完全⾯向对象的,很容易扩展。Qt 为开发者提供了⼀种基于组件的开发模式,开发者可以通过简单的拖拽和组合来实现复杂的…