文献速递:生成对抗网络医学影像中的应用——基于生成对抗网络的医学图像处理:系统综述

news2024/12/25 14:40:15

本周给大家分享文献的主题是生成对抗网络(Generative adversarial networks, GANs)在医学影像中的应用。文献的研究内容包括同模态影像生成、跨模态影像生成、GAN在分类和分割方面的应用等。生成对抗网络与其他方法相比展示出了优越的数据生成能力,使它们在医学图像应用中广受欢迎。这些特性引起了医学成像领域研究人员的浓厚兴趣,导致这些技术在各种传统和新颖应用中迅速实施,如图像重建、分割、检测、分类和跨模态合成。

01

文献速递介绍

在过去几年中,医学图像领域专注于监督学习决策边界,而生成任务在很大程度上被忽视了。自人工智能时代开始以来,这种情况似乎随着深度学习方法的提出和崛起发生了戏剧性变化,引发了一波分布式学习和生成模型的浪潮。深度学习技术最近作为医学图像分析的工具获得了广泛的接受。然而,训练数据的稀缺性和可用性仍然是主要障碍,尤其是在医学领域的特殊情况下,医学图像数据获取成本高昂且受隐私法规的约束。针对这一棘手问题,数据增强方法可以提供解决方案,通过显著增加用于训练的数据量和多样性。数据增强方法包括简单但出乎意料的高效操作,如裁剪、填充和翻转,以及复杂的深度生成模型。然而,由于其在模拟数据分布方面的卓越能力,生成对抗网络(GANs)从各种生成模型中脱颖而出,缩小了监督学习和图像生成之间的差距,以生成高度逼真的医学图像。这些模型在许多图像生成任务中取得了最先进的性能,包括文本到图像的合成、超分辨率和图像到图像的转换。此外,由于它们在捕捉空间复杂、非线性以及可能微妙的疾病效应方面的卓越能力,GANs及其变体在医学成像中受到广泛关注,例如在数字病理学、组织病理学、神经成像、放射学和临床神经科学中。

GAN(生成对抗网络)是由Goodfellow等人在2014年提出的。判别器和生成器是GAN的两个主要组成部分。生成器的目标是产生足以欺骗判别器的真实样本,而判别器则应能够区分真实样本和生成样本。为了不断提高它们的技能,并最终达到纳什均衡状态,这一过程通过对抗性训练来实现。GAN的优化是一个“最小最大博弈”问题,它通过使生成器产生的数据分布尽可能接近真实数据分布来“迷惑”判别器。

之前对GANs的许多综述主要关注于特定任务在医学图像处理领域的技术细节,或将GANs作为深度生成模型的一个分支与其他方法一起回顾。然而,对于解决众所周知且具有挑战性的医学图像分析任务,包括医学图像重建、图像分辨率增强、分割、病变检测、数据模拟和分类,GANs及其扩展已经开辟了许多有趣的路径。有了这些生成模型,由于它们产生逼真图像的能力,可能解决医学领域持续的标注数据匮乏问题。虽然其他作品中已经展示了GAN在医学图像处理中的各种应用,但本文通过提出新的GAN变体,扩展了这些应用,从而确保了这些方法的有效性。

每个月都有许多使用GANs及其扩展的出版物用于各种医学任务。这激发了我们对GANs及其在医学图像处理中的使用和功能进行简洁说明和高层次概述的愿望。在这项评估中,我们覆盖了各种数据集类型和更广泛的下游应用。我们还更详细地讨论了各种改进技术的优势。我们希望这项研究能成为受医学图像数据不足限制的研究人员和从事医学图像改进方法的人员的有用资源,特别是对于该领域的新手,通过提供必要的知识和指导。

为此,搜索论文的来源包括PubMed和谷歌学术。近年来出版的医学图像处理论文可以分为以下几个领域:合成、分割、检测、去噪、转换、重建和分类,如图(1)所示。这些基于GAN的方法应用于各种医学成像模式,如磁共振成像(MRI)、计算机断层扫描(CT)、光学相干断层扫描(OCT)、X射线、皮肤镜、超声、正电子发射计算机断层扫描(PET)和显微成像。本综述总结了过去六年(2017-2022)基于GAN的医学图像处理应用出版的95篇论文。它们的分类如图(2)所示。本文的其余部分结构如下:第2节描述了我们文献综述的策略和识别及分类发表文章的标准。第3节介绍了GANs的基本原理和局限性,第4节总结了特别用于医学图像处理问题的GAN模型结构。第5节讨论了GAN模型在图像处理中的应用。

Title

题目

Medical Image Processing based on Generative Adversarial Networks: ASystematic Review

基于生成对抗网络的医学图像处理:系统综述

Abstract-Background

摘要-背景

Generative adversarial networks (GANs) have demonstrated superior data generation capabilities compared to other methods, making them popular for use in medical image applications. These features have intrigued researchers in the medical imaging field, resulting in a swift implementation of these techniques in various conventional and novel applications such as image reconstruction, segmentation, detection, classification, and cross-modality synthesis. A comprehensive review of recent medical imaging breakthroughs will benefit researchers interested in this field. In this review, we aimed to introduce the origin, principle, and extended forms of GANs and summarize the state-of-the-art progress of GAN-based medical image processing methods.

生成对抗网络(GANs)相较于其他方法展示出了卓越的数据生成能力,使其在医学图像应用中变得流行。这些特点吸引了医学成像领域的研究人员,导致这些技术在各种传统和新兴应用中迅速实施,如图像重建、分割、检测、分类和跨模态合成。对近期医学成像突破的全面回顾将有利于对这一领域感兴趣的研究人员。在这篇综述中,我们旨在介绍GANs的起源、原理及其扩展形式,并总结基于GAN的医学图像处理方法的最新进展。

Methods

方法

We searched the literature for studies on Google Scholar and PubMed using the keywords “Segmentation,” “Classification,” “medical image,” and“generative adversarial network.” Specifically, the initial search revealed 5423 publications after the removal of duplicated and non-accessible fulltext publications. Then, after the title and abstract screening, 680 underwent full-text screening. Finally, 121 studies were included in our finalanalysis after full-text screening.

我们在谷歌学术和PubMed上搜索了关键词“分割”、“分类”、“医学图像”和“生成对抗网络”的研究文献。具体来说,初步搜索在去除重复和无法访问的全文出版物后,共发现了5423篇出版物。然后,在标题和摘要筛选后,有680篇进行了全文筛选。最终,经过全文筛选,共有121项研究被纳入我们的最终分析。

Results

结果

The date range of the studies covered in this review is from January 1, 2017, to the present. After a thorough screening and qualification

*assessment, 121 studies involving GAN-based applications in seven areas of medical images were included in the final methodological review.*These areas included synthesis, classification, segmentation, conversion, reconstruction, denoising, and lesion detection. We further classified and summarized these papers into clinical applications, classification methods, and imaging modalities.

本综述所涵盖的研究日期范围从2017年1月1日至今。经过彻底筛选和资格评估后,共有121项研究涉及基于GAN在七个医学图像领域的应用,被纳入最终的方法论综述。这些领域包括合成、分类、分割、转换、重建、去噪以及病变检测。我们进一步将这些论文分类并总结为临床应用、分类方法和成像模式。

Conclusions
结论

We thoroughly examined the latest research progress of GAN-based medical image augmentation. These techniques effectively alleviate the challenge of limited training samples for medical image diagnosis and treatment models. Furthermore, several critical issues associated with GANs, such as pattern collapse, instability, and lack of interpretability, require attention in future research.

我们全面审查了基于GAN的医学图像增强的最新研究进展。这些技术有效地缓解了医学图像诊断和治疗模型训练样本有限的挑战。此外,与GANs相关的几个关键问题,如模式崩溃、不稳定性和缺乏可解释性,在未来的研究中需要引起注意。

Figure

图片

Fig. (1). Application of GANs in the field of medical images.

图(1)。GAN在医学图像领域的应用

图片

Fig. (2). (a, b) Classification of imaging modalities and clinical areas.

图(2)。(a, b) 成像模式和临床领域的分类

图片

Fig. (3). PRISMA flow diagram for literature review and article selection.

图(3)。PRISMA流程图,用于文献综述和文章选择。

图片

Fig. (4). The basic model of GAN, consisting of two main parts: generator G and discriminator D. G maps the noise vector to fit the real data

图(4)。GAN的基本模型,由两个主要部分组成:生成器G和判别器D。G将噪声向量映射以适应真实数据

图片

Fig. (5). Main variants of GAN for medical image processing.

图(5)。用于医学图像处理的GAN的主要变体。

图片

Fig. (6).A schematic view of various GANs frameworks. In cGAN and AC-GAN, a discrete categorical code that encodes a class label is denoted by the conditional vector C. It may also be a continuous code that encodes attributes in InfoGAN. Pix2pix requires aligned training data. Although this constraint is not required in CycleGAN, it commonly suffers from performance loss. The activation function in D is from the original paper.

图(6)各种GAN框架的示意图。在cGAN和AC-GAN中,编码类标签的离散分类代码由条件向量C表示。它也可能是在InfoGAN中编码属性的连续代码。Pix2pix需要对齐的训练数据。尽管CycleGAN不需要这个约束,但它通常会遭受性能损失。D中的激活函数来自原始论文。

图片

Fig. (7). Network structure of generator and discriminator in DCGAN.

图(7)。DCGAN中生成器和判别器的网络结构。

Table

图片图片

Table 1. A summary of the main characteristics and highlights of GAN and its variants.

表 1. GAN及其变体的主要特征和亮点摘要。

图片

图片

图片

图片

Table 2. Summary of cross-modality synthesis in medical image applications for both inter- and intra-modality.

表 2. 医学图像应用中跨模态合成的总结,包括模态间和模态内。

图片

图片

图片

Table 3. Sum**mary of classification in medical image applications.

表 3. 医学图像应用中分类的总结

图片

图片

Table 4. Summary of brain segmentation in medical image applications

表4. 医学图像应用中脑部分割的总结

图片

Table 5. Summary of ocular segmentation in medical image applications.

表 5. 医学图像应用中眼科分割的总结。

图片

图片

Table 6. Summary of cardiac segmentation in medical image applications.

表6. 医学图像应用中心脏分割的总结。

图片

Table 7. Summary of chest and abdomen segmentation in medical image applications.

表7. 医学图像应用中胸部和腹部分割的总结。

图片

Table 8. Summary of spine and pelvis segmentation in medical image applications.

表8. 医学图像应用中脊柱和骨盆分割的总结。

图片

图片

Table 9. Summary of translation in medical image applications.

表9. 医学图像应用中翻译的总结。

图片

图片

Table 10. Summary of reconstruction in medical image applications.

表10. 医学图像应用中重建的总结。

图片

图片

Table 11. Summary of denoising in medical image applications.

表11. 医学图像应用中去噪的总结

图片

Table 12. Summary of detection in medical image applications.

表12. 医学图像应用中检测的总结。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1322313.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

你是无醇葡萄酒的爱好者吗?

不含酒精的蒸馏酒和起泡酒正在流行,尽管它们是葡萄酒市场中最小的细分市场之一,但需求和供应都在稳步增长。这是因为,和啤酒一样,消费者越来越多地询问无醇葡萄酒。 来自云仓酒庄品牌雷盛红酒分享不含酒精的酒好喝吗?尼…

Flink实时电商数仓(二)

GitLab的用户创建和推送 在root用户-密码界面重新设置密码添加Leader用户和自己使用的用户使用root用户创建相应的群组使用Leader用户创建对应的项目设置分支配置为“初始推送后完全保护”设置.gitignore文件,项目配置文件等其他非通用代码无需提交安装gitlab proj…

【python VS vba】(9) 在python使用matplotlib库来画多个图形,子图,以及图中图

2 用matplotlib 画多个函数图形 2.1 在一个画布里画多个图形 (1张画布,1个坐标轴系,多个图形叠在一起) import numpy as np import matplotlib.pyplot as pltfig1plt.figure(num1)xnp.linspace(-5,5, 10) yx*21 y2x**2# 绘图 p…

人工智能在约会APP开发中的作用

约会APP已成为当今技术世界中结识人们的流行方式。这意味着您不必要求您的朋友去见某人约会。简而言之,技术改善了约会过程,而人工智能在约会APP开发中的兴起极大地影响了人们今天的约会方式。 在约会APP中使用人工智能技术可以改善个人寻找完美匹配对象…

基于hfl/rbt3模型的情感分析学习研究——文本挖掘

参考书籍《HuggingFace自然语言处理详解 》 什么是文本挖掘 文本挖掘(Text mining)有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生&…

基于Java SSM框架实现宠物医院信息管理系统项目【项目源码】

基于java的SSM框架实现宠物医院信息管理系统演示 java简介 Java语言是在二十世纪末由Sun公司发布的,而且公开源代码,这一优点吸引了许多世界各地优秀的编程爱好者,也使得他们开发出当时一款又一款经典好玩的小游戏。Java语言是纯面向对象语言…

一键修复找不到msvcp140.dll无法继续执行代码的办法,有效修复

电脑出现“找不到msvcp140.dll无法继续执行代码”是什么情况?如果系统中没有这个文件或文件发生损坏,那么在启动某些应用程序或游戏时,可能会遇到错误消息,如“程序无法启动因为msvcp140.dll丢失在您的计算机上”或“找不到msvcp1…

CPU缓存一致性问题

什么是可见性问题? Further Reading :什么是可见性问题? 缓存一致性 内存一致性 内存可见性 顺序一致性区别 CPU缓存一致性问题 由于CPU缓存的出现,很好地解决了处理器与内存速度之间的矛盾,极大地提高了CPU的吞吐能…

luttuce(RedisTempate)实现hash(动态数据) expire lua脚本

话不多说先放脚本: local argv ARGV local length #argv if length > 0 then local unpackArgs {} for i 1, length - 1 dotable.insert(unpackArgs, argv[i]) end if redis.call(exists, KEYS[1]) 1 thenredis.call(del, KEYS[1])redis.call(hset, KEYS[…

【ONE·English || 翻译作业 Development: Mendel‘s Legacy to Genetics】

总言 作业:没有严格按照语句结构进行翻译,有不规范之处。下述目录中每一小节是按照原文段落划分。   相关链接:pubmed中查阅的链接,提供了两处文章平台。 文章目录 总言part11.11.21.3 part2:Entwicklung and develo…

Linear Regression多重共线性

目录 介绍: 一、 corr ​二、pairplot 三、VIF 3.1自带vif 3.2自定义函数vif 四、heatmp(直观感受) 介绍: 多重共线性是指在线性回归模型中,自变量之间存在强相关性或线性关系,从而导致模型的稳定性…

使用相关序列方法做相位校准(附仿真代码)

TI对天线幅相校准提出了标准的方法和流程,可参考这篇文档使用级联毫米波传感器的成像雷达参考设计1(TI文档)-CSDN博客的3.3节。这里使用自相关序列的方法来对相位做校准。 自相关(Autocorrelation),也叫序列…

Hypervisor Display架构

Hypervisor Display架构部分 1,所有LA侧的APP与显示相关的调用最终都会交由SurfaceFlinger处理 2,SurfaceFlinger会最终调用android.hardware.graphics.composer2.4-service服务 3,android.hardware.graphics.composer2.4-service服务会调用G…

http代理的静态ip如何实现YouTube运营?有何优势?

一、静态ip是什么?静态住宅ip有什么优势? 静态ip是指网络中某个设备(如计算机、路由器)拥有的永久不变的ip地址,它的ip地址在设备与网络连接后,由网络管理员手动配置或预留,并且不会轻易更改。…

紫光FPGA学习之常见报错

紫光pango design suite报错: 一、4005: [D:/**/rtl/burstORsingle.v(line number: 47)] Logic for ddr_head_addr_rr does not match a standard flip-flop. 看来看去都没有发现这个定义没有问题呀,检查发现: 原来代码: always…

2023本四前端社招面经

美团 全程问项目,根据项目提问,SEO优化方案,还出了一道动态规划的题 SEO优化方案 一、内部优化 META 标签优化:例如:TITLE,KEYWORDS,DESCRIPTION (TDK)等的优化 内部链接…

轻量封装WebGPU渲染系统示例<53>- 多盏灯灯光照在地面的效果

WebGPU实时渲染实现模拟多盏灯的灯光照在地面的效果灯光效果 。 当前示例源码github地址: https://github.com/vilyLei/voxwebgpu/blob/feature/material/src/voxgpu/sample/MultiLightsTest.ts 当前示例运行效果: 此示例基于此渲染系统实现,当前示例TypeScript源…

Java版直播商城规划:电商源码、小程序、三级分销与免 费搭建全攻略

【saas云平台】打造全行业全渠道全场景的saas产品,为经营场景提供一体化解决方案;门店经营区域化、网店经营一体化,本地化、全方位、一站式服务,为多门店提供统一运营解决方案;提供丰富多样的营销玩法覆盖所有经营场景…

git命令查看提交代码行数和次数

右键点击Git Bash Here 查看代码提交次数 git log --since2022-7-1 --before2022-8-1 --author"XXXX" --pretty%aN |sort |uniq -c | sort -k1 -n -r查看代码提交行数 git log --since2022-8-1 --before2022-9-1 --authorXXXX --prettytformat: --numstat |awk {add…