U-Net及其变体在医学图像分割中的应用研究综述

news2024/11/17 7:40:50

U-Net及其变体在医学图像分割中的应用研究综述

论文来自:中国生物医学工程学报 2022

摘 要: 医学图像分割可以为临床诊疗和病理学研究提供可靠的依据,并能辅助医生对病人的病情做出准确的判断。 基于深度学习的分割网络的出现解决了传统自动分割方法鲁棒性不强、准确率低等问题。 U-Net凭借其出色的性能在众多的分割网络中脱颖而出,研究者以U-Net为基础相继提出了多种改进变体。 以U-Net网络及其变体为主线,首先详细介绍U-Net的网络结构及常用改进方法;然后根据分割对象的不同,将U-Net变体网络进一步划分为泛用型分割网络及特定型分割网络,并就其在医学图像分割中的研究进展进行论述;最后,分析了目前研究中工作尚存在的难点与问题,并对今后的发展方向进行展望。

主要是基于Unet的变体研究

基本介绍UNet模型

在这里插入图片描述
2015年提出的UNet模型是我们学习语义分割必学的一个优秀模型,它兼具轻量化与高性能,因此通常作为语义分割任务的基线测试模型,至今仍是如此,其优秀程度可见一斑。UNet从本质上来说也属于一种全卷积神经网络模型,它的取名来源于其架构形状:模型整体呈现"U"形。它的出生是为了解决医疗影像语义分割问题的,但之后几年的发展,也证实了它是语义分割任务中的全能选手,或许这就是优秀网络架构的优异之处。
或许可以从以下三点解释为什么UNet在医疗影像上表现突出:

1.UNet的U形网络结构密集融合了浅层特征与深层特征
2. 医疗影像数据量与UNet模型体量上相匹配,有效避免了过拟合
3. 医疗影像结构简单且固定,具有较低语义信息

U-Net网络改进
虽然 U-Net 在医学图像分割方面取得了重大突破,但还是存在着网络可延展性不理想训练小数据集时容易过拟合等方面的不足。 根据目标对象的特性、图像模态和应用场景等因素的不同,研究人员通常在原网络的基础上有针对性地选择合适的改进方法来提高网络分割的性能。

改进方向

1. 修改跳跃连接
跳跃连接不仅能融合高低层级特征,并且有助于加快网络收敛,不同形式跳跃连接的组合能让网络不需要额外的后端处理也能取得理想的分割效果。

2. 引入新技术
提出新的注意力模块、融合模块等
在这里插入图片描述

3. 融合其他网络
将resNet 与U-Net结合等融合网络。

4. 网络级联
在这里插入图片描述

基于U-Net及其改进变体的医学图像分割

在这里插入图片描述

总结与展望

文中回顾了U-Net及以U-Net为基础的改进型网络在医学图像分割中的应用。 研究进展表明U-Net及其变体网络在医学图像分割中有着广阔的应用前景,分割结果优于传统方法,然而也要看到所存在的问题

1) 医学图像数据集的规模相较于其他语义分割的数据集来说,因涉及病人隐私,采样较为困难,因而规模较小。 而 U-Net网络参数量大,在数据集规模较小时容易产生过拟合,因此需要选择合适的改进方式对网络结构进行调整。

2)== 医学图像成像和一般图像相比更为复杂,可能会存在伪影==,从而影响分割效果,需要选择恰当的预处理算法以减少伪影对分割的影响。

3) 医学图像中不乏血管、细胞等需要精细化分割的目标,可以使用密集连接、注意力机制等优化方法,从而突出对有利于分割任务的特征

4) 上述的分割模型虽已在准确率、Iou 和 DSC等指标上均达到了较高的水平,但这毕竟是基于实验室的数据,U-Net等深度学习模型要走到实际诊疗环境中还面临着许多困难。 如训练测试所使用的数据都是经过精心挑选的,这些图像数据过于“干净”;深度学习模型对图像注解的依赖性极强,但即便是经验丰富的注解师也会在标注过程中出现主观误差。 这些问题都会对学习模型的准确率产生潜在的影响。

5) 许多网络模型结构复杂、参数量巨大,在实际的应用环境中可能难以复现。 因此,今后的工作方向应该是在保证实验室高准确率的条件下对模型做适当调整,让深度学习从理论走向临床应用之中。未来U-Net的发展会在保持编码-译码结构和
跳跃连接的基础上
,与其他神经网络相结合以进一步提高医学图像分割的准确率,如:
1)图神经网络(GNN)在处理 3D数据时有着天然的优势,已有实验使用门控图神经网络实现了交互式的 3D医学图像分割,因此 U-Net可结合 GNN来更好地提取 3D特征;
2) 生成对抗网络 (GAN)能生成质量较高的图像,已有实验证明,使用GAN生成额外的训练图像对网络进行训练能在一定程度上提高分割性能。 因此,在使用 U-Net 或其变体网络分割前,使用GAN生成相应的医学图像对训练集进行扩充,可以在一定程度上解决数据集规模较小的问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1262052.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每日一练2023.11.28———【PTA】

题目链接: L1-009 N个数求和 题目要求: 本题的要求很简单,就是求N个数字的和。麻烦的是,这些数字是以有理数分子/分母的形式给出的,你输出的和也必须是有理数的形式。 输入格式: 输入第一行给出一个正整…

SpringBoot+Redis编写一个抢红包雨的案例。附源码。

案例演示 SpringBootRedis编写一个抢红包雨的案例。附源码 1、案例分析,整体方案介绍 预备上线一个红包雨活动。这个红包雨的思路是活动开始前25分钟,在后台创建活动。然后前端用户进入,到点后将设置的金额拆分成多个小红包,开启倒…

C++之STL库:string类(用法列举和总结)

前言 大家在学习STL库的时候一定要学会看英文文档&#xff0c;俗话说熟能生巧&#xff0c;所以还得多练&#xff01; 在使用string类之前&#xff0c;要包含头文件#include <string>和using namespace std; 文档链接&#xff1a;string - C Reference 一、string——构造…

【API 自动化测试】Eolink Apikit 图形用例详解

Eolink Apikit 的图形用例是指通过图形化的方式去表现 API 流程测试。它包括了条件选择器、单个 API 步骤和操作集等组件。 相较于前面推荐的表格化的通用用例&#xff0c;图形用例可以让测试人员更方便地设计和管理 API 流程测试&#xff0c;同时也更加的灵活。 添加图形用例…

第29期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区&#xff0c;集成了生成预训练Transformer&#xff08;GPT&#xff09;、人工智能生成内容&#xff08;AIGC&#xff09;以及大型语言模型&#xff08;LLM&#xff09;等安全领域应用的知识。在这里&#xff0c;您可以…

【密码学引论】序列密码

第五章 序列密码 1、序列密码 定义&#xff1a; 加密过程&#xff1a;把明文与密钥序列进行异或运算得到密文解密过程&#xff1a;把密文与密钥序列进行异或运算得到明文以字/字节为单位加解密密钥&#xff1a;采用一个比特流发生器随机产生二进制比特流 2、序列密码和分组密…

前馈式神经网络与反馈式神经网络的区别,联系,各自的应用范围和场景!!!

文章目录 前言一、前馈式神经网络是什么&#xff1f;二、前馈式神经网络包括&#xff1a;三、反馈式神经网络是什么&#xff1f;四、反馈式神经网络包括&#xff1a;总结 前言 前馈式神经网络和反馈式神经网络是两种主要的神经网络架构&#xff0c;它们在网络结构和应用场景上…

OpenCV快速入门【完结】:总目录——初窥计算机视觉

文章目录 前言目录1. OpenCV快速入门&#xff1a;初探2. OpenCV快速入门&#xff1a;像素操作和图像变换3. OpenCV快速入门&#xff1a;绘制图形、图像金字塔和感兴趣区域4. OpenCV快速入门&#xff1a;图像滤波与边缘检测5. OpenCV快速入门&#xff1a;图像形态学操作6. OpenC…

深度学习18

卷积层 查看每个数据 使用tensorboard查看 池化层 使用数据集进行训练 创建实例&#xff0c;使用tensorboard进行显示 最大池化保留了图片信息&#xff0c;神经网络训练的数据量大大减小&#xff0c;可以加快训练 非线性激活 非线性激活为神经网络加入了一些非线性的特质…

ChinaSoft 展商风采 | 蚂蚁集团:CodeFuse-Query代码大数据分析平台

2023年CCF中国软件大会&#xff08;CCF ChinaSoft 2023&#xff09;由CCF主办&#xff0c;CCF系统软件专委会、形式化方法专委会、软件工程专委会以及复旦大学联合承办&#xff0c;将于2023年12月1-3日在上海国际会议中心举行。 本次大会主题是“智能化软件创新推动数字经济与社…

Java---类的继承

文章目录 1. 理解继承2. 继承概述3. 代码块理解4. 继承的好处与弊端5. 继承中变量的访问特点6. super关键字7. 继承中构造方法访问特点8. 继承中成员方法访问特点9. 方法重写10. 方法重写注意事项11. Java继承注意事项 1. 理解继承 2. 继承概述 1. 继承是面向对象的三大特征之一…

ILSVRC2012数据集处理

ILSVRC2012数据集处理 解压图像处理标签和图像 解压图像 先解压 tar -xvf ILSVRC2012_img_train.tar 解压之后其实还是1000个tar压缩包&#xff08;对应1000个类别&#xff09;&#xff0c;需要再次解压&#xff0c;解压脚本unzip.sh如下&#xff08;PS&#xff1a;可能需要自…

银行合规知识竞赛要怎么策划才高大上

合规是银行业务永恒的主题&#xff0c;也是银行发展的根本保障。加强合规知识的学习和理解是保障银行业务健康发展的基础。通过竞赛形式的开展&#xff0c;旨在增强员工对风险和合规的敏感度和关注度&#xff0c;推动全行合规水平全面提升。那么如何策划一场高水平的银行合规知…

开发环境配置整理大全——Visual Studio 最新安装篇

Visual Studio是微软的集成开发环境&#xff08;IDE&#xff09;&#xff0c;以Windows为主的平台开发的一套功能全面而强大的IDE&#xff0c;支持C#、F#、VB、C/C、HTML等36 种语言的开发。开发人员常使用的开发工具之一&#xff0c;Visual Studio今年4月出了最新版本的2022款…

Ubuntu系统CLion安装

Ubuntu系统CLion安装 pycharm 同理。 参考官网安装过程&#xff1a;官网安装过程 下载linux tar.gz包 # 解压 sudo tar -xzvf CLion-*.tar.gz -C /opt/ sh /opt/clion-*/bin/clion.sh其中第二个命令是启动CLion命令 clion安装完以后&#xff0c;不会在桌面或者菜单栏建立图…

数学公式KaTex识别神器,LaTex-OCR

使用KaTex格式来书写数学公式是个痛苦的事情&#xff0c;有时候看到某个数学公式想记录下来&#xff0c;为了省事不得不截图&#xff0c;但这很不专业&#xff0c;今天发现一个可以智能识别公式的程序&#xff0c;它使用机器学习模型来识别图像&#xff0c;并转化成KaTex代码&a…

vmware虚拟机怎么安装linux-rocky操作系统

vmware虚拟机安装linux-rocky操作系统 rocky下载地址&#xff1a;https://rockylinux.org/zh_CN/download/ 我下载boot版本&#xff0c;安装时候需要联网。 接下来一路下一步&#xff0c;硬盘这里可以选择“将虚拟磁盘存储为单个文件”&#xff0c;然后一直点击到完成就可以。…

【C 语言经典100例】C 练习实例9

题目&#xff1a;要求输出国际象棋棋盘。 程序分析&#xff1a;国际象棋棋盘由64个黑白相间的格子组成&#xff0c;分为8行*8列。用i控制行&#xff0c;j来控制列&#xff0c;根据ij的和的变化来控制输出黑方格&#xff0c;还是白方格。 #include<stdio.h>int main() {…

《社交泛娱乐出海作战地图》加印领取啦!

全网都在找的、内容扎实形制精炼的行业首款 融云《社交泛娱乐出海作战地图》 响应需求&#xff0c;惊喜加印啦&#xff01; 久等的大家点击上图或阅读原文获取吧~ 关注【融云全球互联网通信云】了解更多 发布以来&#xff0c;《地图》两次加印均被抢购一空。 公众号后台、朋友…

SAP SM30及ABAP维护ADRC中央地址主数据(BAS)

文章背景&#xff1a; 项目组员在创建SM30的时候&#xff0c;发现了下图的报错&#xff0c;原因是因为自建表中的地址编号ADRNR字段使用了标准的数据元素AD_ADDRNUM&#xff0c;当使用包含该数据元素的视图在SM30进行维护时&#xff0c;就会出现下面的报错AM287。 后续了解到&…