《从U-Net到Transformer:深度模型在医学图像分割中的应用综述》论文阅读

news2025/1/7 5:35:41

网络首发地址:https://link.cnki.net/urlid/51.1307.tp.20231026.1648.002

摘要:

        U-Net以卷积神经网络(CNN)为主干,其易于优化促使在医学图像分割领域的发展,

但只擅长获取局部特征,缺乏长期相关性解释。(就是说,只能很好抓住局部关系,不能很好把握全局关系,就像翻译时只是单词的堆砌,而不是顾及前后让整句话更顺畅合理)

        本文主要对近七年U型网络改进工作,Transformer与U型网络的结合,在Synapse和ACDC数据集上进行对比实验,最后证明transformer在图像分割上更有优势。

引言:

医学图像分割技术在CT, MRI,X-Ray,超声等广泛应用。传统技术主要有....,不能解决现代问题。为了解决这一问题,且更好治疗, 诞生了CAD系统,其中重要的就是医学图像处理。

2015提出U-Net奠定了图像分割的发展方向——FCN改进后,拥有完整encode-decode结构,和用于融合高低分辨率的跳跃连接。

本文主要内容(贡献):阐述了从U-Net到Transformer发展过程,以及各个方法论文的研究方法优劣,对不同研究目的提出参考性建议。

基于U-Net的相关改进

1. 从2D扩展到3D的U-Net

2. 残差思想:

milletar对编码器子块引入了残差连接,使用四次下采样操作,有助于减少网络在训练期间占用的的内存,且捕获深层特征。同时其通过非线性转换实现了数据增强。

3.密集思想

黄高博士在DenseNet[26]中提出,在神经网络 中,先前层与后续层相连接共同作为下一层的输入,通过最大 化信息流以消除梯度消失,并加强特征传播、鼓励特征重用。

可以从图像中提取不同尺寸的上下文信息,进一步提升网络 性能。

4.多机制组合

5.多网络模型

即网络与网络两个巧妙连接,如两个U-Net连接起来。

6.编解码器分支

7.基于transformer的变化

Transformer解决了局部性 的归纳偏差,使其更有能力建立非局部的相互关系。(其有位置编码,自注意力机制,能够掌控全局上下文关系。)

名词学习:

数据增强: 就是创建原数据的新变体然后进行训练的过程叫数据增强。创建新变体过程如旋转,剪切,擦除,噪点引入,遮挡,弹性变形,缩放等。  使得模型泛化能力更强,避免过拟合

ReLU 激活函数的定义是:ReLU(x)=max⁡(0,x)ReLU(x)=max(0,x)

额外感受(收获):

算法不仅要考虑合理性,而且还要看训练数据集,是大器官,还是视网膜等微小细节的数据集。

GoogLeNet[22]中的Inception模块将全连接或普通卷积结 构转化为稀疏连接,以解决大量参数导致的过拟合问题[23]


 

怎么得出模型的优势?(抓住框架中每个模块的各自特征,进行互补或则增强)

文中提到TransUNet,二者结合既保留高分 辨率位置信息又继承低分辨率细节信息。这怎么得出的呢,

就在于CNN特别擅长捕捉局部特征和纹理信息,这些通常在图像的高分辨率表示中更容易被识别。而transformer通过自注意力机制能够捕捉长距离依赖关系,它不受限于局部区域,能够在整个图像范围内建立特征之间的联系,这有助于提取低分辨率的全局上下文信息。

做数据增强的时候可以用他的包,参考视频链接

开始跑实验的时候,最好把维度也打印出来,一方面便于理解,另一方面便于调试。

参考:

https://zhuanlan.zhihu.com/p/574835363(类似综述)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1971920.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大模型三种模式Embedding、copilot、Agent

大模型的三种应用模式——Embedding、Copilot、Agent——代表了不同级别的智能化和自动化程度,以及与人类用户的交互方式。下面是每种模式的具体解释: 嵌入模式(Embedding Mode) 定义:在嵌入模式中,大模型…

Tomcat部署——个人笔记

Tomcat部署——个人笔记 文章目录 [toc]简介安装配置文件WEB项目的标准结构WEB项目部署IDEA中开发并部署运行WEB项目 本学习笔记参考尚硅谷等教程。 简介 Apache Tomcat 官网 Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中…

虚拟机Windows server忘记密码解决方法

原理 utilman.exe是Windows辅助工具管理器程序,‌虽然它本身不是一个关键的系统进程,‌但通过修改这个文件,‌用户可以访问一些有用的UI设置。‌在某些情况下,‌比如忘记密码需要重置时,‌通过修改utilman.exe文件为c…

别再羡慕别人了!学会这四招,你的视频也能爆红网络

现在的短视频剪辑实在是太火爆了,动不动打开抖音刷一下就两三个小时过去了,每天被这短视频洗脑慢慢地身边也越来越多人自学视频的剪辑,所以,作为自学多年的的自媒体打工人,好用的剪辑软件还是要推荐给大家的&#xff1…

包拯断案 | 数据库从库复制延迟引发高可用风险 怎么破@还故障一个真相

提问:作为DBA运维的你是否遇到过这些烦恼 1、数据库从库复制出现了延迟,是什么原因导致的? 2、延迟引发了高可用风险,应该如何处理? 心中有章,遇事不慌 作为DBA的你,遇到问题无从下手&#xf…

【轨物方案】评估光伏组件发电性能一致性方案

光伏电站建设后运行周期长达二十多年,对于电站运营者来说,基础设施的稳定、安全、高效的运行是至关重要的。然而从近些年光伏的发展过程中看到,在电站规划到后期运维整个过程中可能存在着诸多问题,如设备选型不当、施工建设质量差…

RHCSA第一次作业

目录 1、创建以上目录和文件结构,并将/yasuo目录拷贝4份到/目录下 2、查看系统合法shell 3、查看系统发行版版本 4、查看系统内核版本 5、临时修改主机名 6、为/yasuo/ssh_config文件创建软链接/ssh_config.link到/mulu下 7、创建目录/mulu ,重命名并移动/ss…

Linux用户-su命令

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注我,我尽量把自己会的都分享给大家,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 Linux是一个多用户多任务操作系统,这意味着它可以同时支持多个用户登录并使用系统。…

【前端面试题】后端一次性返回10w条数据,该如何渲染?

后端一次返回 10w 条数据,本身这种技术方案设计就不合理。 问题分析: JS 支持处理10w 条数据,但 DOM 一次渲染 10w 条数据,可能会卡顿,所以需想办法减少 DOM 渲染 若非要实现,则可以考虑以下两种方案 自…

「测试线排查的一些经验-上篇」 后端工程师

文章目录 端口占用脚本失灵线上部署项目结构模版配置文件生效 一般产品研发过程所使用的环境可分为: 研发环境-dev测试环境-test生产环境-prod 软件开发中,完整测试环境包括:UT、IT、ST、UAT UT Unit Test 单元测试 IT System Integration …

《C语言程序设计 第4版》笔记和代码 第十二章 数据体和数据结构基础

12.1从基本数据类型到抽象数据类型 1 所有的程序设计语言都不能将所有复杂数据对象作为其基本数据类型,因此需要允许用户自定义数据类型,在C语言中,就存在构造数据类型(复合数据类型)。 2 结构体是构造数据类型的一种…

使用Openvino部署C++的Yolov5时类别信息混乱问题记录

使用Openvino部署C的Yolov5时类别信息混乱问题记录 简单记录一下。 一、问题描述 问题描述:在使用Yolov5的onnx格式模型进行C的Openvino进行模型部署时,通过读取classes.txt获得类别信息时,出现模型类别混乱,或者说根本就不给图…

【原创】java+swing+mysql学分管理系统设计与实现

个人主页:程序员杨工 个人简介:从事软件开发多年,前后端均有涉猎,具有丰富的开发经验 博客内容:全栈开发,分享Java、Python、Php、小程序、前后端、数据库经验和实战 开发背景: 随着信息技术的…

嵌入式单片机中在线调试工具使用方法

大家好,相信很多小伙伴都听说过,或者用过SystemView这款工具。 它是一个可以在线调试嵌入式系统的工具,它可以分析RTOS有哪些中断、任务执行了,以及这些中断、任务执行的先后关系。 还可以查看一些内核对象持有和释放的时间点,比如信号量、互斥量、事件、消息队列等,这在…

Vue3 form表单赋值后,input输入框无法输入

1.使用reactive初始化数据: 需要用一个对象包裹数据,使其变成响应式数据 Form表单及JS中的使用都需要 “paramr.formUser” 进行调用 原因: 使用reactive生成的响应式数据,在直接赋值时把响应式数据给替换为了普通数据了,导致无法监听数据的变化。 2. …

Flutter——权威常用组件demo代码开源

背景 自学的过程中,并记录下来仅供大家一起学习 开源地址:https://github.com/z244370114/flutter_demo

软件测试经典面试题,助你面试加分

一 时间紧迫的情况下,如何做好测试工作? 对需求要明确,对需求的优先级也要明确,在项目的过程中就可以少做变更的工作。减少测试的工作量。 由资深测试工程师对测试用例进行设计,并进行用例评审。 用例要重点覆盖主要…

Cocos Creator2D游戏开发(10)-飞机大战(8)-计分和结束

现在游戏基本能完了, 飞机能发射子弹,打了敌机,敌机也能炸; 接下来要做计分了; 步骤: 搞出一个lable让lable显示炸了多少飞机 开搞: ①创建一个Lable标签 ② root.ts文件 添加 property(Label) player_score: Label; // 标签属性 标签绑定 ③ 代码添加 注册 然后回调 contac…

iOS弱引用

背景:在面试过程中被问到如果两个对象已经发生循环引用了,该如何将他们剪断,在运行态的时候。 由于这个场景比较抽象,我理解面试官是希望我通过运行时的方法和方式来解决循环引用。 解决方案一: 重写setter用关联对象来实现wea…