SMESwin Unet:融合CNN和Transformer进行医学图像分割

news2024/11/24 18:54:47

文章目录

  • SMESwin Unet: Merging CNN and Transformer for Medical Image Segmentation
    • 摘要
    • 本文方法
      • Superpixel
      • MCCT

SMESwin Unet: Merging CNN and Transformer for Medical Image Segmentation

摘要

视觉Transformer 是自去年以来医学图像分割领域最受欢迎的新范式,在定量指标上超过了传统的CNN。ViTs的显著优点是利用注意力层来对token之间的全局关系进行建模。然而,ViTs表达能力的提高也带来了相应的缺点:缺乏CNN的归纳偏差(局部性)、翻译不变性和视觉信息的层次结构。因此,训练有素的ViT比CNN需要更多的数据。由于医学成像领域的高质量数据总是有限的,我们提出了SMESwin-UNet。

本文方法

  1. 在通道交叉融合变换器(CCT)的基础上,我们通过设计一个具有CNN和ViTs的复合结构(名为MCCT)来融合多尺度语义特征和注意力图。
  2. 通过将像素级特征划分为区域级来引入超像素,以避免图像中无意义部分的干扰
  3. 我们使用外部注意力来考虑所有数据样本之间的相关性,这可能会进一步减少小数据集的限制

本文方法

在这里插入图片描述
遵循Swin-Unet编码器-解码器架构。将输入图像x∈RH×W×3分割成分辨率为H4×

然后将贴片展平并传递到具有输出维度Ci的线性嵌入层中,得到原始嵌入序列e∈Rd×Ci。

变换后的patch token通过几个Swin Transformer块来提取全局信息和patch合并层,这可以减少采样并增加维度。解码器由Swin Transformer块和patch扩展层组成。

patch扩展层将以2倍分辨率的上采样执行上采样。特别地,最后一个patch扩展层执行4×上采样以将特征图恢复到输入分辨率。最后,这些上采样的特征通过线性投影层来输出像素级分割预测

Superpixel

我们通过超像素分割分支来减少原始输入图像中的无效信息。为了最大限度地降低模型的复杂性,我们使用简单线性迭代聚类(SLIC),它不需要任何超像素分割训练。关键步骤如下:

  1. 聚类中心 假设原始图像包括P个像素和N个超像素聚类。相邻聚类中心之间的距离近似于S=根号P/N ,在聚类中心初始化过程中,在窗口n×n的范围内,用最小梯度位置替换原始聚类中心
  2. 聚类阈值 对于来自图像i和j的两个像素,像素dlab的颜色相异性可以定义为:
    在这里插入图片描述
    其中Ds是聚类阈值,其中较大的值表示较高的像素相似性;m是控制聚类阈值的颜色区分和空间距离比例的平衡参数。SLIC利用聚类中心搜索2S×2S邻域:(1)如果像素的相似度高于聚类阈值,则像素应该聚类到相应的中心,以及(2)将聚类中心的符号标记分配给相应的像素。重复这个迭代过程直到收敛。
    然后SLIC生成具有超像素分割的特征图,并在下一个跳过连接模块中将特征图传递给简单的CNN。

MCCT

在这里插入图片描述
继UCTransnet中的CCT之后,提出了一种混合CNN和ViT的新型模块(MCCT)。MCCT比CCT具有更好的细节捕获能力,并且需要更少的计算

MCCT和CCT之间的两个主要区别是:
1)与CNN的一个新连接
2)删除了第四个连接。为了保持细节信息,我们对超像素特征图使用CNN层(d0)

对于来自CNN层的特征,CCT通过将编码器特征平坦化为大小为4×4的2D补丁来进行标记化,该2D补丁与来自变换器块的补丁标记具有相同的大小。在多头交叉注意中,我们使用令牌Ti∈R HW 作为查询,并使用T∑=Concat(T0,T1,T2,T3)作为key和值

然后,通过多层感知器对通道和依赖项进行编码,以细化特征
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/588137.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ts报错“this“ 隐式具有类型 “any“,因为它没有类型注释。解决方案

序 1、参考博文》①严格模式 - 知乎,②ts的tsconfig.son中文说明③TypeScript Number | 菜鸟教程 2、解决(ts报错“this“ 隐式具有类型 “any“,因为它没有类型注释。) 3、解决(函数内this是undefined 的问题&#xf…

汽车EDI:如何与Stellantis建立EDI连接?

Stellantis 是一家实力雄厚的汽车制造公司,由法国标致雪铁龙集团(PSA集团)和意大利菲亚特克莱斯勒汽车集团(FCA集团)合并而成,是世界上第四大汽车制造商,拥有包括标致、雪铁龙、菲亚特、克莱斯勒…

Hive学习---1、Hive入门、Hive 安装

1、Hive入门 1.1 什么是Hive 1、Hive简介 Hive是由Facebook开源,基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 2、Hive本质 Hive是一个Hadoop客户端,用于将HQL(Hive SQL…

【六一为孩子建模吧】沐风老师3DMAX建模雕刻插件SculptTool使用教程

3DMAX建模雕刻插件,该工具旨在使对角色和地形等有机模型进行小型编辑成为可能,而无需离开3dMax并启动如ZBrush等专用雕刻应用程序,就可以在3DMAX中直接对小型模型进行简单的雕刻建模处理,这样会方便很多。 【适用版本】 3dMax202…

【C++初阶】:string类

string 一string的基本用法二.迭代器1.基本使用2.语法糖3.反向迭代器4.const迭代器 三.容量四.插入和删除五.一个例题:解析协议六.读取空格七.一些其他函数 一string的基本用法 文档里 一般使用 二.迭代器 1.基本使用 string里重载了一种非常厉害的运算符[ ] 这个运…

【web安全】文件包含漏洞

目录 1.什么是文件包含漏洞 2.产生原因 3.文件包含的类型 3.1本地文件包含 3.2远程文件包含 4.攻击利用手法 4.1 file:协议 4.2 php://协议 ​4.3 zip://,bzip2://,zlib://协议 4.4 data://协议 4.5 PHP伪协议总结 5.如何防御? 6.常见系统的默认路径…

Tcl-11. 列表操作

Tcl 中的列表操作: 列表则是具有特殊解释的字符串。Tcl 中的列表操作和其它 Tcl 命令 一样具有相同的结构。 列表可应1用在诸如 foreach 这样的以列表为变元的循环命令中,也应于构建 eval 命令的延迟命令字符串。 一、list 命令 list 命令用来创建列表…

城市内涝的解决措施,城市内涝积水监测预警系统解决方案

随着城市化进程的加快,城市土地面积不断扩大,原本吸收雨水的土地被水泥、沥青等硬质材料所取代,导致雨水无法迅速渗透和排泄,增加了城市内涝的风险。同时,气候变化带来的极端降雨事件频率增加,更加加剧了内…

mysql触发器监听数据投递中间件

目前市面上有许多的 CDC(Change Data Capture) 框架用于监听数据库的数据变动,例如:canal、Debezium、Maxwell等都是用来解析 binlog 日志实现事件的监听。但是有一个情况就是如果公司对 binlog 日志文件的权限管控的很严格&#…

传统ERP和SaaS ERP区别在哪里?

一、ERP和SaaS ERP概念 企业资源计划 (ERP) 系统是许多企业的主干,助力管理整个企业内的会计、采购流程、项目等。对于许多 IT 部门而言,ERP 系统通常意味着大型、昂贵且耗时的部署,并可能需要进行大量硬件或基础设施投资。然而,…

基于标准库函数的STM32的freertos的移植(三)——MDK工程搭建、配置与修改

1.打开MDK5软件,新建MDK工程,将新建工程文件保存在Project_Stm32f407/mdk文件夹下,并将工程命名为freertos_M4,选择MCU型号为STM32F407ZG,新建工程文件的步骤如下图所示: 图1 新建工程 图2 保存工程路径和工…

ChatGPT-AI地图

ChatGPT-AI地图 1、AI-对话 应用名称应用地址ChatGPThttps://chat.openai.com/NotionAINotion AIA.I. Data Sidekick:AI工具编写 SQL、文档等的速度提高10倍[AirOpsWritesonic:人工智能写作辅助工具Writesonic - Best AI Writer, Copywriting & Par…

《深入理解计算机系统(CSAPP)》第3章 程序的机器级表示 - 学习笔记

写在前面的话:此系列文章为笔者学习CSAPP时的个人笔记,分享出来与大家学习交流,目录大体与《深入理解计算机系统》书本一致。因是初次预习时写的笔记,在复习回看时发现部分内容存在一些小问题,因时间紧张来不及再次整理…

MySQL 数值函数

文章目录 数值函数1. abs(num)2. ceil(num)3. floor(num)4. mod(num1,num2)5. rand()6. round(num,n)7. truncate(num,n)8. sqrt(num) 数值函数 数值函数用来处理数值方面的运算,能够提高用户的工作效率。常用的数值函数如下表所示,函数括号内为输入的参…

牛客网基础语法11~20题

前言:今天是咱们第二期刷牛客网上的题目。 目标:对输入输出的格式,方法,类型掌握熟练,对double,float理解深入,编程思想更进一步。 鸡汤:人活着,再苦再累,都别…

16-Vue技术栈之常用的 Composition API

目录 1、什么是组合式 API?2、拉开序幕的setup3、ref函数4、reactive函数5、Vue3.0中的响应式原理5.1 vue2.x的响应式5.2 Vue3.0的响应式 6、reactive对比ref7、setup的两个注意点8、计算属性与监视8.1 computed函数8.2 watch函数8.3 watchEffect函数 9、 生命周期1…

防雷接地的施工工艺与防雷施工方案

雷电是自然界的一种强大而危险的自然现象,经常造成重大财产损失和人员伤亡。为了保护建筑物和人员免受雷电的危害,防雷接地系统的设计和施工至关重要。本文将介绍防雷接地的施工工艺和防雷施工方案,强调专业和符合国家标准的方法,…

chatgpt赋能python:Python中乘方运算符号:用于数学计算和科学计算

Python中乘方运算符号:用于数学计算和科学计算 简介 乘方运算是Python中常用的数学运算符,通常在数学计算和科学计算中使用。在Python中,乘方运算符用**表示。该运算符用于计算数字的指数幂。 用法 乘方运算符可以用于两个数字之间的计算…

vue开发环境搭建-win7

vue开发环境搭建-win7 1. 安装node,js2. 设置node global(全局)和cache(缓存)路径3. 配置环境变量4. 基于 Node.js 安装cnpm(淘宝镜像)5. 安装vue6. 安装vue脚手架 vue-cli7. 项目创建8. 添加相关依赖9. 修改端口号10. 运行项目 1. 安装node,js 下载no…

docker版jxTMS使用指南:python服务之内置自动机

本文讲解4.0版的jxTMS中python服务的内置自动机,整个系列的文章请查看:docker版jxTMS使用指南:4.0版升级内容 docker版本的使用,请参考:docker版jxTMS使用指南 4.0版jxTMS中python服务是一个采集前端数据的接口机。其…