SMESwin Unet：融合CNN和Transformer进行医学图像分割

news2026/2/12 13:03:52

文章目录

SMESwin Unet: Merging CNN and Transformer for Medical Image Segmentation
- 摘要
- 本文方法
- - Superpixel
  - MCCT

SMESwin Unet: Merging CNN and Transformer for Medical Image Segmentation

摘要

视觉Transformer 是自去年以来医学图像分割领域最受欢迎的新范式，在定量指标上超过了传统的CNN。ViTs的显著优点是利用注意力层来对token之间的全局关系进行建模。然而，ViTs表达能力的提高也带来了相应的缺点：缺乏CNN的归纳偏差（局部性）、翻译不变性和视觉信息的层次结构。因此，训练有素的ViT比CNN需要更多的数据。由于医学成像领域的高质量数据总是有限的，我们提出了SMESwin-UNet。

本文方法

在通道交叉融合变换器（CCT）的基础上，我们通过设计一个具有CNN和ViTs的复合结构（名为MCCT）来融合多尺度语义特征和注意力图。
通过将像素级特征划分为区域级来引入超像素，以避免图像中无意义部分的干扰
我们使用外部注意力来考虑所有数据样本之间的相关性，这可能会进一步减少小数据集的限制

本文方法

在这里插入图片描述
遵循Swin-Unet编码器-解码器架构。将输入图像x∈RH×W×3分割成分辨率为H4×

然后将贴片展平并传递到具有输出维度Ci的线性嵌入层中，得到原始嵌入序列e∈Rd×Ci。

变换后的patch token通过几个Swin Transformer块来提取全局信息和patch合并层，这可以减少采样并增加维度。解码器由Swin Transformer块和patch扩展层组成。

patch扩展层将以2倍分辨率的上采样执行上采样。特别地，最后一个patch扩展层执行4×上采样以将特征图恢复到输入分辨率。最后，这些上采样的特征通过线性投影层来输出像素级分割预测

Superpixel

我们通过超像素分割分支来减少原始输入图像中的无效信息。为了最大限度地降低模型的复杂性，我们使用简单线性迭代聚类（SLIC），它不需要任何超像素分割训练。关键步骤如下：

聚类中心 假设原始图像包括P个像素和N个超像素聚类。相邻聚类中心之间的距离近似于S=根号P/N ,在聚类中心初始化过程中，在窗口n×n的范围内，用最小梯度位置替换原始聚类中心
聚类阈值 对于来自图像i和j的两个像素，像素dlab的颜色相异性可以定义为：

其中Ds是聚类阈值，其中较大的值表示较高的像素相似性；m是控制聚类阈值的颜色区分和空间距离比例的平衡参数。SLIC利用聚类中心搜索2S×2S邻域：（1）如果像素的相似度高于聚类阈值，则像素应该聚类到相应的中心，以及（2）将聚类中心的符号标记分配给相应的像素。重复这个迭代过程直到收敛。
然后SLIC生成具有超像素分割的特征图，并在下一个跳过连接模块中将特征图传递给简单的CNN。

MCCT

在这里插入图片描述
继UCTransnet中的CCT之后，提出了一种混合CNN和ViT的新型模块（MCCT）。MCCT比CCT具有更好的细节捕获能力，并且需要更少的计算

MCCT和CCT之间的两个主要区别是：
1）与CNN的一个新连接
2）删除了第四个连接。为了保持细节信息，我们对超像素特征图使用CNN层（d0）

对于来自CNN层的特征，CCT通过将编码器特征平坦化为大小为4×4的2D补丁来进行标记化，该2D补丁与来自变换器块的补丁标记具有相同的大小。在多头交叉注意中，我们使用令牌Ti∈R HW 作为查询，并使用T∑=Concat（T0，T1，T2，T3）作为key和值

然后，通过多层感知器对通道和依赖项进行编码，以细化特征
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/588137.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ts报错“this“ 隐式具有类型 “any“，因为它没有类型注释。解决方案

ts报错“this“ 隐式具有类型 “any“，因为它没有类型注释。解决方案

序 1、参考博文》①严格模式 - 知乎，②ts的tsconfig.son中文说明③TypeScript Number | 菜鸟教程 2、解决（ts报错“this“ 隐式具有类型 “any“，因为它没有类型注释。） 3、解决（函数内this是undefined 的问题&#xf…

阅读更多...

汽车EDI：如何与Stellantis建立EDI连接？

汽车EDI：如何与Stellantis建立EDI连接？

Stellantis 是一家实力雄厚的汽车制造公司，由法国标致雪铁龙集团（PSA集团）和意大利菲亚特克莱斯勒汽车集团（FCA集团）合并而成，是世界上第四大汽车制造商，拥有包括标致、雪铁龙、菲亚特、克莱斯勒…

阅读更多...

Hive学习---1、Hive入门、Hive 安装

Hive学习---1、Hive入门、Hive 安装

1、Hive入门 1.1 什么是Hive 1、Hive简介 Hive是由Facebook开源，基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。 2、Hive本质 Hive是一个Hadoop客户端，用于将HQL（Hive SQL…

阅读更多...

【六一为孩子建模吧】沐风老师3DMAX建模雕刻插件SculptTool使用教程

【六一为孩子建模吧】沐风老师3DMAX建模雕刻插件SculptTool使用教程

3DMAX建模雕刻插件，该工具旨在使对角色和地形等有机模型进行小型编辑成为可能，而无需离开3dMax并启动如ZBrush等专用雕刻应用程序，就可以在3DMAX中直接对小型模型进行简单的雕刻建模处理，这样会方便很多。【适用版本】 3dMax202…

阅读更多...

【C++初阶】：string类

【C++初阶】：string类

string 一string的基本用法二.迭代器1.基本使用2.语法糖3.反向迭代器4.const迭代器三.容量四.插入和删除五.一个例题：解析协议六.读取空格七.一些其他函数一string的基本用法文档里一般使用二.迭代器 1.基本使用 string里重载了一种非常厉害的运算符[ ] 这个运…

阅读更多...

【web安全】文件包含漏洞

【web安全】文件包含漏洞

目录 1.什么是文件包含漏洞 2.产生原因 3.文件包含的类型 3.1本地文件包含 3.2远程文件包含 4.攻击利用手法 4.1 file:协议 4.2 php://协议 4.3 zip://,bzip2://,zlib://协议 4.4 data://协议 4.5 PHP伪协议总结 5.如何防御？ 6.常见系统的默认路径…

阅读更多...

Tcl-11. 列表操作

Tcl-11. 列表操作

Tcl 中的列表操作： 列表则是具有特殊解释的字符串。Tcl 中的列表操作和其它 Tcl 命令一样具有相同的结构。列表可应1用在诸如 foreach 这样的以列表为变元的循环命令中，也应于构建 eval 命令的延迟命令字符串。一、list 命令 list 命令用来创建列表…

阅读更多...

城市内涝的解决措施，城市内涝积水监测预警系统解决方案

城市内涝的解决措施，城市内涝积水监测预警系统解决方案

随着城市化进程的加快，城市土地面积不断扩大，原本吸收雨水的土地被水泥、沥青等硬质材料所取代，导致雨水无法迅速渗透和排泄，增加了城市内涝的风险。同时，气候变化带来的极端降雨事件频率增加，更加加剧了内…

阅读更多...

mysql触发器监听数据投递中间件

mysql触发器监听数据投递中间件

目前市面上有许多的 CDC（Change Data Capture） 框架用于监听数据库的数据变动，例如：canal、Debezium、Maxwell等都是用来解析 binlog 日志实现事件的监听。但是有一个情况就是如果公司对 binlog 日志文件的权限管控的很严格&#…

阅读更多...

传统ERP和SaaS ERP区别在哪里？

传统ERP和SaaS ERP区别在哪里？

一、ERP和SaaS ERP概念企业资源计划 (ERP) 系统是许多企业的主干，助力管理整个企业内的会计、采购流程、项目等。对于许多 IT 部门而言，ERP 系统通常意味着大型、昂贵且耗时的部署，并可能需要进行大量硬件或基础设施投资。然而，…

阅读更多...

基于标准库函数的STM32的freertos的移植（三)——MDK工程搭建、配置与修改

基于标准库函数的STM32的freertos的移植（三)——MDK工程搭建、配置与修改

1.打开MDK5软件，新建MDK工程，将新建工程文件保存在Project_Stm32f407/mdk文件夹下，并将工程命名为freertos_M4，选择MCU型号为STM32F407ZG，新建工程文件的步骤如下图所示： 图1 新建工程图2 保存工程路径和工…

阅读更多...

ChatGPT-AI地图

ChatGPT-AI地图

ChatGPT-AI地图 1、AI-对话应用名称应用地址ChatGPThttps://chat.openai.com/NotionAINotion AIA.I. Data Sidekick：AI工具编写 SQL、文档等的速度提高10倍[AirOpsWritesonic：人工智能写作辅助工具Writesonic - Best AI Writer, Copywriting & Par…

阅读更多...

《深入理解计算机系统(CSAPP)》第3章程序的机器级表示 - 学习笔记

《深入理解计算机系统(CSAPP)》第3章程序的机器级表示 - 学习笔记

写在前面的话：此系列文章为笔者学习CSAPP时的个人笔记，分享出来与大家学习交流，目录大体与《深入理解计算机系统》书本一致。因是初次预习时写的笔记，在复习回看时发现部分内容存在一些小问题，因时间紧张来不及再次整理…

阅读更多...

MySQL 数值函数

MySQL 数值函数

文章目录数值函数1. abs(num)2. ceil(num)3. floor(num)4. mod(num1,num2)5. rand()6. round(num,n)7. truncate(num,n)8. sqrt(num) 数值函数数值函数用来处理数值方面的运算，能够提高用户的工作效率。常用的数值函数如下表所示，函数括号内为输入的参…

阅读更多...

牛客网基础语法11~20题

牛客网基础语法11~20题

前言：今天是咱们第二期刷牛客网上的题目。目标：对输入输出的格式，方法，类型掌握熟练，对double，float理解深入，编程思想更进一步。鸡汤：人活着，再苦再累，都别…

阅读更多...

16-Vue技术栈之常用的 Composition API

16-Vue技术栈之常用的 Composition API

目录 1、什么是组合式 API？2、拉开序幕的setup3、ref函数4、reactive函数5、Vue3.0中的响应式原理5.1 vue2.x的响应式5.2 Vue3.0的响应式 6、reactive对比ref7、setup的两个注意点8、计算属性与监视8.1 computed函数8.2 watch函数8.3 watchEffect函数 9、生命周期1…

阅读更多...

防雷接地的施工工艺与防雷施工方案

防雷接地的施工工艺与防雷施工方案

雷电是自然界的一种强大而危险的自然现象，经常造成重大财产损失和人员伤亡。为了保护建筑物和人员免受雷电的危害，防雷接地系统的设计和施工至关重要。本文将介绍防雷接地的施工工艺和防雷施工方案，强调专业和符合国家标准的方法，…

阅读更多...

chatgpt赋能python：Python中乘方运算符号：用于数学计算和科学计算

chatgpt赋能python：Python中乘方运算符号：用于数学计算和科学计算

Python中乘方运算符号：用于数学计算和科学计算简介乘方运算是Python中常用的数学运算符，通常在数学计算和科学计算中使用。在Python中，乘方运算符用**表示。该运算符用于计算数字的指数幂。用法乘方运算符可以用于两个数字之间的计算…

阅读更多...

vue开发环境搭建-win7

vue开发环境搭建-win7

vue开发环境搭建-win7 1. 安装node,js2. 设置node global(全局)和cache(缓存)路径3. 配置环境变量4. 基于 Node.js 安装cnpm（淘宝镜像）5. 安装vue6. 安装vue脚手架 vue-cli7. 项目创建8. 添加相关依赖9. 修改端口号10. 运行项目 1. 安装node,js 下载no…

阅读更多...

docker版jxTMS使用指南：python服务之内置自动机

docker版jxTMS使用指南：python服务之内置自动机

本文讲解4.0版的jxTMS中python服务的内置自动机，整个系列的文章请查看：docker版jxTMS使用指南：4.0版升级内容 docker版本的使用，请参考：docker版jxTMS使用指南 4.0版jxTMS中python服务是一个采集前端数据的接口机。其…

阅读更多...

推荐文章

最新文章