SvANet:微小医学目标分割网络,增强早期疾病检测

news2024/12/24 8:44:25

SvANet:微小医学目标分割网络,增强早期疾病检测

    • 提出背景
      • 前人工作
        • 医学对象分割
        • 微小医学对象分割
        • 注意力机制
    • SvANet 结构图
      • SvANet 解法拆解
        • 解法
        • 逻辑链

 


论文:SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmentation

代码:https://github.com/anthonyweidai/SvANet

提出背景

一种新型神经网络,名为SvANet,该网络专为图像中小型医疗对象的分割而设计,这对于早期疾病检测和准确诊断至关重要。

  1. 问题背景:早期检测和诊断疾病可以显著提高治疗效果。当疾病表现为医学图像中的小感染区域时,这一点尤为重要,因为这些小区域难以准确检测。

  2. 当前挑战:传统的深度学习模型,如卷积神经网络(CNNs),在小对象分割方面常常遇到困难,因为它们通过重复的处理步骤(如卷积和池化)丢失了重要细节。随着模型对图像数据更深层的处理,这个问题会加剧。

  3. SvANet解决方案:提出的SvANet通过以下方式解决这些挑战:

    • 蒙特卡罗注意力:此组件在不同的尺度上生成注意力图,帮助网络了解在图像中应该关注的位置。
    • 尺度变化注意力:这可能允许网络对图像中不同大小的特征给予不同程度的关注,这对检测小对象至关重要。
    • 视觉变压器:结合传统的卷积方法和视觉Transformer,以捕获图像中的局部和更全局的特征。
       
      这种模型以一种类似于Transformer处理序列的方式处理图像,可能更好地捕捉全局上下文。
  4. 性能:SvANet在多种类型的医学图像中分割小医疗对象方面表现出色,通过在几个数据集上的高分表现得到证明,非常接近医生的诊断结果。

    这些数据集包括肾肿瘤、皮肤病变、肝肿瘤、视网膜等图像,其中感兴趣的对象与整个图像大小相比非常小。

SvANet是一种复杂的工具,旨在增强医学成像中微小、可能表明疾病的异常的检测,从而支持更好的早期诊断实践。

前人工作

这段内容主要讨论了医学图像分割中几个关键的研究领域和技术进展,特别是如何处理小尺寸的医疗对象。我来为你简化解释每一部分:

医学对象分割
  • 基础技术: 使用编码器-解码器结构进行医学图像分割。这种结构首先通过编码器提取特征,然后通过解码器生成分割掩码,以区分图像中的不同医学对象。
  • U形结构: 通过使用卷积层连接编码器和解码器的分支,这种结构帮助信息在网络中有效传播,用于更好地分割图像中的对象,如肿瘤细胞等。
微小医学对象分割
  • 挑战: 深度学习中的卷积和池化操作可能会压缩输入数据,损害医学对象的形态特征。
  • 解决方案: 提出多种方法来改善小尺寸对象的分割效果,包括使用空洞卷积、跳跃连接、特征金字塔、多列结构和注意力机制等,这些技术有助于提取和放大图像中的小对象特征。
注意力机制
  • 应用: 在语义分割中广泛使用注意力机制来突出重要特征。
  • 技术创新: 结合通道注意力和空间注意力,提高多维特征的学习能力和分割精度。还引入了反向注意力和自注意力技术,以提取更细致的边界信息和增强输入数据内部的依赖关系。

 

SvANet 结构图

在这里插入图片描述

这张图是一个复杂的神经网络架构图,称为SvANet,用于医学图像的小物体分割。

  1. 输入图像: 最左侧展示了不同医学成像方式的小医疗对象的图片,包括全幅成像(WSI)、眼科成像(Oph)、皮肤科成像(Derm)、结肠镜检查(COL)、磁共振成像(MRI)、计算机断层扫描(CT)、和显微镜成像(MSCP)。

  2. MCAtn(蒙特卡罗注意力)模块: 在左上方的虚线框内,这部分通过使用不同规模的池化输出大小来生成注意力图,从而在单一阶段内学习小物体的空间信息和对象关系。

  3. SvAttn(尺度变化注意力)模块: 在顶部中间的虚线框内,此模块生成基于逐步压缩的特征图的注意力图,从而捕捉小医疗对象的位置和形态本质。

  4. AssemFormer: 在右上角的虚线框中,这部分结合了卷积和视觉变换器,通过组装张量来融合局部空间层次和片间表示,提供图像数据的全面理解。

  5. 卷积与池化操作: 图中展示了多阶段的卷积和池化操作,这些都是深度学习中常用的技术,用于提取特征和降低维度。

  6. ASPP(空洞空间金字塔池化): 在预测步骤之前,这一模块用于捕捉图像中的上下文信息,有助于改善分割的准确性。

  7. 预测输出: 图的右下角展示了不同成像方式的医学图像分割结果。

整体来看,这个架构通过结合传统的卷积神经网络和最新的视觉变换器技术,旨在更有效地检测和分割医学图像中的小型对象,特别是在复杂和信息丰富的医疗图像处理场景中。

 

以视网膜图像分割为例:

  1. 输入图像: 在此例中,输入图像为视网膜成像(Oph),如图中左侧部分所示。视网膜图像通常用于诊断各种眼病,如糖尿病性视网膜病变等。

    视网膜图像的分辨率和细节要求极高,因为需要精确地识别和分割出细微的血管和病变区域。

  2. MCAtn(蒙特卡罗注意力): 这一模块处理视网膜图像,通过不同规模的池化来创建注意力图,这有助于模型在不同大小的结构上聚焦,特别是小而重要的细节,如微小血管或早期病变。

  3. SvAttn(尺度变化注意力): 在处理视网膜图像时,这个模块通过分析不同尺度的特征图来更好地理解图像的深层结构。

    它帮助模型在不同层次上了解视网膜的复杂结构,特别是在图像中较难观察到的部分。

  4. AssemFormer: 这个部分将卷积层和视觉变换器的优势结合起来,通过组装张量,提供对视网膜图像局部和全局特征的深入理解。

    它有效地整合了视网膜图像中的局部细节和整体结构信息,有助于提高分割的准确性和鲁棒性。

  5. 预测输出: 最终,模型预测视网膜图像中的关键特征,如图中右下角的示例。

    这可以包括分割血管、识别病变区域等,这些信息对于后续的诊断和治疗规划至关重要。

通过这种高级别的网络架构,SvANet能够处理复杂的视网膜图像,并执行精确的医学图像分割任务,从而支持眼科医生更好地诊断和治疗眼部疾病。

这样的技术进步对于提早诊断和治疗许多潜在严重的眼部疾病具有重要意义。

SvANet 解法拆解

目的:提高对医学图像中小型医疗对象的分割和识别精度。

问题

  1. 小型医疗对象在图像中的特征不明显,易被忽略。
  2. 多尺度的特征捕捉困难,导致在不同尺寸和深度的特征识别上存在局限性。
  3. 传统的卷积网络在处理极小对象时信息丢失严重。
解法

消融实验:蒙特卡洛注意力 (MCAttn) 和 交叉尺度引导是提高预测精度的关键组件,而AssemFormer和MCBottleneck对提高阳性诊断(有某种疾病存在)的准确性至关重要。

  1. 蒙特卡洛注意力 (MCAttn)
    • 特征:使用随机采样的池化操作生成尺度不依赖的注意力图,允许模型在不同尺度上捕捉关键信息。
    • 原因:传统的全局平均池化在捕获跨尺度相关性方面能力有限。
    • 例子:在处理含有细小血管的视网膜图像时,MCAttn 能够增强模型对这些微小结构的识别能力。

处理特征提取过程中的尺度不变性,强化模型在处理小尺度特征时的表现。

与传统的全局注意力机制相比,MCAttn在特定的池化层中实施,直接增强了小对象特征的识别率,减少了背景噪声的干扰。

在这里插入图片描述

图显示了使用不同注意力机制的MCBottleneck和跨尺度引导(Cross-scale Guidance)生成的输出特征图。

  • (a) 输入图像:原始的医学图像。
  • (b) 地面真实情况(Ground Truth):标注了正确的医学对象位置和形态。
  • ©, (d), (e), (f):不同注意力机制(如SE、CBAM、CoorAttn)下的输出特征图,展示了模型如何处理输入图像并突出不同特征。
  • (g) 单元格代表使用蒙特卡洛注意力机制的输出特征图

通过对比 (b)、(g),这些图表展示了SvANet和其他模型如何在处理细小和微小医学对象方面的不同,特别是在保留细节和精确定位方面的能力。

  1. 跨尺度特征引导
    • 特征:利用早期模型阶段的高分辨率特征来指导后续阶段的特征学习。
    • 原因:小型医疗对象的信息内容随对象尺寸减小而显著减少,需要额外的引导来增强特征的学习。
    • 例子:在处理多层次的皮肤癌图像时,跨尺度特征引导帮助模型在深层学习小癌症区域的同时,不丢失浅层的高分辨率细节。

通过跨不同阶段的特征引导来增强模型对细节的捕捉能力。

利用高分辨率特征来指导模型在后续阶段更好地学习小尺度医疗对象的特征。

  1. 尺度变化注意力 (SvAttn)
    • 特征:处理全局特征表示有局限性,通过跨多个尺度处理全局依赖性。
    • 原因:需要在保持长距离相关性的同时克服单一尺度特征的局限。
    • 例子:在处理MRI图像中的小肿瘤时,SvAttn 允许模型在不同的尺度上有效分辨肿瘤和正常组织。

使模型能在不同尺度上动态调整,从而更精准地识别和分割小尺度医疗对象。

  1. 与视觉变换器结合的卷积 (AssemFormer)

    • 特征:结合了卷积和变换器的优势,同时学习局部和全局特征。
    • 原因:变换器缺乏归纳偏见,需要与卷积结合来增强特征学习。
    • 例子:在处理复杂的脑部图像时,AssemFormer能够同时捕捉到精细的局部结构(如血管和神经纤维)和整体的脑区分布。

     
    结合了卷积和变换器操作,同时学习输入医学图像的局部和全局特征。

    通过融合两种技术的优势,增强模型对医疗对象形态、深度和颜色分布的全局信息捕捉能力。

逻辑链

这些子解法构成一个网络式的逻辑链,其中每个子解法相互支持,共同解决小型医疗对象识别和分割的问题:

  • 蒙特卡洛注意力 提供了跨尺度的特征识别能力。
  • 跨尺度特征引导 利用高分辨率特征强化后续学习。
  • 尺度变化注意力 进一步增强跨尺度特征的全局依赖处理。
  • 与视觉变换器结合的卷积 结合局部与全局特征学习,确保详细和全面的对象分割。

这种方法能够显著提高对医学图像中小型和超小型对象的分割精度,对提早发现和诊断疾病至关重要。

在这里插入图片描述
这张图展示了在不同数据集(ATLAS、KiTS23和SpermHealth)中对各种医学对象(如肿瘤、囊肿和精子)的分割结果。

这些示例反映了不同模型在处理超小对象、小对象和超过10%面积的对象时的效果:

  • (a) 输入图像:原始医学扫描图。
  • (b) 地面真实情况(Ground Truth):用不同颜色标记的医学对象,例如绿色代表肝脏,红色代表肿瘤。
  • © HRNet的预测结果。
  • (d) TransNetR的预测结果。
  • (e) SvANet的预测结果(即本文提出的方法)。

图中显示SvANet在定位和识别医学对象方面通常比其他方法更为准确和详细,特别是在细节和边界的识别上。

视网膜血管分割:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1923571.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微博图片下载助手

开发的一款「微博图片下载助手」支持一键保存用户图片 / 原图保存 / 支持保存 live 动图,支持免登录,但是不支持去水印哦。另外软件是易语言编写的,一些杀毒软件可能会误报。 链接: https://pan.baidu.com/s/1ZwDuuS2AF0-nxGgYYPve_g?pwdwn…

LLM大模型从入门到精通(3)--LLM主流大模型类别

目录 1 ChatGLM-6B模型简介: 2 LLaMA模型简介: 3 BLOOM模型简介 4 Baichuan-7B模型 随着ChatGPT迅速火爆,引发了大模型的时代变革,国内外各大公司也快速跟进生成式AI市场,近百款大模型发布及应用。开源语言大模型种…

centos部署jar包

第一步: 将IDEA中的项目打包为jar,将这个jar文件放到centos服务器上的目录里,我在opt新建api目录,将jar文件放入,如下图: 第二步: 将需要读取的配置文件也放入此目录(其他目录也可以,和脚本中…

python:在同一视窗中画出三个函数的图形

编写 function_3.py 如下 # -*- coding: utf-8 -*- """ 在同一视窗中画出三个函数的图形 """ import numpy as np from matplotlib import pyplot as plt# 用于正常显示中文标题,负号 plt.rcParams[font.sans-serif] [SimHei] plt…

TypeError: Rule.__init__() got an unexpected keyword argument ‘method‘报错的解法

报错如图: 原代码: app.route(/query,method[get,post]) 解决办法很简单,method后加s app.route(/query,methods[get,post]) 重新执行代码,不报错了

Leetcode104.求二叉树的最大深度

题目描述 递归法 class Solution {public int maxDepth(TreeNode root) {if (root null) { //帮助下面的else语句判空return 0;} else {int leftHeight maxDepth(root.left);int rightHeight maxDepth(root.right);/*** 要注意的点* 1. 这个return是写在else语句里面的&am…

西邮计科嵌入式复习

西邮嵌入式复习 一、第一章复习二、第二章复习三、第三章复习四、第四章复习 一、第一章复习 二、第二章复习 三、第三章复习 四、第四章复习

MYSQL的面试题

目录 一.数据库的约束类型 一.创建数据库、修改数据库名、修改表名,修改列名、修改某个属性的语法 三.索引的类型、优缺点以及使用场景 四.索引的常见的索引数据结构 五.数据库中常用的锁 六.事务的四大特性 七.什么是脏读?幻读?不可重…

知识图谱研究综述笔记

推荐导读:知识图谱Knowledge Graph Embeddings 论文标题:A Survey on Knowledge Graphs:Representation, Acquisition and Applications发表期刊:IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021本文作者:Shaoxiong Ji, Shirui Pan, M…

PDF公式转Latex

记录一下,找到两个PDF公式转Latex的开源项目和一个数据集 数据集 UniMER 介绍 UniMER数据集是一个专为推动数学表达式识别(MER)领域进步而精心策划的专业集合。它包括全面的UniMER-1M训练集,该训练集包含超过一百万个实例&…

Golang操作ES全系列(olivere curl操作es)

Golang操作ES全系列(olivere & curl操作es) 🚀全部代码(欢迎👏🏻star): https://github.com/ziyifast/ziyifast-code_instruction/tree/main/go-demo/go-es 1 olivere 创建clie…

一 GD32 MCU 开发环境搭建

GD32 系列为通用型 MCU ,所以开发环境也可以使用通用型的 IDE ,目前使用较多的是 KEIL、 IAR 、 GCC 和 Embedded Builder ,客户可以根据个人喜好来选择相应的开发环境。 目录 1、使用 Keil 开发 GD32 目前市面通用的MDK for ARM版本有Kei…

Java代码初始化块

目录 实例域代码块 静态域代码块 初始化代码块分为静态域代码块和实例域代码块,静态域代码块在类第一次被加载时被执行,实例域代码块在创建对象时被执行,一个类中可以有多个代码块。 实例域代码块 使用方法 可以有输出语句 可以对类的属…

02. Hibernate 初体验之持久化对象

1. 前言 本节课程让我们一起体验 Hibernate 的魅力!编写第一个基于 Hibernate 的实例程序。 在本节课程中,你将学到 : Hibernate 的版本发展史;持久化对象的特点。 为了更好地讲解这个内容,这个初体验案例分上下 2…

自学第十六天----深入理解函数中

4. 函数的调用: 4.1 传值调用 函数的形参和实参分别占有不同内存块,对形参的修改不会影响实参。 4.2 传址调用 传址调用是把函数外部创建变量的内存地址传递给函数参数的一种调用函数的方式。 这种传参方式可以让函数和函数外边的变量建立起真正的联系&…

在 vite+vue3+electron 中使用 express

文章目录 一、Vite Vue3 Electron 项目的搭建二、搭建 express 环境1、安装 express 框架所需依赖2、创建 express 项目3、配置路由4、启动 express 服务5、启动 electron 并获取数据 三、项目打包 一、Vite Vue3 Electron 项目的搭建 详细的项目构建和打包可参考另一篇文…

【第32章】MyBatis-Plus之代码生成器配置

文章目录 前言一、概述1.特点说明2.示例配置3. 数据库配置 (DataSourceConfig) 二、全局配置 (GlobalConfig)1.方法说明2.示例配置 三、包配置 (PackageConfig)1. 方法说明2. 示例配置 四、模板配置 (TemplateConfig)1. 方法说明2. 示例配置 五、注入配置 (InjectionConfig)1. …

第三期书生大模型实战营之Python前置知识

闯关任务1 请实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。 算法流程 1. 去除标点:使用string.punctuation和str.translate去除文本中的标点符号。 2. 转换…

制造业ERP源码 ERP系统源码 ERP小程序源码

制造业ERP源码 ERP系统源码 ERP小程序源码 资料: 委外工厂管理 客户列表 车间管理 供应商管理 账户管理 商品管理 仓库管理 职员管理 自取地址管理 司机管理 辅助资料 客户等级 供应商分类 客户分类 商品分类 支出类别管理 收入类别管…

第一次构建一个对话机器人流程解析(一)

1.问答机器人的组成 1.1 问答机器人的组成结构图 2. 问答机器人的组成-机器人的个人属性 所谓的机器人一般具备有个人的属性,这些属性固定,形成了机器人的个人偏好 在实现过程中,此处使用一个xml配置文件,配置了机器人的个人年…