文献速递:基于SAM的医学图像分割---在医学图像中进行任何分割

news2024/11/22 5:46:01

Title 

题目

Segment anything in medical images

在医学图像中进行任何分割

01

文献速递介绍

医学图像分割是临床实践中的关键组成部分,它促进了准确的诊断、治疗计划和疾病监测。

然而,现有的方法通常是针对特定的模态或疾病类型定制的,缺乏在医学图像分割任务的多样性谱系中的普遍适用性。在这里,我们介绍了MedSAM,这是一个旨在桥接这一差距的基础模型,通过使通用医学图像分割成为可能。该模型是在一个大规模的医学图像数据集上开发的,包含1,570,263个图像-掩码对,涵盖10种成像模态和30多种癌症类型。

我们在86个内部验证任务和60个外部验证任务上进行了全面评估,证明了该模型比模态专家模型具有更好的准确性和鲁棒性。通过在广泛的任务谱系中提供准确和高效的分割,MedSAM具有加速诊断工具发展和治疗计划个性化的重大潜力。

分割是医学成像分析中的一项基本任务,它涉及识别和勾画出各种医学图像中的感兴趣区域(ROI),例如器官、病变和组织。准确的分割对于许多临床应用至关重要,包括疾病诊断、治疗计划制定以及监测疾病进展。长期以来,手工分割一直是勾画解剖结构和病理区域的金标准,但这一过程耗时、劳动强度大,通常还需要高度的专业知识。半自动或全自动的分割方法可以显著减少所需的时间和劳动力,提高一致性,并使得大规模数据集的分析成为可能。

基于深度学习的模型在医学图像分割中显示出巨大的潜力,这归因于它们学习复杂图像特征和在多样化任务范围内提供准确分割结果的能力,从分割特定解剖结构到识别病理区域。然而,许多当前医学图像分割模型的一个显著限制是它们的任务特定性。这些模型通常被设计和训练用于特定的分割任务,当应用于新任务或不同类型的成像数据时,它们的性能可能会显著下降。这种缺乏通用性在临床实践中的广泛应用中构成了一个重大障碍。与此相反,自然图像分割领域的最近进展见证了分割基础模型的出现,如segment anything model(SAM)和Segment Everything Everywhere with Multi-modal prompts all at once,展示了在各种分割任务中的非凡多样性和性能。

METHOD

方法

Dataset curation and pre-processing

 We curated a comprehensive dataset by collating images from publicly available medical image segmentation datasets, which were obtained from various sources across the internet, including the Cancer Imaging Archive (TCIA)34, Kaggle, Grand-Challenge, Scientific Data, CodaLab, and segmentation challenges in the Medical Image Computing and Computer Assisted Intervention Society (MICCAI). All the datasets provided segmentation annotations by human experts, which have been widely used in existing literature (Supplementary Table 1–4). We incorporated these annotations directly for both model development and validation. The original 3D datasets consisted of computed tomography (CT) and magnetic resonance (MR) images in DICOM, nrrd, or mhd formats.To ensure uniformity and compatibility with developing medical image deep learning models, we converted the images to the widely used NifTI format. Additionally, grayscale images (such as X-Ray and Ultrasound) as well as RGB images (including endoscopy, dermoscopy, fundus, and pathology images), were converted to the png format.

数据集策划和预处理

我们通过汇总公开可用的医学图像分割数据集中的图像,策划了一个全面的数据集,这些数据集从互联网上的各种来源获得,包括癌症影像档案(TCIA)、Kaggle、Grand-Challenge、Scientific Data、CodaLab以及医学图像计算和计算机辅助干预学会(MICCAI)的分割挑战。所有数据集都提供了人类专家的分割注释,这些注释在现有文献中已被广泛使用(补充表1-4)。我们直接将这些注释用于模型开发和验证。

原始的3D数据集由计算机断层扫描(CT)和磁共振(MR)图像组成,这些图像以DICOM、nrrd或mhd格式存在。为了确保与正在开发的医学图像深度学习模型的统一性和兼容性,我们将图像转换为广泛使用的NifTI格式。此外,灰度图像(如X射线和超声)以及RGB图像(包括内窥镜、皮肤镜、眼底和病理图像)被转换为png格式。

Results

结果

MedSAM: a foundation model for promptable medical image segmentation MedSAM aims to fulfill the role of a foundation model for universal medical image segmentation. A crucial aspect of constructing such a model is the capacity to accommodate a wide range of variations in imaging conditions, anatomical structures, and pathological condi tions. To address this challenge, we curated a diverse and large-scale medical image segmentation dataset with 1,570,263 medical image mask pairs, covering 10 imaging modalities, over 30 cancer types, and a multitude of imaging protocols (Fig. 1 and Supplementary Tables 1–4). This large-scale dataset allows MedSAM to learn a rich representation of medical images, capturing a broad spectrum of anatomies and lesions across different modalities. Figure 2a provides an overview of the distribution of images across different medical imaging modalities in the dataset, ranked by their total numbers. It is evident that computed tomography (CT), magnetic resonance ima ging (MRI), and endoscopy are the dominant modalities, reflecting their ubiquity in clinical practice. CT and MRI images provide detailed cross-sectional views of 3D body structures, making them indis pensable for non-invasive diagnostic imaging. Endoscopy, albeit more invasive, enables direct visual inspection of organ interiors, proving invaluable for diagnosing gastrointestinal and urological conditions. Despite the prevalence of these modalities, others such as ultrasound, pathology, fundus, dermoscopy, mammography, and optical coher ence tomography (OCT) also hold significant roles in clinical practice. The diversity of these modalities and their corresponding segmenta tion targets underscores the necessity for universal and effective segmentation models capable of handling the unique characteristics

associated with each modality.

MedSAM:一个用于可提示医学图像分割的基础模型

MedSAM 旨在充当通用医学图像分割的基础模型。构建这样一个模型的一个关键方面是能够适应成像条件、解剖结构和病理条件的广泛变化。为了应对这一挑战,我们策划了一个多样化且大规模的医学图像分割数据集,包含1,570,263个医学图像掩码对,涵盖10种成像模态、30多种癌症类型和众多成像协议(见图1及补充表1-4)。这个大规模数据集使MedSAM能够学习医学图像的丰富表示,捕捉不同模态下解剖结构和病变的广阔谱系。图2a提供了数据集中不同医学成像模态图像分布的概览,按照其总数进行排名。显然,计算机断层扫描(CT)、磁共振成像(MRI)和内窥镜是主导模态,反映了它们在临床实践中的普遍存在。CT和MRI图像提供了3D身体结构的详细横截面视图,使其成为非侵入性诊断成像不可或缺的部分。虽然内窥镜更具侵入性,但它能直接视察器官内部,对于诊断胃肠和泌尿系统疾病至关重要。

尽管这些模态很普遍,超声、病理、眼底、皮肤镜、乳腺X光和光学相干断层扫描(OCT)等其他模态在临床实践中也扮演着重要角色。这些模态的多样性及其相应的分割目标凸显了需要通用且有效的分割模型,这些模型能够处理与每种模态相关的独特特性的必要性。

Fig

图片

Fig. 1 | MedSAM is trained on a large-scale dataset that can handle diverse segmentation tasks. The dataset covers a variety of anatomical structures, pathological conditions, and medical imaging modalities. The magenta contours and mask overlays denote the expert annotations and MedSAM segmentation results, respectively.

图1 | MedSAM训练于一个大规模数据集,能够处理多样化的分割任务。该数据集涵盖了各种解剖结构、病理条件和医学成像模态。品红色轮廓和掩膜覆盖层分别代表专家标注和MedSAM分割结果。

图片

Fig. 2 | Overview of the modality distribution in the dataset and the network architecture. a The number of medical image-mask pairs in each modality. b MedSAM is a promptable segmentation method where users can use bounding boxes to specify the segmentation targets. Source data are provided as a Source Data file.

图2 | 数据集中模态分布的概览及网络架构。a 每种模态中医学图像-掩码对的数量。b MedSAM是一种可提示的分割方法,用户可以使用边界框来指定分割目标。源数据以源数据文件形式提供。

图片

Fig. 3 | Quantitative and qualitative evaluation results on the internal validation set. a Performance distribution of 86 internal validation tasks in terms of median dice similarity coefficient (DSC) score. The center line within the box represents the median value, with the bottom and top bounds of the box deli neating the 25th and 75th percentiles, respectively. Whiskers are chosen to show the 1.5 of the interquartile range. Up-triangles denote the minima and down triangles denote the maxima. b Podium plots for visualizing the performance correspondence of 86 internal validation tasks. Upper part: each colored dot denotes the median DSC achieved with the respective method on one task. Dots corresponding to identical tasks are connected by a line. Lower part: bar charts represent the frequency of achieved ranks for each method. MedSAM ranks in the first place on most tasks. c Visualized segmentation examples on the internal validation set. The four examples are liver cancer, brain cancer, breast cancer, and polyp in computed tomography (CT), (Magnetic Resonance Imaging) MRI, ultra sound, and endoscopy images, respectively. Blue: bounding box prompts; Yellow: segmentation results. Magenta: expert annotations. Source data are provided as a Source Data file.

图3 | 内部验证集上的定量和定性评估结果。a 86个内部验证任务的性能分布,以中位数Dice相似系数(DSC)得分表示。盒图中的中心线代表中位值,盒子的底部和顶部边界分别界定了第25和第75百分位数。须表示为四分位数范围的1.5倍。向上的三角形表示最小值,向下的三角形表示最大值。b 颁奖台图,用于可视化86个内部验证任务的性能对应关系。上部:每个彩色点表示一项任务上使用相应方法所达到的中位DSC。相同任务对应的点通过线连接。下部:条形图代表每种方法达到的排名频率。MedSAM在大多数任务上排名第一。c 内部验证集上的可视化分割示例。四个示例分别是在计算机断层扫描(CT)、磁共振成像(MRI)、超声和内窥镜图像中的肝癌、脑癌、乳腺癌和息肉。蓝色:边界框提示;黄色:分割结果。品红色:专家标注。源数据以源数据文件形式提供。

图片

Fig. 4 | Quantitative and qualitative evaluation results on the external validation set. a Performance distribution of 60 external validation tasks in terms of median dice similarity coefficient (DSC) score. The center line within the box represents the median value, with the bottom and top bounds of the box deli neating the 25th and 75th percentiles, respectively. Whiskers are chosen to show the 1.5 of the interquartile range. Up-triangles denote the minima and down triangles denote the maxima. b Podium plots for visualizing the performance correspondence of 60 external validation tasks. Upper part: each colored dot denotes the median DSC achieved with the respective method on one task. Dots corresponding to identical tasks are connected by a line. Lower part: bar charts represent the frequency of achieved ranks for each method. MedSAM ranks in the first place on most tasks. c Visualized segmentation examples on the external validation set. The four examples are the lymph node, cervical cancer, fetal head, and polyp in CT, MR, ultrasound, and endoscopy images, respectively. Source data are provided as a Source Data file.

图4 | 外部验证集上的定量和定性评估结果。a 60个外部验证任务的性能分布,以中位数Dice相似系数(DSC)得分表示。盒图中的中心线代表中位值,盒子的底部和顶部边界分别界定了第25和第75百分位数。须表示为四分位数范围的1.5倍。向上的三角形表示最小值,向下的三角形表示最大值。b 颁奖台图,用于可视化60个外部验证任务的性能对应关系。上部:每个彩色点表示一项任务上使用相应方法所达到的中位DSC。相同任务对应的点通过线连接。下部:条形图代表每种方法达到的排名频率。MedSAM在大多数任务上排名第一。c 外部验证集上的可视化分割示例。四个示例分别是在CT、MR、超声和内窥镜图像中的淋巴结、宫颈癌、胎儿头部和息肉。源数据以源数据文件形式提供。

图片

Fig. 5 | The effect of training dataset size and a user study of tumor annotation efficiency. a Scaling up the training image size to one million can significantly improve the model performance on both internal and external validation sets. b MedSAM can be used to substantially reduce the annotation time cost. Source data are provided as a Source Data file.

图5 | 训练数据集大小的影响及肿瘤标注效率的用户研究。a 将训练图像数量扩大到一百万可以显著提高模型在内部和外部验证集上的性能。b MedSAM可用于大幅减少标注时间成本。源数据以源数据文件形式提供。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1551392.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

穿越迷茫,寻找心中的灯塔

在人生的旅途中,我们有时会陷入一片迷茫的迷雾之中,不知道前方的路该如何走,每天似乎都在忙碌,却又感觉自己在假努力,仿佛一切都没有意义,没有目标。然而,正是这样的时刻,我们更需要…

16、OpenFeign和Sentinel集成实现fallback服务降级

注:本篇文章主要参考周阳老师讲解的cloud进行整理的! 1、需求说明 cloudalibaba-consumer-nacos-order83 通过OpenFeign调用 cloudalibaba-provider-payment9001 1、 83 通过OpenFeign调用 9001微服务,正常访问OK 2、 83 通过OpenFeign调用 …

zabbix监控vmware esxi

一、zabbix服务端配置 修改zabbix_server.conf配置文件 vim /etc/zabbix/zabbix_server.conf #######zabbix_server.conf底部第二行开始添加下面配置######## StartVMwareCollectors5 #StartVMwareCollectors - 预先启动Vmware collector收集器实例的数量。此值取决于要监控的…

阿里云CentOS7安装Hadoop3伪分布式

ECS准备 开通阿里云ECS 略 控制台设置密码 连接ECS 远程连接工具连接阿里云ECS实例,这里远程连接工具使用xshell 根据提示接受密钥 根据提示写用户名和密码 用户名:root 密码:在控制台设置的密码 修改主机名 将主机名从localhost改为需要…

react+vite+antD+reduce+echarts项目完整记录

reactviteantDreduceecharts项目完整记录 之前写前端项目,都是用的vue,从最开始的vue2到后来的vue3,断断续续写了3年,打包工具也从webpack转到了vite,全局数据管理工具从vuex转到了pinia。总体而言,vue3对…

msvcp100.dll是什么东西?电脑msvcp100.dll丢失的六种解决方法

最近,我在电脑上打开一款软件时,遇到了一个问题:找不到msvcp100.dll丢失问题,为了解决这个问题,我进行了深入的学习和研究,并在此分享msvcp100.dll丢失的解决方法。 一,msvcp100.dll是什么&…

机器学习:探索数据中的模式与智能

文章目录 导言介绍:机器学习的定义和重要性发展历程:从概念到现实应用 基础概念机器学习的基本原理监督学习、无监督学习和强化学习的区别与应用1.监督学习2.无监督学习3.强化学习 常见的机器学习任务和应用领域 结语 导言 当代科技领域中最为引人注目的…

HCIP的学习(6)

OSPF—开放式最短路径优先协议 动态路由的评判标准 1、占用资源 2、收敛速度 3、选路动态路由分类: IGP---内部网关协议DV型---距离矢量型---RIPLS型---链路状态型---OSPFEGP---外部网关协议OSPF---无类别的路由协议(携带真实掩码)组播224.0…

【C++初阶】之类和对象(下)

【C初阶】之类和对象(下) ✍ 再谈构造函数🏄 初始化列表的引入💘 初始化列表的语法💘 初始化列表初始化元素的顺序 🏄 explicit关键字 ✍ Static成员🏄 C语言中的静态变量🏄 C中的静…

Python入门练习 - 学生管理系统

Python 实现读书管理系统 """ 实现一个命令行版的读书管理系统 """ import os.path import sys# 使用这个全局变量,来管理所有的学生信息 # 这个列表的每个元素都是一个‘字典’,每 个 字典就分别表示了一个同学students …

STM32硬件I2C通信外设

文章目录 前言I2C硬件介绍10 位地址模式硬件I2C的引脚定义I2C框图主机发送序列图主机接收序列图 硬件I2C读写MPU6050总结 前言 本文主要介绍stm32自带的I2C通信外设,对比与软件模拟I2C,硬件I2C可以自动生成时序,时序的操作更加及时规范&…

【面试经典150 | 动态规划】三角形最小路径和

文章目录 写在前面Tag题目来源解题思路方法一:动态规划 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法,两到三天更新一篇文章,欢迎催更…… 专栏内容以分析题目为主,并附带一些对于本题涉及到的数据结构等内容进行…

7、鸿蒙学习-共享包概述

HarmonyOS提供了两种共享包,HAR(Harmony Archive)静态共享包,和HSP(Harmony Shared Package)动态共享包。 HAR与HSR都是为了实现代码和资源的共享,都可以包含代码、C库、资源和配置文件&#xf…

UI设计案例,B端后台界面设计教程

B端产品是为“组织”提供服务,以业务为中心,追求时效性,在视觉上,内容为王,视觉为功能让步,追求简洁、清晰、克制、理性的视觉风格。B 端产品业务比较复杂,页面内容也会较多,B端界面…

亲历中国智驾大战,吴新宙加入NVIDIA半年后首秀

‍作者 |张祥威 编辑 |德新 吴新宙近日现身NVIDIA GTC,这是其从小鹏汽车离开加入NVIDIA之后的首次公开亮相。 吴目前担任NVIDIA汽车事业部副总裁,全面负责NVIDIA的车载计算产品线DRIVE平台的产品定义以及工程落地工作。吴新宙最广为人知的经历&#xf…

ES学习日记(三)-------第三方插件选择

前言 在学习和使用Elasticsearch的过程中,必不可少需要通过一些工具查看es的运行状态以及数据。如果都是通过rest请求,未免太过麻烦,而且也不够人性化。 目前我了解的比较主流的插件就三个,head,cerebor和elasticHD 1.head 老牌插件,功能…

聊聊低代码产品的应用场景

随着数字化转型的不断深入,企业对于快速开发和迭代软件应用的需求也越来越迫切。而在这样的背景下,低代码产品应运而生,成为了一种热门的技术解决方案。本文将解读低代码产品的定义并探讨其应用场景。 一、低代码产品的定义 低代码产品是一种…

白帽工具箱:在windows上安装部署渗透测试演练系统DVWA

🌟🌌 欢迎来到知识与创意的殿堂 — 远见阁小民的世界!🚀 🌟🧭 在这里,我们一起探索技术的奥秘,一起在知识的海洋中遨游。 🌟🧭 在这里,每个错误都…

Element

1、Element 基本使用 1.1、Element介绍 Element:网站快速成型工具。是饿了么公司前端开发团队提供的一套基于Vue的网站组件库。 使用Element前提必须要有Vue。 组件:组成网页的部件,例如超链接、按钮、图片、表格等等~ Element官网&#…

Java的IDEA的工程管理

模块和包的图标: 举个例子: IDEA中创建包: 如图所示,com.LBJ的意思是在com包中创建子包LBJ 参见: IDEA中项目、模块和包的关系_idea中模块和项目-CSDN博客