【计算机视觉 | 图像分割】通用AI大模型Segment Anything在医学影像分割的性能究竟如何?

news2025/1/11 18:50:43

最近看到了一篇论文:

在这里插入图片描述
论文地址为:

https://arxiv.org/pdf/2304.14660.pdf

这篇文章用来探究最近大火的大模型SA在医学图像上的效果。

文章目录

  • 一、前言
  • 二、数据集展示
  • 三、方法展示
  • 四、结果分析

一、前言

近半年来,ChatGPT、DALL·E等引发了大规模基础AI模型的狂潮。4月初,Meta AI 发布第一个用于图像分割的大规模基础模型Segment Anything Model (SAM)。

SAM最大的亮点是它对未知的数据集和任务具有良好的零样本(zero-shot)分割性能。

分割过程可全自动(Everything模式)或由不同的手工提示(Prompt模式)驱动,例如,文字、点和方框。

在这里插入图片描述
在这里插入图片描述

虽然SAM在各种自然图像分割任务上取得了令人印象深刻的结果,但医学图像分割由于多样的成像模式、精细的解剖结构、不明确且复杂的边界以及广泛的物体尺度等而具有极大的挑战性,其在大型医学影像数据集上的表现还有待验证。

深圳大学生物医学工程学院倪东教授智能超声团队联合苏黎世联邦理工学院、深圳市人民医院、浙江大学和深圳度影医疗科技等单位整理了一个有55.3万张图像,包含16种影像模态、68种生物医学领域分割目标的超大规模医学影像分割数据集COSMOS 553K,并基于该数据集率先对SAM进行了全面、多角度、大规模的细致评估,旨在促进医学影像分析的发展,并回答一个重要问题:SAM对医学影像分割的性能究竟如何?

二、数据集展示

为了全面评估分析SAM在医学影像分割上的表现,团队收集并标准化了52个公共数据集,最终整理构建了一个包含16种影像模态和68种生物医学领域分割目标(表1)的大型医学影像分割数据集COSMOS 553K,数据集的展示见图1,统计信息见图2:

在这里插入图片描述
表1 COSMOS 553K包含的分割目标。H:头颈部;C:胸部;A:腹部;P:盆部;B:骨头;O:其它。

在这里插入图片描述
图1 COSMOS 553K涵盖了大多数医学影像模态和生物医学领域分割目标。例如,脑肿瘤、眼底血管、甲状腺结节、脊柱、肺、心脏、腹部器官或肿瘤、细胞、息肉和手术仪器等。人体图像来自Freepik,作者为brgfx(网址)

在这里插入图片描述
图2 COSMOS 553K的统计信息。(a)收集到的公开数据集处理后的数据量;(b)目标类别的直方图分布;c)影像模态的直方图分布;(d)图像分辨率的直方图分布。

三、方法展示

SAM提供不同类型的分割提示Prompt,包括点和方框等。

点的提示包括表示前景的正样本和表示背景的负样本点。

方框表示需要分割的物体的区域。

我们的测试策略包括Everything模式:自动分割 (S1H, S1B)以及Prompt模式:单个正样本点 (S2)、五个正样本点 (S3)、五个正样本点和五个负样本点 (S4)、单个方框 (S5)、单个方框和单个正样本点(S6),图3展示了我们设计的SAM测试框架。

在这里插入图片描述
图3 本研究设计的SAM详细测试框架。

四、结果分析

本研究全面地评估了SAM的各种模式在大规模、多样化的医学影像数据集上的分割性能,DICE指标评估结果如图4所示。

在这里插入图片描述
在这里插入图片描述
图4 不同测试策略的DICE箱线图。从上到下:S1H、S2、S3、S4、S5、S6。

基于实验分析,我们的主要结论如下:

  1. Everything模式不适用于大多数医学影像分割任务。在这种模式下,SAM对医学分割目标的感知能力较差,会输出大量的假阳性预测掩膜(图5)。
  2. 在Everything模式下,作为提示的网格采样点数量会在一定程度上影响分割性能,如图6所示。这是一个分割性能和测试效率的权衡。
  3. 在Prompt模式下,加入更多前景点可显著提高SAM的分割结果。但医学影像中的前景和背景很容易混淆,随机加入负样本点可能会引起分割性能下降。此外,方框提示(S5)包含丰富的物体位置信息。因此,在我们的研究中,方框提示在大多数医学分割任务中比点提示表现好。在目前的研究中,混合策略(同时加入点提示和方框提示)的性能没有明显提升。这可能与SAM对混合提示的编码能力有关。图7和图8展示了SAM在各种测试策略下的可视化结果。
  4. 分割目标的不同属性可能影响SAM对医学分割目标的感知能力。特别是,SAM可能会对具有复杂形状、小面积或低对比度的目标分割效果不好。图9展示了DICE与目标的不同属性之间的关系。

在这里插入图片描述
图5 Everything模式的可视化结果。

在这里插入图片描述
图6 Everything模式下网格采样点数量对分割性能的影响

在这里插入图片描述
图7 典型的SAM良好案例

在这里插入图片描述
图8 典型的SAM失败案例

总的来说,尽管SAM有可能成为一个通用的医学影像分割模型,但它在医学影像分割任务中的表现目前还不稳定。因此,未来的研究重点应该在如何有效地使用少量医学影像来微调SAM以提高模型的可靠性,搭建属于医学影像的Segment Anything模型。此外,拓展3D-SAM, 并探索其对三维容积数据的分割性能也是一个有趣的方向。我们希望这份报告能较为详尽地帮助读者和社区更好地了解SAM在医学影像分割中的性能优劣,并最终促进新一代医学影像分割基础大模型的发展。

真诚感谢所有公开数据集的组织者和所有者的开源贡献,我们也将筹备开源所整理的数据集,以促进领域和社区发展。同时,也非常感谢Meta AI公开发布了SAM的源代码。

源码链接:

https://github.com/facebookresearch/segment-anything

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/489582.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络安全之IPSEC

目录 VPN 分类 业务层次划分 网络层次划分 VPN的常用技术 隧道技术 IPSEC VPN IPSEC的安全服务 IPSEC的技术协议族架构 ESP AH IPSEC架构 IKE 两种工作模式 两个通信协议 密钥管理协议 两个数据库 解释域 DOI 传输模式 使用场景 封装结构 隧道模式 使用场…

Spring框架|这n篇就够了

🙈作者简介:练习时长两年半的Java up主 🙉个人主页:程序员老茶 🙊 ps:点赞👍是免费的,却可以让写博客的作者开兴好久好久😎 📚系列专栏:Java全栈,…

论文笔记——chatgpt评估+

文章目录 1. chatgpt 效果评估:Evaluating ChatGPT’s Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness文章简介文章结论 2. 事件抽取: OneEE: A One-Stage Framework for Fast Overlapping an…

DolphinScheduler海豚调度教程

DolphinScheduler 教程 (一)入门指南 简介 关于Dolphin Apache DolphinScheduler是一个分布式易扩展的可视化DAG工作流任务调度开源系统。解决数据研发ETL 错综复杂的依赖关系,不能直观监控任务健康状态等问题。DolphinScheduler以DAG流式…

MySQL知识学习06(SQL语句在MySQL中的执行过程)

1、MySQL 基本架构概览 下图是 MySQL 的一个简要架构图,从下图可以很清晰的看到用户的 SQL 语句在 MySQL 内部是如何执行的。 先简单介绍一下下图涉及的一些组件的基本作用帮助大家理解这幅图 连接器: 身份认证和权限相关(登录 MySQL 的时候)。查询缓…

mysql数据之表管理-mysql高级管理

1. #创建表tt01 #对id字段设置零填充约束、主键约束、自增长约束 #对name字段设置非空约束、默认值约束 #对cardid字段设置非空约束、唯一键约束 插入数据记录: 1)因为id字段设置了自增长,如果不指定id字段值,则默认从1开始递…

electron+vue3全家桶+vite项目搭建【17】pinia状态持久化

文章目录 引入问题演示实现效果展示、实现步骤1.封装状态初始化函数2.封装状态更新同步函数3.完整代码 引入 上一篇文章我们已经实现了electron多窗口中,pinia的状态同步,但你会发现,如果我们在一个窗口里面修改了状态,然后再打开…

第十四届蓝桥杯Python B组省赛复盘

第十四届蓝桥杯Python B组省赛复盘 文章目录 第十四届蓝桥杯Python B组省赛复盘试题 A: 2023【问题描述】(5 分)【思路】 试题 B: 硬币兑换【问题描述】【思路】 试题 C: 松散子序列【问题描述】【输入格式】【输出格式】【样例输入】【样例输出】【评测…

Python | 人脸识别系统 — 活体检测

本博客为人脸识别系统的活体检测代码解释 人脸识别系统博客汇总:人脸识别系统-博客索引 项目GitHub地址: 注意:阅读本博客前请先参考以下博客 工具安装、环境配置:人脸识别系统-简介 UI界面设计:人脸识别系统-UI界面设…

6---N字形变化

将一个给定字符串 s 根据给定的行数 numRows ,以从上往下、从左到右进行 Z 字形排列。 比如输入字符串为 "PAYPALISHIRING" 行数为 3 时,排列如下: P A H N A P L S I I G Y I R 之后,你的输出需要从左往右逐…

JavaScrpit—数据类型转换

目录 1、起 源 理 念 2、特 点 框 架 AngularJS框架 WebSocket协议 3、书 写 位 置 注 释 浏览器调试js代码 4、变量作用 全局变量 局部变量 常量 5、数据类型 数 组 严格检查数据类型 字符串 6、类型转换 字符串转数字 转bool值 能力判断 7、编码方式 …

Spring IOC相关注解运用——上篇

目录 前言 一、Component 二、Repository、Service、Controller 三、Scope 四、Autowired 五、Qualifier 六、Value 1. 直接设置固定的属性值 2. 获取配置文件中的属性值 3. 测试结果 往期专栏&文章相关导读 1. Maven系列专栏文章 2. Mybatis系列专栏文章 3.…

记录一次Linux下ChatGLM部署过程

前言 本地化的GPT就是香,就是有点费钱。 项目地址:https://github.com/THUDM/ChatGLM-6B 前期准备 服务器(本机的跳过) 由于本地电脑显卡都不行,所以我租了AutoDL的一台算力服务器。Tesla T4 16G显存,…

自供电-测力刀柄资料整理

自供电-测力刀柄资料整理 2. 相关专利2.1 实时测量铣削过程中床主轴温度装置【1】2.2 一种基于应变片的测力系统【2】 3. 相关商业化产品3.1 spike 测力刀柄【3】3.2 瑞士奇石乐(Kistler)旋转切削测力仪【4】3.3 kistler的通用型压电式切削力测量系统3.4…

SPSS如何进行聚类分析之案例实训?

文章目录 0.引言1.快速聚类分析2.分层聚类分析3.两阶段聚类分析 0.引言 因科研等多场景需要进行绘图处理,笔者对SPSS进行了学习,本文通过《SPSS统计分析从入门到精通》及其配套素材结合网上相关资料进行学习笔记总结,本文对聚类分析进行阐述。…

【软考高项笔记】第1章 信息化发展1.5 数字化转型与元宇宙

1.5 数字化转型与元宇宙 元宇宙本质上是对现实世界的虚拟化、数字化过程,需要对内容生产、经济系统、用户体验以及实体世界内容等进行大量改造1.5.1 数字化转型 新建一个富有活力的数字化商业模式 组织对业务进行彻底重新定义(大洗牌)之后才…

浅谈明日方舟游戏系统

主要玩法:敌方阵营从敌方初始点进入战斗并且沿着怪物前进路线行驶到己方保护目标。玩家可以通过部署干员守护己方保护目标,防止敌方阵营进入;当保护目标的生命值为0时,则战斗失败,任务结束。 1 干员系统 1.1 职业分支…

linux(stat-readdir-dup2)04-虚拟地址空间,stat函数,文件,目录,errno说明,dup2和dup

01 学习目标 1.掌握stat/lstat函数的使用 2.了解文件属性相关的函数使用 3.了解目录操作相关的函数的使用 4.掌握目录遍历相关函数的使用 5.掌握dup,dup2函数的使用 6.掌握fcntl函数的使用 02 虚拟地址空间 03 打开最大文件数量 openmax.c #include<stdio.h> #include&…

Redo log详解

WAL&#xff08;Write-Ahead Logging&#xff09;机制 WAL 的全称是 Write-Ahead Logging&#xff0c;中文称预写式日志(日志先行)&#xff0c;是一种数据安全写入机制。就是先写日志&#xff0c;然后再写入磁盘&#xff0c;这样既能提高性能又可以保证数据的安全性。Mysql中的…

华为MPLS跨域C2方式RR场景(数据不经过RR)实验配置

目录 配置BGP邻居的建立 配置MPLS LDP 配置RR之间的MP-BGP邻居 配置通过ASBR学习PE路由并为PE分配标签&#xff08;实现Vpnv4路由传递和数据传输&#xff09; 根据图配置接口的IP地址和IGP协议 配置BGP邻居的建立 PE1和RR1建立MP-IBGP邻居&#xff08;RR1传给PE1的Vpnv4路…