医学图像分割论文:Learnable Ophthalmology SAM

news2024/9/24 11:30:48

文章目录

  • 0. Abstract
  • 1. Introduction
  • 2. Learnable Ophthalmology(眼科学) SAM
    • 2.1 Preliminaries(预先)
    • 2.2 Learnable Prompt Layer
  • 3. Experiment
    • 3.1 Datasets
    • 3.2 Evaluation Metrics(指标)
    • 3.3 Implement Details
    • 3.4 Experimental Results
    • 3.5 Generalization
  • 4. Discussion
  • 5. Conclusions
  • 6. Fund
  • Reference

粗略记录,代码解析敬请期待。

在这里插入图片描述

0. Abstract

分割是眼科图像分析的关键。但其模态图像的多样性阻碍了大多数现有分割算法的应用,因为它们依赖于基于大量标签的训练或泛化能力较弱。在此基础上,提出了一种简单有效的适合于眼科多模态图像多目标分割的可学习提示层,命名为可学习的眼科多模态图像分割提示层(SAM)。可学习提示层从每个变压器层学习医学先验知识。在训练过程中,我们只对提示层和任务头进行一次训练。我们通过基于9个公开可用数据集的4个医学分割任务证明了我们思想的有效性。此外,我们只是为现有的基本CV模型在医学领域的应用提供了一种新的改进思路。我们的代码可在网站上找到。

1. Introduction

分割对眼科诊断和治疗至关重要。眼科拥有10多种影像学检查[1]。多模态图像之间的差异带来了不同的分割目标,例如彩色眼底的血管和光学相干断层扫描(OCT)的视网膜层,这阻碍了单一模型在眼科中的应用,因为现有的分割算法大多依赖于专家标记或泛化能力较弱。

在这里插入图片描述
用基本CV模型和本文的算法提取血管和病变的例子

Segment Anything (SAM)[2]、DINOv2[3]等几个基本的CV模型在本月发布,它们是在大型视觉语料库上训练的基于Vit的大型模型。它们都在各种自然场景中证明了有前途的分割能力。但它们不能从医学图像中分割血管或病变,分割血管或病变有助于医生的诊断或治疗方案。如图1所示,DINOv2不能提供来自视网膜彩色眼底或光学相干断层血管造影(OCTA)的血管。SAM可以从OCTA图像中找到若干血管,但不能从彩色眼底分割血管或病变。可能的原因是血管或病变与视网膜之间的边缘差异不明显。对于视网膜光学相干断层扫描(OCT)图像,SAM不产生层信息,而是作为一个整体考虑。因此,SAM不能直接应用到我们的医学图像分割中。

由于这些基础CV模型具有计算机视觉基础模型的巨大潜力,作者相信它们对医学领域也有帮助[4,5]。然而,它们的掩膜分割预测在医学领域还没有得到充分的探索。作者分析了大量的分割结果,发现在边缘差异明显的情况下,SAM和DINOv2的分割结果是可以接受的。然而,血管或病变可能不够明显而无法识别。上述两种模型的特征提取能力已经被其他一些计算机视觉任务所证实[6,7]。从有效性和效率的角度来看,如何将这种基础模型应用于医学图像分割?

模型微调通常用于在大规模基准测试中使用这样的基础模型。在医学领域,对整个网络的参数进行全调优或仅对模型的头部进行头部调优都无法提供可用的结果。近年来,提示调优在自然语言处理[8]和自然图像处理[9]中取得了相当大的成果,其定义是将提示作为特定于任务的连续向量,在微调过程中直接通过梯度对其进行优化[10]。例如,SAM中使用的稀疏(点、框、文本)和密集(掩码)两组提示符,在医学领域,尤其是血管领域,无法提供准确的分割结果。因此,在本文中,作者提出了一种新的可学习的SAM提示,它可以准确地指定医学图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1906181.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【JavaWeb程序设计】JSP访问数据库(二)

目录 一、编写一个网页,实现根据输入学生姓名的模糊查询,如果查找不到就显示“查无此人” 1. 运行截图 2. 建表 3. JSP页面主要代码(inquire.jsp) 4. Bean实体类 5. DAO层 6. Service层(模糊查询) …

展厅AI数字人:实现智慧园区与数字孪生的高效交互展示

随着人工智能技术的飞速发展,智慧园区和数字孪生技术已经成为展厅管理和规划的重要工具,展厅AI数字人可以提供沉浸式的展览体验。 展厅大屏幕支持与AI数字人连接,用户可以直接通过语音交互的形式操作大屏幕显示的内容,实现对大屏…

ELFK 8.12.2 部署 -- docker部署方式⚽

👨‍🎓博主简介 🏅CSDN博客专家   🏅云计算领域优质创作者   🏅华为云开发者社区专家博主   🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入&#xff01…

Mysql系列-Binlog主从同步

原文链接:https://zhuanlan.zhihu.com/p/669450627 一、主从同步概述 mysql主从同步,即MySQL Replication,可以实现将数据从一台数据库服务器同步到多台数据库服务器。MySQL数据库自带主 从同步功能,经过配置,可以实现基于库、表…

如何降低亚马逊测评风险?掌握这些技巧就够了!

无论是初涉亚马逊测评领域的新手还是经验丰富的老手,都不可避免地会面临各种风险挑战。为了将这些风险降至最低,我们需掌握一系列高效且安全的测评策略。以下是一些关键的亚马逊测评技巧与策略: 亚马逊测评优化策略 1. 真实购买与国外账号&a…

​学习笔记——动态路由——IS-IS中间系统到中间系统(报文/TLV)​

五、IS-IS报文 1、IS-IS报文格式 IS-IS报文是直接封装在数据链路层的帧结构中的。 PDU(Protocol Data Unit,协议数据单元): 报文头(IS-IS Header) 变长字段(Variable Length Fields )。 IS-IS Header: 通用头部(PDU Common Header) 专用头部(PDU Specific H…

javaIO流(2)

一.字符流 字符流对数据的操作是以一个个字符为单位的,字符流只能读文本文件,并将读到的字节按照编码表转为对应的字符,Reader和Writer是字符流的两个最大的抽象类,InputStreamReader和OutputStreamWriter分别继承了Reader和Writer,它俩的功能就是将读取到的字节转换为字符,所…

实验代码结构介绍

提高模型复用性,让模型对应的配置更加清晰,代码书写条理 学习自https://zhuanlan.zhihu.com/p/409662511 Project ├── checkpoints # 存放模型 ├── data # 定义各种用于训练测试的数据集 ├── eval.py # 测试代码 ├── loss.py # 定义的…

CSS 后代选择器正确写法 爸爸儿子之间有代沟

CSS 后代选择器正确写法 爸爸儿子之间有代沟 example&#xff1a; > <body> > <div class"outer"> > <span class"inner"></span> > </div> > </body> > <head> > <style>…

如何选择快手矩阵源码:关键因素解析

在短视频行业迅速发展的今天&#xff0c;快手平台已成为众多内容创作者和企业的重要阵地。为了有效管理和运营多个快手账号&#xff0c;快手矩阵源码成为了一个关键工具。然而&#xff0c;市场上的快手矩阵源码种类繁多&#xff0c;选择一个合适的源码并非易事。本文将探讨选择…

【QT】多元素控件

多元素控件 多元素控件1. List Widget2. Table Widget3. Tree Widget 多元素控件 Qt 中提供的多元素控件有: QListWidgetQListViewQTableWidgetQTableViewQTreeWidgetQTreeView xxWidget 和 xxView 之间的区别&#xff0c;以 QTableWidget 和 QTableView 为例&#xff1a; …

WPS提示打印机异常,但是任然可以打印

故障现象 使用WPS在打印预览页时&#xff0c;打印机有小橙点提示&#xff0c;点击打印时会报错&#xff0c;提示&#xff1a; 打印机异常&#xff0c;打印机状态出现异常&#xff0c;请检查打印机是否开机并且联机 但是点击确定后&#xff0c;可以继续打印&#xff0c;而且其他…

企业微信hook接口协议,聊天标签中的联系人变动通知

聊天标签中的联系人变动通知 返回示例 {"send_time":1699256104,"flag":0,"receiver":0,"sender":10014,"referid":0,"sender_name":"","app_info":"0FUGGXUfQ0G7nPh","rea…

收藏!2024年程序员的实用神器_new relic idea

前言 Chat GPT的升级节奏让人们越来越惊讶的同时&#xff0c;也让大家感觉到了压力&#xff0c;在如此快节奏的互联网世界中&#xff0c;开发人员需要不断学习与更新知识&#xff0c;保持领先地位并高效地交付高质量软件。 无论是集成开发环境 (IDE)、版本控制系统、测试工具…

“除了C盘都不见了“:现象解析、恢复策略与预防之道

现象概述&#xff1a;非系统盘突然消失之谜 在日常的计算机使用中&#xff0c;不少用户可能遭遇过一个令人措手不及的问题——“除了C盘都不见了”。这一现象发生时&#xff0c;用户惊讶地发现除了作为系统盘的C盘外&#xff0c;原本存放着各类文档、图片、视频等个人资料的D盘…

得帆荣获中国信通院低代码标准参编专家认证和低代码白皮书参编单位认可

2024年6月26日&#xff0c;由中国通信标准化协会主办&#xff0c;中国通信标准化协会云计算标准和开源推进委员会承办的2024低代码无代码产业大会在北京召开&#xff0c;大会以“智融低无码&#xff0c;模创新未来”为主题&#xff0c;发布领域研究成果&#xff0c;交流行业前沿…

使用dd命令简单测试磁盘I/O

本文所有测试使用的均是Oracle公有云OCI上的计算实例的启动盘。 第1轮测试使用的是默认的启动盘参数。第2轮测试使用的是自动调整的启动盘参数&#xff08;如下图&#xff09;&#xff0c;性能更高。 第1轮测试 顺序I/O 运行以下命令5次&#xff0c;dsync表示不使用cache&…

【MySQL05】【 undo 日志】

文章目录 一、前言二、undo 日志&#xff08;回滚日志&#xff09;1. 事务 id2. undo 日志格式2.1 INSERT 对应的 undo 日志2.2 DELETE 对应的 undo 日志2.3 UPDATE 对应的 undo 日志2.3.1 不更新主键2.3.2 更新主键 2.3 增删改操作对二级索引的影响2.4 roll_pointer 3. FIL_PA…

合合信息大模型“加速器”重磅上线

大模型技术的发展和应用&#xff0c;预示着更加智能化、个性化未来的到来。如果将大模型比喻为正在疾驰的科技列车&#xff0c;语料便是珍贵的“燃料”。本次世界人工智能大会期间&#xff0c;合合信息为大模型打造的“加速器”解决方案备受关注。 在大模型训练的上游阶段&…

FPGA问题

fpga 问题 第一道坎&#xff0c;安装软件&#xff1b;没有注册&#xff0c;无法产生sop文件&#xff0c;无法下载 没有相应的库的quartus ii版本&#xff0c;需要另下载 第二道坎&#xff0c;模拟器的下载&#xff0c;安装&#xff1b; 第三道&#xff0c;verilog 语法&#x…