MedLSAM:定位和分割任何3D医学图像模型

news2024/11/16 13:54:39

文章目录

  • MedLSAM: Localize and Segment Anything Model for 3D Medical Images
    • 摘要
    • 本文方法
      • 模型学习过程
      • 模型推理过程
    • 实验结果

MedLSAM: Localize and Segment Anything Model for 3D Medical Images

摘要

SAM (Segment Anything Model)是近年来出现的一种具有开创性的图像分割模型。然而,原始的SAM和它的医疗适应性都需要逐片注释,这直接增加了注释工作负载和数据集的大小。我们提出MedLSAM来解决这个问题,确保无论数据集大小如何都有恒定的注释工作负载,从而简化了注释过程。
本文要点

  1. 引入了一个能够定位身体内任何目标解剖部位的几次定位框架。
  2. 开发了一个3D医学图像的本地化模型(MedLAM),利用两个自我监督任务:相对距离回归(RDR)和多尺度相似性(MSS),跨越14,012个CT扫描的综合数据集。
  3. 然后,我们通过整合MedLAM和SAM建立了一种准确分割的方法。
  4. 通过在几个模板上标注三个方向上的六个极值点,我们的模型可以在所有计划标注的数据上自主识别目标解剖区域。
  5. 这允许我们的框架为图像的每个切片生成一个2D边界框,然后由SAM利用它进行分割。我们在涵盖38个器官的两个3D数据集上进行了实验,发现MedLSAM的性能与SAM及其医学适应性相匹配,同时只需要对整个数据集进行最小的极值点注释。此外,MedLAM具有与未来3D SAM模型无缝集成的潜力,为增强性能铺平了道路
    代码地址

本文方法

在这里插入图片描述
给定任意大小的数据集,MedLSAM首先应用定位过程(MedLAM)来识别任何感兴趣的解剖区域的六个极值点(在z, x和y方向上)。这个过程的结果是生成一个3D bounding box,包围目标器官或结构。随后,对于该3D边界框内的每个切片,生成相应的2D边界框。然后利用这些二维边界框对目标解剖结构进行精确分割,从而实现整个分割过程的自动化。

模型学习过程

在这里插入图片描述
代理任务:Relative Distance Regression (RDR) and Multi Scale Similarity (MSS)
**Relative Distance Regression (RDR):**来自不同个体的3D扫描图像映射到统一的隐式3D解剖坐标系上,确保来自不同个体的相同解剖结构共享相同的坐标。因此,它允许我们在查询扫描中对与我们感兴趣的点共享相同隐式坐标的点执行初始的、粗略的定位。
**Multi Scale Similarity (MSS) :**鉴于不同个体解剖定位的内在差异,在不同图像中共享相同潜坐标的区域仍然可能对应不同的解剖结构。因此,我们需要通过从感兴趣的点提取局部像素级特征来进一步提高定位的精度。这使我们能够精确定位初始定位点附近最相似的特征,从而提高整体定位精度。该工作确保了同一图像的增强实例对同一点产生高度相似的特征,而不同的点则表现出明显不同的特征
在这里插入图片描述
MSS过程的输入包括从xs和xs中提取的多尺度特征图,以及从xs中选择的点c1,其在x ’ s中的对应点为c ’ 1。我们从x的各种尺度特征映射中提取点c1对应的特征向量,并计算这些特征向量与x的相应尺度特征映射的相似度。在将结果相似图的大小调整为原始图像大小之后,我们将它们聚合起来。这个过程使我们能够在x中精确定位与c1点最相似的位置,从而进一步完善我们的定位

模型推理过程

在这里插入图片描述
x和xq是以cs和cq为中心的支持和查询补丁。我们使用共享的Pnet将xs和xq分别转换为3D潜在向量ps和pq。Pnet包含用于提取特征的卷积块和用于投影的全连接层。我们应用比例因子r和双曲正切函数tanh来获得预测的偏移量dqs,即从xs到xq的相对位置。

实验结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/706114.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】gcc/g++ 调试学习记录

这是目录 gcc编译选项二、实战1、编译加上 CFLAGS -ggdb三级目录 gcc编译选项 1、-g 编译debug debugging 选项:-g gcc -g手册: 点击这里 -g一共分为4个等级:-g、-g0、-g1、-g3 其中g和g0是一个性质,不打开调试信息,g3保留所有信…

react-native-camera插件的使用,以及实现人脸识别

一、git地址和环境版本 (1)Git地址:https://github.com/react-native-camera/react-native-camera/tree/master (2)node版本:14 (3)react-native版本:0.72 二、环境配…

Linux操作系统——第五章 进程信号

目录 信号概念 用kill -l命令可以察看系统定义的信号列表 信号处理常见方式概览 产生信号 1. 通过终端按键产生信号 2. 调用系统函数向进程发信号 3. 由软件条件产生信号 4. 硬件异常产生信号 阻塞信号 1. 信号其他相关常见概念 2. 在内核中的表示 3. sigset_t 4.…

spring.aop 随笔4 如何借助jdk代理类实现aop

0. 下了有一个月的雨,这对鼻炎来说来吗?不好 其实这也算6月份的博客,之前一直疏于整理 本文仅关注jdk代理所实现的spring.aop下,两者的关系完整的aop源码走读请移步相关 spring.aop 的其他随笔 1. 反编译追踪源码 1.1 jdk代理类…

BPMN2.0规范简介

1 概述 BPMN(Business Process Model & Notation),中文名为业务流程模型与符号。BPMN2.0是OMG(Object Management Group,对象管理组织)制定的,其主要目的是既给用户提供一套简单的、容易理解的机制,以便用户创建流程模型&…

项目性能优化-内存泄漏检测与修改

最近终于有空优化一波项目的性能了,第一波借助Android Studio自带的Profiler工具检测内存泄漏。 第一步、创建Profiler的SESSIONS 第二步、进入MEMORY内存监控 右侧带有绿色原点的就是此时运行的Profiler的SESSION,点击右侧MEMORY进入内存监控的详情模块 第三步…

缓存三击-缓存穿透、缓存雪崩、缓存击穿

缓存三击-缓存穿透、缓存雪崩、缓存击穿 ⭐⭐⭐⭐⭐⭐ Github主页👉https://github.com/A-BigTree 笔记链接👉https://github.com/A-BigTree/Code_Learning ⭐⭐⭐⭐⭐⭐ Spring专栏👉https://blog.csdn.net/weixin_53580595/category_12279…

【产品设计】掌握“4+X”模型,从0到1构建B端产品

“4X”模型是什么 4个阶段:规划阶段,设计阶段,实现阶段,迭代阶段 X:项目管理,数据分析,产品运营 1、规划阶段 这是一个产品的开始,它决定了产品的设计方向和基调。主要包括用户分析、市场分…

爬虫入门指南(4): 使用Selenium和API爬取动态网页的最佳方法

文章目录 动态网页爬取静态网页与动态网页的区别使用Selenium实现动态网页爬取Selenium 的语法及介绍Selenium简介安装和配置创建WebDriver对象页面交互操作 元素定位 等待机制页面切换和弹窗处理截图和页面信息获取关闭WebDriver对象 使用API获取动态数据未完待续.... 动态网页…

JVM-垃圾回收-基础知识

基础知识 什么是垃圾 简单说就是没有被任何引用指向的对象就是垃圾。后面会有详细说明。 和C的区别 java:GC处理垃圾,开发效率高,执行效率低 C:手工处理垃圾,如果忘记回收,会导致内存泄漏问题。如果回…

Linux Mint 21.2“Victoria”Beta 发布

导读近日消息,Beta 版 Linux Mint 21.2 “Victoria” 于今天发布,用户可以访问官网下载镜像。 Linux Mint 21.2 代号 “Victoria” ,基于 Canonical 长期支持的 Ubuntu 22.04 LTS(Jammy Jellyfish)操作系统&#xff0…

2023年第三届工业自动化、机器人与控制工程国际会议

会议简介 Brief Introduction 2023年第三届工业自动化、机器人与控制工程国际会议(IARCE 2023) 会议时间:2023年10月27 -30日 召开地点:中国成都 大会官网:www.iarce.org 2023年第三届工业自动化、机器人与控制工程国际…

JAVA http

javahttp 请求数据格式servletservlet生命周期servletrequest获取请求数据解决乱码response相应字符&字节数据 请求数据格式 servlet servlet生命周期 servlet request获取请求数据 解决乱码 response相应字符&字节数据 response.setHeader("content-type",…

A. Portal(dp优化枚举)

Problem - 1580A - Codeforces CQXYM发现了一个大小为nm的矩形。矩形由n行m列的方块组成,每个方块可以是黑曜石方块或空方块。CQXYM可以通过一次操作将黑曜石方块变为空方块,或将空方块变为黑曜石方块。 一个大小为ab的矩形M被称为传送门,当…

【Linux】程序员的基本素养学习

这是目录 写在前面一、内存管理1、分段2、分页 二、线程管理三、静态库1、编译1.1、预处理1.2、编译1.3、汇编1.4、链接2、编译器3、目标文件**.text****.data****.bss****__attribute__** 3.1、符号3.2、兼容C语言 -- extern C4、链接 -- ld 写在前面 本文记录自己的学习生涯…

五.组合数据类型

目录 1、数组类型 声明数组 初始化数组 数组赋值 访问数组元素 2、切片类型 1、定义切片 2、切片初始化 3、访问 4、空(nil)切片 5、切片的增删改查操作: 3、指针类型 1、什么是指针 2、如何使用指针、指针使用流程: 3、Go 空指针 4、指…

chatgpt赋能python:如何将Python打包-一个SEO优化指南

如何将Python打包 - 一个SEO优化指南 作为一名拥有10年Python编程经验的工程师,我意识到很多Python开发者面临一个共同的问题:如何将他们的Python项目打包并发布到PyPI上?打包一个Python项目不仅可以让您的代码更加组织化,也可以…

如何拆分PDF?拆分PDF软件分享!​

那么如何拆分PDF?PDF是一种流行的电子文档格式,它可以在不同的操作系统和设备上进行查看和共享,而不会因为不同的软件或硬件而出现兼容性问题。同时,在使用的过程中,PDF拆分PDF文件是一个比较常见的需求,它…

threejs入门

个人博客地址: https://cxx001.gitee.io 前言 随着HTML5的发布,我们可以通过WebGL在浏览器上直接使用显卡资源来创建高性能的二维和三维图形,但是直接使用WebGL编程来创建三维场景十分复杂而且还容易出问题。而使用Three.js库可以简化这个过程&#xff…

机器学习——决策树1(三种算法)

要开始了…内心还是有些复杂的 因为涉及到熵…单纯的熵,可以单纯 复杂的熵,如何能通俗理解呢… 我也没有底气,且写且思考吧 1. 决策树分类思想 首先,决策树的思想,有点儿像KNN里的KD树。 KNN里的KD树,是每…