UniverSeg:通用医学图像分割模型来了!

news2024/11/24 12:03:05

自从今年以来ChatGPT爆火和GPT-4的发布,一时间在大模型的潮流下,通用人工智能(AGI)也呼之欲出。随着本月初SAM和SegGPT等通用的CV大模型的提出,大模型和通用模型这把火也逐渐烧到的CV领域,特别是图像分割领域。很多做分割方向的小伙伴自我调侃说一觉醒来,自己的方向没了。

笔者所在的医学影像行业,一直以数据和高成本标注而筑起非常高的领域壁垒。几个月前要是有人跟我说想做一个医学影像的通用分割模型,我一定会觉得你是在说胡话。但此一时彼一时也,月初SAM发布的时候,主要对标的自然图像,笔者也测试了其在医学影像上表现,效果可以说超出预期了,但远不如自然图像,这让笔者感到医学影像的领域壁垒要打破可能还早。

但打脸来得太快。昨天看到了MIT发布的UniverSeg工作,名字很直接,针对的就是医学影像的通用分割:UniverSeg: Universal Medical Image Segmentation。趁着今天周末在家,赶紧把论文打印出来认真读了一遍。 

b7e036228ec481a2e1d323ca239fc32d.jpeg

近几年深度学习图像分割一直是高度定制化的,而医学影像分割尤其如此,对于不同影像模态(CT、MR、超声、X-ray、OCT等)、不同身体部位、不同标注(同一影像,可能会有不同的目标对象)。笔者所在的行业和方向,做一个目标影像或者疾病的分割任务,一定是专门收集该任务的影像数据,然后找专业人员来标注,再训练一个定制化的分割模型,这个模型是高度垂直的、定制化的和难以迁移的。但现在SAM和UnvierSeg的出现打破了这一范式。如图2所示,区别于此前的训练-预测的分割范式,UniverSeg给出的分割范式是:输入查询图像(Query Image),即待分割图像,再给定若干对提示图像-标注对(Support Set),UniverSeg就可以对查询图像进行很好的分割。 

fed174ab6d13927f2575fe826c7d6dba.png

数据

先来看数据部分。UniverSeg研究总共使用了53个开源或者半开源的医学影像数据集,总共包括26个医学领域、16种影像模态和22000多次扫描。因为聚焦的是2D医学图像分割,所以对来源数据集中属于3D volume的数据都做了层采样,包括中间层采样(mid-slices)和最多标签体素层采样(max-slices)。基于这53个数据集构建的新数据被命名为MegaMedical数据集。但因为各来源数据集的有限获取规则,所以作者也没有开源MegaMedical。训练集构成信息如图3所示。

f0f88f882adb9f1feba481ba866e9642.png

模型

模型部分是UniverSeg工作的重点部分。传统的分割任务范式针对数据集,目标是训练一个监督学习模型,其中即为常规的卷积分割网络。但UniverSeg给出的模型范式是:,其中表示给定任务的输入,即待分割的查询图像,表示为提示图像和标注对:。

UniverSeg针对以上分割任务范式,提出了一种交叉卷积构成的CrossBlock结构,能够在查询图像和提示图像之间进行信息交互。给定查询图像特征图和一组提示图像特征图,交叉卷积层可以定义为:

其中表示两个特征图的concatenation。基于上述交叉层,进一步地可搭建交叉模块为:

最终,基于交叉卷积模块构建出的UniverSeg网络结构如图3所示。同时,为了提高UniverSeg的性能,模型在训练的时候也都做了数据增强,包括In-Task和Task两种数据增强方案。UniverSeg的训练流程如下图所示。整体结构仍然是基于UNet的编解码架构,只是卷积层都用CrossConv模块来代替了。

55e880224135965ab09fb054ac670614.png

实验

实验部分主要是与一些少样本模型(SENet、ALPNet、PANet)做了基线对比,然后在任务多样性、提示数据规模、查询图像规模等方面做了消融研究。UniverSeg试验部分做得很扎实,附录里面给了很多维度的性能结果,笔者这里不做一一展示。

6e38e972fe0641c5cf097dccd0d214ce.png

ce284f43b069daff018fe77b786d859c.png

总结

UniverSeg的主要贡献包括:

  • 提出了基于CrossBlock交叉模块机制的UniverSeg作为新的医学图像分割范式,无需重新训练新分割模型。

  • 与以往的少样本模型相比,UniverSeg在未经训练的新影像上表现出了与监督分割模型相当的精度。

  • 训练时的样本多样性能够使得UniverSeg有着强大的泛化性能。

总体来讲,在数据壁垒极高和标注成本极大的医学图像领域,通用分割模型不在遥不可及。随着AGI和CV大模型的发展,UniverSeg以及后续研究会逐渐推进这一领域的发展。2D分割模型也会逐渐向2.5D和3D扩展和延伸。

代码

项目代码地址:https://github.com/JJGO/UniverSeg demo地址:https://colab.research.google.com/drive/19Sauvhyzae5qvVLguaZRCuH1vJ5oTuw-?usp=sharing


另外,为了聚集更多的人参与到AI生产力工具上来,笔者前几天特意组建了一个名为【ChatGPT实验室】的知识星球,目前已有170+读者加入,星球的主要定位包括:

1. 如何基于ChatGPT提高工作和学习效率。

2. 跟踪NLP、LLM、AIGC和AGI的前沿动态和最新进展。

3. 分享ChatGPT的最新应用和玩法。

9f204358d67ac7d933ea76e3449e86d0.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/422108.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux应用编程(文件IO进阶)

一、Linux 系统如何管理文件 1.1、静态文件与 inode 文件存放在磁盘文件系统中,并且以一种固定的形式进行存放,我们把他们称为静态文件。 每一个文件都必须对应一个 inode,inode 实质上是一个结构体,这个结构体中有很多的元素&a…

【C语言】初阶指针(指针运算、二级指针及指针数组)

简单不先于复杂,而是在复杂之后。 目录 1. 指针运算 4.1 指针-整数 1.2 指针 - 指针 1.3 指针的关系运算 2. 指针和数组 3. 二级指针 4. 指针数组 1. 指针运算 指针-整数指针-指针指针的关系运算 4.1 指针-整数 上面这个程序的作用是将数组中每个元…

【攻城狮计划】Renesas RA2E1 开发板

🚩WRITE IN FRONT🚩 🔎介绍:"謓泽"正在路上朝着"攻城狮"方向"前进四"🔎🏅荣誉:2021|2022年度博客之星物联网与嵌入式开发TOP5|TOP4、2021|2022博客之星TOP10…

Scalable Recognition with a Vocabulary Tree(词汇树)

视觉单词 参考 视觉词袋(BoVW,Bag of Visual Words)模型,是“词袋”(BoW,Bag of Words)模型从自然语言处理与分析领域向图像处理与分析领域的一次自然推广。对于任意一幅图像,BoVW模…

jwt生成和解密-jose4j

jwt生成和解密-jose4j jwt的概念和生成意义在这里就不描述了&#xff0c;百度能搜到很多&#xff0c;直接上代码 官网地址 https://bitbucket.org/b_c/jose4j/wiki/Home maven <dependency><groupId>org.bitbucket.b_c</groupId><artifactId>jose4j…

【微信小程序】-- 配置uni-app的开发环境(四十八)

&#x1f48c; 所属专栏&#xff1a;【微信小程序开发教程】 &#x1f600; 作  者&#xff1a;我是夜阑的狗&#x1f436; &#x1f680; 个人简介&#xff1a;一个正在努力学技术的CV工程师&#xff0c;专注基础和实战分享 &#xff0c;欢迎咨询&#xff01; &…

Echarts图表显示不完全(多种图表解决方案)

前言 在使用Echarts画图的时候&#xff0c;有时候图表在固定大小的盒子模型&#xff08;dom容器&#xff09;中会显示不完全&#xff0c;因此我们需要对图表进行相关的调整使得图表内容显示完全。结合最近遇到的情况&#xff0c;提出一些解决方向 &#xff08;比较片面&#x…

Linux操作系统ARM体系结构处理器机制原理与实现

ARM 的概念ARM(Advanced RISC Machine)&#xff0c;既可以认为是一个公司的名字&#xff0c;也可以认为是对一类微处理器的通称&#xff0c;还可以认为是一种技术的名字。ARM 公司并不生产芯片也不销售芯片&#xff0c;它只出售芯片技术授权。其合作公司针对不同需求搭配各类硬…

【2023 · CANN训练营第一季】昇腾AI入门课(Pytorch)——第二章学习笔记

第二章 PyTorch模型迁移&调优 目标 了解 Pytorch 是如何适配到昇腾平台上的了解 Davinci 硬件架构以及什么样的模型在昇腾上更亲和了解软件术语和 Ascend - Pytorch 的安装步骤了解如何将原生 Pytorch 的模型代码是如何适配到 Ascend - Pytorch 前置知识 对原生 Pytorc…

足够惊艳,使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调,效果比肩斯坦福羊驼

之前尝试了从0到1复现斯坦福羊驼&#xff08;Stanford Alpaca 7B&#xff09;&#xff0c;Stanford Alpaca 是在 LLaMA 整个模型上微调&#xff0c;即对预训练模型中的所有参数都进行微调&#xff08;full fine-tuning&#xff09;。但该方法对于硬件成本要求仍然偏高且训练低效…

Java基础——IO流+字节流使用

&#xff08;1&#xff09;IO流的概述&#xff1a; IO流也称为输入&#xff0c;输出流&#xff0c;就是用来读写数据的。I表示input&#xff0c;是数据从硬盘文件读入到内存的过程&#xff0c;称之输入&#xff0c;负责读。O表示output&#xff0c;是内存程序的数据从内存到写…

CSS:transform顺序问题(translate()+rotate())

问题&#xff1a;下面两行代码在执行效果上有区别吗&#xff1f; transform: translate(100px,100px) rotate(45deg);transform: rotate(45deg) translate(100px,100px);translate(X,Y)&#xff0c;可以使元素在x轴和y轴上平移。&#xff08;在translate中&#xff0c;x轴右为…

设计模式之观察者模式(C++)

作者&#xff1a;翟天保Steven 版权声明&#xff1a;著作权归作者所有&#xff0c;商业转载请联系作者获得授权&#xff0c;非商业转载请注明出处 一、观察者模式是什么&#xff1f; 观察者模式是一种行为型的软件设计模式&#xff0c;定义对象间的一种一对多的依赖关系&#x…

51 openEuler搭建PostgreSQL数据库服务器-安装、运行和卸载

文章目录51 openEuler搭建PostgreSQL数据库服务器-安装、运行和卸载51.1 安装51.2 运行51.2.1 初始化数据库51.2.2 启动数据库51.2.3 登录数据库51.2.4 配置数据库账号密码51.2.5 退出数据库51.2.6 停止数据库51.3 卸载51 openEuler搭建PostgreSQL数据库服务器-安装、运行和卸载…

【Webpack5】核心原理

介绍 本章节我们主要学习&#xff1a; loader 原理自定义常用 loaderplugin 原理自定义常用 plugin Loader 原理 loader 概念 帮助 webpack 将不同类型的文件转换为 webpack 可识别的模块。 loader 执行顺序 分类 pre&#xff1a; 前置 loadernormal&#xff1a; 普通 …

【golang项目-GeeCache】动手写分布式缓存 day1 - 实现LRU算法

介绍 LRU 内存淘汰算法 LRU(Least Recently Used) 最近最少使用 算法 &#xff0c;系统认为如果这个数据最近使用过那么它被再次使用的概率会高&#xff0c;所以系统会先淘汰最久没被使用的数据 基本逻辑 -----------------------------------------------------------------…

手把手教你学习IEC104协议和编程实现 十一-定值的概念讲解、定值的操作过程以及部分代码的实现

从本章开始,我们开始研究定值部分; 定值是什么? 了解过终端的可能都知道,定值就是保护定值,就是设定了一组参数,当终端的采样值达到这个参数的时候,终端就会做出一系列的反应。这样的目的,是为了保护电网,让电网正常运行,具体为什么这么做,不做详细的解释,如果有…

李宏毅2021春季机器学习课程视频笔记13-自注意力机制

【(强推)李宏毅2021/2022春机器学习课程】 Slide地址 一、问题引入 1.模型的输入 无论是预测视频观看人数、视频处理、语言识别&#xff0c;这些所有的model中&#xff0c;输入数据都可以视作为一个向量&#xff08;vector&#xff09;&#xff0c;模型的输出为一个数值或者一…

UDP的报文结构及注意事项

UDP的报文结构及注意事项&#x1f50e;UDP的报文结构源端口和目的端口报文长度校验和&#x1f50e;UDP的注意事项端口号报文长度校验和&#x1f50e;结尾&#x1f50e;UDP的报文结构 图片来自网络 源端口和目的端口 如果将 源IP 和 目的IP 看作是两台计算机在网络中的地址 那么…

完美解决丨#在python中,如果引用的变量未定义,则会报告NameError: name ‘变量名‘ is not defined。

NameError 在python中&#xff0c;如果引用的变量未定义&#xff0c;则会报告NameError: name 变量名 is not defined。 如下代码抛出了一个异常&#xff1a; !/usr/bin/env python -- coding:utf-8 -- print hello world print hello %s % name 报错信息如下&#xff1a; Trac…