从病理AI的基础模型发展历程,看未来的医学AI发展趋势|个人观点·24-10-23

news2025/1/16 22:01:58

小罗碎碎念

在临床相关的人工智能(AI)模型发展方面,传统上需要大量标注数据集,这使得AI的进步主要围绕大型中心和私营企业展开。所以,在这期推文中,我会介绍一些已经商用的模型,并且为计划进军这个领域的商业同行提供一些建议

数据的可用性也决定了AI应用的发展:大多数研究聚焦于常见癌症类型,而忽略了罕见疾病。然而,随着基础模型(foundation models,FMs)的出现,这一范式正在改变,使得可以使用更小的数据集训练更加强大和健壮的AI系统【1】。

所以我们如何用更小的数据集(即更少的成本和更短的时间)去搭建一个适合我们研究领域的模型呢?又或者说,有没有一个通用的套路来快速的验证我们提出的假说呢

为了解决上面两个问题,我挑选了几篇高分文献,并且把其中关键的部分揉合在一起,不再像之前那样,只是推荐,而没有系统的归纳总结。写作不易,希望能对大家有所启发!!


一、AI在组织病理学图像分析中的应用

在组织病理学图像分析中,AI流程通常包括两个部分:特征提取和特定任务的预测。

图像编码器用于将病理图像压缩成低维特征向量。在此基础上,可以为特定任务(如癌症检测、生存结果预测或治疗反应)训练预测模型。

自2022年以来,由于自监督学习的推动,组织病理学的AI应用进入了一个新时代。这种方法使得可以在不需要任何标注数据的情况下高效训练特征提取器。这些大量的数据进而使得可以训练包含数十亿参数的更大、更全面的模型。以这种方式训练的模型被称为基础模型(FM)。

FMs对组织学图像中的形态模式有全面的理解,因此与在自然图像上预训练的模型相比,使用更少的训练样本就能训练出更准确的预测模型【1】。这种训练方法在本质上类似于人类学习,具有组织学一般知识的专家比非专家使用更少的样本就能解读特定的病理发现。

此外,未标注数据集自然具有高度可变性,包括不同的组织、疾病、扫描仪和制备协议。总的来说,使用FM作为训练特定任务模型的基线,显著提高了计算病理学模型的性能和泛化能力【2】,同时减少了结果预测模型中的任何偏差【3】。


二、基础模型的发展和应用

过去几年中,一波FMs已经进入组织病理学图像分析领域。

CTransPath是最早广泛使用的FM之一【4】。这些早期的FMs是使用公开可用的数据集(如癌症基因组图谱TCGA)构建的,而后续的研究则使用了带有更多数据和参数的私有数据集。

来源:https://doi.org/10.1038/s41571-024-00941-8

尽管FM的开发通常仅限于资源丰富的机构(由于对数据可用性、数据存储和计算能力的高要求),但有几个小组公开发布了他们的预训练模型。这种开放性使得研究人员能够从私有数据集上的大规模预训练中受益。


在最近发表在《nature medicine》上的一篇文章中,Vorontsov等人【5】介绍了另一个名为“Virchow”的FM。

Virchow 模型介绍

在所有可用的FMs中,Virchow拥有最多的参数和最广泛的训练集。Virchow在来自100,000名患者的数据上训练,包括大约1.5百万张恶性和非恶性组织的全切片图像,这些数据来自纪念斯隆-凯特琳癌症中心(MSKCC)。

Virchow模型通过自监督学习算法训练,能够生成数据表示(嵌入),这些嵌入能够很好地泛化到多种预测任务,从而构建一个跨多种组织类型的泛癌症模型。在九种常见和七种罕见癌症类型的队列上进行测试时,基于Virchow的泛癌症模型在性能上超越了或与所有其他测试的FMs相当。

最重要的是,Virchow模型可以处理罕见肿瘤类型或不常见的诊断任务,例如预测特定的基因组变化、临床结果和治疗反应,先不说效果如何,至少作者已经考虑到这一方面,那么就是方法和思路的一个创新!!


尽管使用了更少的特定任务标签进行训练,但相同的泛癌症检测模型在性能上几乎与临床级商业模型(特别是Paige Prostate、Paige Breast和Paige Breast Lymph Node)相匹配,甚至在检测某些罕见癌症变体时超过了它们。

https://info.paige.ai/prostate

我们大部分团队是无法具备商业级模型的开发能力的,但是Virchow的作者比较良心,为这一部分人提供一个开发临床级AI的可能,同时也给我们研究罕见疾病提供了一个新的思路!!(这就非常适合用来申请大型的项目啊,参考我上个月发的推文)

https://mp.weixin.qq.com/s/23TYH9zAlSnpoBOboHo_1w

并且Virchow的发表,还给我们提供另外一个信息——仅增加数据集大小可能不再能带来实质性的性能提升——因为训练了1.5百万张图像的Virchow和训练了100,000张图像的另一个名为UNI1的FM在性能上差距不大。

那么我们更关心的问题来了,**既然堆数据不好使了,下一步应该做什么呢?**我个人认为,进一步调整模型架构,优化训练数据的质量,充分考虑到不同中心数据之间的差异性并尽可能消除这种数据不平衡带来的影响才是我们下一阶段研究的重点。

还有一点很关键,也是我推文中频繁出现的——多模态/多组学——我们想要提升模型的性能,就必须要整合额外的数据类型,如临床报告或分子信息(测序,也就是基因组学、蛋白组学……),只有这样,我们才能保证模型更接近临床落地的可能。


三、商业开发会促进医学AI发展

其实这段时间也有不少商业的前辈和我沟通,想要进军医学AI和病理AI行业,那么我觉得Virchow模型算是一个不错的切入点,因为它是允许商业再利用的。我个人也是赞同商业开发的,因为这样一定程度上会促进技术的进步,也能有更多的人关注这个领域。

这部分的商业价值是毋庸置疑的,所以作为数据的原始生产者——医院——自然也不会放弃这个大好的机会,越来越多的头部医院开始布局医学AI,这都是利好的消息,但是也意味着卷的程度越来越明显。

基础模型肯定是为少部分人准备的,他们享受了最好的资源,理应承担更大的风险,但是开源与否的权利还是在于他们,我们要做好他们不开源或者隐藏部分技术的心里建设,要早日掌握自己的核心技术。

我们能做的,或者说迫切要做的,就是在目前已经开源的模型基础上,构建一个可以使用几百或者几千名患者就能训练并且取得良好效果的模型。为什么要实现一个这样的目标?一方面是基层的医院没有办法提供头部医院那样的数据,另一方面是我们的模型如果在小样本数据集的表现都优秀,那么大数据集的表现,几乎是会更好的(除非你扩大数据时导致了原始数据污染,加入了很多噪声)


四、开放获取和模型评估的重要性

开放获取对于创新和人工智能模型的评估至关重要。然而,现有的开源概念不能总是直接应用于人工智能系统。特别是,病理学中的FMs通常作为开放权重模型发布(所以,最关键的就是那一系列权重文件)——这种方法意味着尽管这些模型可以作为特征编码器使用,但它们的训练数据仍然是私有的,这阻碍了重新训练和验证可重复性的尝试。

还有一点很头疼,就是文章的投稿到发表时间,这中间的间隔太大了,就会导致我们看到的研究,他的思路其实已经不是最新的了。比如说我前两天分享的郑大那篇文章,人家21年投稿,24年发表,用的模型我们现在可能部分新手都没听过。

https://mp.weixin.qq.com/s/LcR3UhlaYE6IKIr7hIrLmA

这里我只想表达一个观点,看文章不能只看方法和结果,发表的时间和团队成员,也是一个不可忽略的内容!!


五、未来发展

从最开始的仅用普通的HE图像进行基础模型的训练,再到现在各种格式的图像、文本都加入进来,再一次验证了我的观点——多模态、自监督模型的开发将是未来一段时间亟需攻克的难题。

文本信息和图像信息一起处理,一定是未来的趋势,因为这是Transformer架构底层就决定的。我们未来或许真的可以实现,给模型输入一张普通的切片,它就能输出各种各样目前需要复杂检查才能得出的报告。

不妨畅想一下未来,我们可以一起打造一个医院的智能化信息系统,从收集数据开始就由AI接管,这样模型的训练数据自然而然就统一了,并且收集数据的速度也会有一个质的飞跃,那时又将开启下一轮的竞争


参考文献

    1. Chen, R. J. et al. Towards a general-purpose foundation model for computational pathology. Nat. Med. 30, 850–862 (2024).
    1. Wagner, S. J. et al. Transformer-based biomarker prediction from colorectal cancer histology: a large-scale multicentric study. Cancer Cell 41, 1650–1661.e4 (2023).
    1. Vaidya, A. et al. Demographic bias in misdiagnosis by computational pathology models. Nat. Med. 30, 1174–1190 (2024).
    1. Wang, X. et al. Transformer-based unsupervised contrastive learning for histopathological image classification. Med. Image Anal. 81, 102559 (2022).
    1. Vorontsov, E. et al. A foundation model for clinical-grade computational pathology and rare cancers detection. Nat. Med. https://doi.org/10.1038/s41591-024-03141-0 (2024).
    1. Lu, M. Y. et al. A multimodal generative AI copilot for human pathology. Nature https://doi.org/10.1038/s41586-024-07618-3 (2024).
    1. Derraz, B. et al. New regulatory thinking is needed for AI-based personalised drug and cell therapies in precision oncology. NPJ Precis. Oncol. 8, 23 (2024).

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2225211.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Minio文件服务器:SpringBoot实现文件上传

在Minio文件服务器部署成功后(参考上篇文章Minio文件服务器:安装)接下来我们通过SpringBoot框架写一个接口,来实现文件的上传功能:文件通过SpringBoot接口,上传到Minio文件服务器。并且,如果上传的文件是图片类型&…

裴蜀定理与欧几里得算法——蓝桥杯真题中的应用

目录 裴蜀定理(Bzouts Theorem)1、定义2、推论3、欧几里得算法4、多个整数的裴蜀定理扩展 真题挑战解题思路代码实现与详细注释代码解析 裴蜀定理(Bzout’s Theorem) 1、定义 对于任意两个整数 a 和 b ,如果它们的最…

Gateway 统一网关

一、初识 Gateway 1. 为什么需要网关 我们所有的服务可以让任何请求访问,但有些业务不是对外公开的,这就需要用网关来统一替我们筛选请求,它就像是房间的一道门,想进入房间就必须经过门。而请求想要访问微服务,就必须…

聚链成网,趣链科技参与 “跨链创新联合体”建设

近日,2024全球数商大会在上海举办。大会由上海数据集团和上海市数商协会联合主办,上海市数据局和浦东新区人民政府支持,以“数联全球,商通未来——‘链’接数字经济新未来”为主题,聚焦区块链技术和应用场景展开。 会上…

Windows生成公钥和私钥

1、打开命令提示符或 PowerShell: 按下 Win R,输入 cmd 或 powershell,然后按 Enter 打开命令提示符或 PowerShell 窗口。 2、生成密钥对: 输入以下命令生成 RSA 密钥对 ssh-keygen -t rsa -b 2048-t rsa 表示生成 RSA 类型的密…

开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用

一、前言 学习Qwen2-VL ,为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。这不仅拓宽了我们的知识视野,更让我们站在科技发展的潮头,紧跟时代的步伐。 Qwen2-VL 具有卓越的图…

android studio编译错误提示无法下载仓库

一、调整方法之一 buildscript {repositories {google()jcenter()//maven { url https://maven.aliyun.com/repository/google }//maven { url https://maven.aliyun.com/repository/central }}dependencies {// classpath "com.android.tools.build:gradle:4.1.1"c…

Python金色流星雨

系列目录 序号直达链接爱心系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python漂浮爱心代码7Python爱心光波代码8Python普通的玫瑰花代码9Python炫酷的玫瑰花代码10Python多…

算法的学习笔记—翻转单词顺序列(牛客JZ73)

😀前言 在《剑指 Offer》系列题中,有一道关于翻转单词顺序的经典题目。给定一个由多个单词组成的字符串,需要将每个单词的顺序颠倒。这道题考察了对字符串的操作技巧,尤其是如何在限定空间内完成字符串的翻转。本文将详细解析这道…

吉客云与金蝶云星空系统高效数据对接实践

调拨出库红字对接分步式调入(退货)案例分享:吉客云数据集成到金蝶云星空 在企业的日常运营中,数据的高效流转和准确对接是实现业务流程自动化和优化的重要环节。本文将聚焦于一个具体的系统对接集成案例——如何将吉客云的数据无缝集成到金蝶云星空&…

阿里云物联网的通信方式

阿里云物联网通信的两种方式,一个是物模型(分为服务,事件,属性),一个是自定义topic(要另外设置数据流转) 1.使用产品内的功能定义,(其实也就是Topic中定义好的…

Prompt Engineering (Prompt工程)

2 prompt工程2大原则 2.1 给出清晰&#xff0c;详细的指令 策略1&#xff1a;使用分割符清晰的指示输出的不同部分&#xff0c;比如"",<>,<\tag>等分隔符 策略2&#xff1a;指定一个结构化的输出&#xff0c;比如json,html等格式 策略3&#xff1a;要…

重学SpringBoot3-Spring WebFlux之SSE服务器发送事件

更多SpringBoot3内容请关注我的专栏&#xff1a;《SpringBoot3》 期待您的点赞&#x1f44d;收藏⭐评论✍ Spring WebFlux之SSE服务器发送事件 1. 什么是 SSE&#xff1f;2. Spring Boot 3 响应式编程与 SSE为什么选择响应式编程实现 SSE&#xff1f; 3. 实现 SSE 的基本步骤3.…

【JavaEE】【多线程】volatile,wait/notify

目录 一、volatile关键字1.1 内存可见性1.2 volatile解决内存可见性问题 二、wait和notify2.1 wait2.2 notify2.3 使用例子2.3.1 例子12.3.2 例子二 一、volatile关键字 volatile可以保证内存可见性&#xff0c;只能修饰变量。 1.1 内存可见性 在前面介绍线程不安全原因时介…

AI编译器与TVM

由于AI芯片的特殊性和高度定制化&#xff0c;为了兼容硬件的多样性&#xff0c;AI模型必须能被高效地映射到各种AI芯片上。AI编译器将深度学习框架描述的AI模型作为输入&#xff0c;将为各种AI芯片生成的优化代码作为输出。AI编译器的目标是通过编译优化的方法将深度学习框架产…

Git的原理和使用(六)

本文主要讲解企业级开发模型 1. 引入 交付软件的流程&#xff1a;开发->测试->发布上线 上面三个过程可以详细划分为一下过程&#xff1a;规划、编码、构建、测试、发 布、部署和维护 最初&#xff0c;程序⽐较简单&#xff0c;⼯作量不⼤&#xff0c;程序员⼀个⼈可以完…

2025 - AI人工智能药物设计 - 中药网络药理学和毒理学的研究

中药网络药理学和毒理学的研究 TCMSP&#xff1a;https://old.tcmsp-e.com/tcmsp.php 然后去pubchem选择&#xff1a;输入Molecule Name 然后进行匹配&#xff1a;得到了smiles 再次通过smiles&#xff1a;COC1C(CC(C2C1OC(CC2O)C3CCCCC3)O)O 然后再次输入&#xff1a;http…

单体架构VS微服务架构

单体架构&#xff1a;一个包含有所有功能的应用程序 优点&#xff1a;架构简单、开发部署简单缺点&#xff1a;复杂性高、业务功能多、部署慢、扩展差、技术升级困难 如上示意图&#xff0c;应用前端页面&#xff0c;后台所有模块功能都放在一个应用程序中&#xff0c;并部署在…

「C/C++」C++标准库之#include<fstream>文件流

✨博客主页何曾参静谧的博客&#x1f4cc;文章专栏「C/C」C/C程序设计&#x1f4da;全部专栏「VS」Visual Studio「C/C」C/C程序设计「UG/NX」BlockUI集合「Win」Windows程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「PK」Parasoli…

shodan2---清风

注&#xff1a;本文章源于泷羽SEC&#xff0c;如有侵权请联系我&#xff0c;违规必删 学习请认准泷羽SEC学习视频:https://space.bilibili.com/350329294 实验一&#xff1a;search 存在CVE-2019-0708的网络设备 CVE - 2019 - 0708**漏洞&#xff1a;** 该漏洞存在于远程桌面…