Nature | 通用医学人工智能基础模型

news2024/12/24 8:08:16

编译 | 李汭璨

审稿 | 王建民

今天为大家介绍的是来自Eric J. Topol和 Pranav Rajpurkar研究团队的一篇医学人工智能的综述论文。高度灵活、可重复使用的人工智能模型的极快发展可能会为医学带来新的能力。作者提出了医学人工智能的新范式,称为通用医学人工智能(GMAI)。GMAI模型将能够使用非常少量或没有特定任务的标记数据执行各种任务。通过在大型、多样化的数据集上进行自我监督构建,GMAI将灵活地解释不同的医学模态组合,包括来自成像、电子健康记录、实验室结果、基因组学、图表或医学文本的数据。模型将进一步产生表达能力强的输出,例如自由文本解释、口头建议或图像注释,展示高级医学推理能力。文章确定了一组GMAI的高影响潜在应用,并阐述了实现它们所需的特定技术能力和培训数据集。我们预计,GMAI启用的应用将挑战目前医学AI设备的监管和验证策略,并转变与收集大型医学数据集相关的实践。

9becc6a56ae346b8feda221ce43be5b5.png

基础模型——最新一代的人工智能模型——是在大规模、多样化的数据集上进行训练,并可应用于众多下游任务。现在,单个模型在各种问题上均可达到最先进的性能。这种多功能性代表了人工智能模型较上一代模型(为解决特定任务而设计的模型)已经有了明显变化。尽管已经有部分工作致力于开发医学基础模型,但由于访问大规模、多样化的医学数据集的困难、医学领域的复杂性以及这种发展的新近性,这种转变还没有广泛渗透到医学人工智能领域。相反,医学人工智能模型在很大程度上仍然采用针对特定任务的模型开发方法。例如,胸部X线解释模型可以在一个数据集上进行训练,该数据集中每个图像都被明确标记为肺炎的阳性或阴性,可能需要大量的注释工作。这个模型只能检测肺炎,不能完成编写全面放射学报告的完整诊断过程。这种狭隘的、针对特定任务的方法会产生僵化的模型,仅限于执行训练数据集和其标签预定义的任务。在超过500个获得美国食品药品监督管理局批准的临床医学人工智能模型中,大多数仅获得了1或2个任务的批准。

作者概述基础模型研究中的最新进展是如何打破这种针对特定任务的范式。模型这些进展包括:多模态架构,和自监督学习技术,以及模型的上下文学习能力的出现。这些进展将使得开发GMAI成为可能,这意味着它们将广泛应用于医学应用程序,很大程度上将取代针对特定任务的模型。

e912e032607f29bfc5948970dabf86a5.png

作者确定了三个将GMAI模型与传统医学AI模型区分开来(上图所示)的关键能力:1. 将GMAI模型适应于新任务将像用普通英语(或其他语言)描述任务一样简单。通过简单地将新任务解释给模型,使其解决以前未见过的问题,而无需重新训练。2. GMAI模型可以使用各种数据模态接受输入和产生输出(例如,可以接受图像、文本、实验室结果或任何组合)。这种灵活的交互方式与更为严格的多模式模型形成对比,后者总是将预定义的模态集合作为输入和输出(例如,必须始终同时输入图像、文本和实验室结果)。3. GMAI模型将正式理解医学知识,使它们能够推理出以前未见过的任务,并使用医学准确的语言解释它们的输出。

医学AI中通用模型的潜力

更灵活的交互:GMAI提供了通过自定义查询与模型进行交互的能力,使得不同受众更容易理解AI模型的输出,并在不同任务和环境中提供前所未有的灵活性。在当前实践中,AI模型通常处理单一任务,并产生预先确定的输出。例如,当前的模型可能会检测某种特定疾病,输入一种图像,并始终输出该疾病的可能性。相比之下,自定义查询允许用户提出多样的问题,比如:“解释这张头部MRI扫描中出现的肿块。它更有可能是肿瘤还是脓肿?”此外,查询还可以让用户自定义输出的格式:“这是一位患有胶质母细胞瘤患者的后续MRI扫描。用红色标出任何肿瘤” 通过自定义查询,用户可以在问题中包含复杂的医学信息,自由混合各种数据类型。例如,临床医生在询问诊断时可能会在其问题中包含多个图像和实验室结果。GMAI模型也可以灵活地将不同的模态组合到回答中,例如当用户要求同时提供文本答案和相应的可视化时。

医学领域知识:与临床医生截然不同的是,传统的医学AI模型在接受特定任务训练之前通常缺乏医学领域的相关知识,它们必须仅依赖于输入数据特征与预测目标之间的统计关联来推导数据关系。这种缺乏背景使得训练针对特定医学任务的模型变得更加困难,特别是当这些任务的数据很少时。GMAI模型可以通过大量医学知识来解决这个缺点。例如,知识图谱等结构可以让模型推理医学概念和它们之间的关系。此外,检索式方法使得GMAI可以从现有数据库中检索相关上下文,获取文章、图像或病例等形式的相关信息。

GMAI的应用案例:作者针对不同的用户群体和领域提出了六个潜在的GMAI使用案例,案例具体内容如下:

1. 通过GMAI实现一种新型多功能数字放射学助手,支持放射科医生在整个工作流程中的工作。GMAI模型可以自动起草放射学报告,描述异常和相关的正常发现,同时考虑患者的病史。这些模型可以通过将文本报告与交互式可视化配对来为临床医生提供进一步的帮助,放射科医生也可以通过与GMAI模型聊天来提高他们对病例的理解。

2.手术GMAI模型可以协助手术团队进行手术:“我们找不到肠破裂的位置。检查一下我们是否错过了过去15分钟内任何肠段的视觉呈现”。GMAI模型可以执行可视化任务,潜在地实时注释手术过程的视频流。它们也可以以口头形式提供信息,例如在手术医生遇到罕见解剖现象时引发警报或朗读相关文献。

3. GMAI可以提供一类新的床边临床决策支持工具,扩展了现有的基于人工智能的早期预警系统,提供更详细的解释和未来治疗建议。例如,床边决策支持的GMAI模型可以利用临床知识,并提供自由文本解释和数据摘要:“警告:该患者即将休克。过去15分钟内,她的循环已不稳定 <链接到数据摘要>。推荐下一步操作:<链接到清单>”。

4.文档编写是临床工作流程中不可或缺但劳动密集的部分。通过监控电子病人信息以及医护人员和病人的交谈,GMAI模型可以预先起草诸如电子笔记和出院报告等文档,供医护人员仅需审核、编辑和批准。因此,GMAI可以大大减少行政开销,让医护人员有更多时间与病人交流。

5. 与患者交流的聊天机器人。GMAI有潜力在临床环境之外也能为患者提供高质量的护理。例如,GMAI可以使用多种模态建立患者的全面情况,从未结构化的症状描述到连续葡萄糖监测读数到患者提供的药物日志。在解释这些异构数据类型之后,GMAI模型可以与患者互动,提供详细的建议和解释。重要的是,GMAI实现了可访问的沟通,提供关于患者计划的清晰、可读或可听的信息。

6. GMAI 可以从文本提示中生成蛋白质氨基酸序列及其三维结构。受到已有蛋白质序列生成模型的启发,这样的模型可以基于期望的功能属性来生成蛋白质序列。与此同时,基于 GMAI 的生物医学知识,可以构建与现有文本生成图像模型一样灵活且易于使用的蛋白质设计界面。此外,通过解锁上下文学习能力,基于 GMAI 的文本生成蛋白质模型可以通过几个示例指令和序列来动态定义新的生成任务,例如生成能够在满足其他限制条件的情况下与指定靶标高亲和结合的蛋白质。

GMAI的机遇和挑战

医疗实践的范式转变:GMAI的有良好的可控制性。GMAI允许用户精细控制其输出的格式,使复杂的医疗信息更易于访问和理解。例如,将会有GMAI模型能够在请求时重新表述自然语言回答。同样,GMAI提供的可视化可以进行精细的定制,例如通过改变视角或使用文本标注重要特征。模型还可以根据需要调整其输出的领域特定细节级别,或将其翻译成多种语言,有效地与各种用户沟通。最后,GMAI的灵活性使其能够适应特定地区或医院,遵循当地的习惯和政策。GMAI相比于上一代的模型,有更好的可适应性。现有的医学AI模型难以应对由于技术、程序、设置或人口变化引起的数据分布转移。然而,GMAI可以通过在上下文中学习来跟上变化的步伐。除此之外,GMAI的转变将推动广泛能力的大规模医学AI模型的开发和发布,这些模型将成为各种下游临床应用的基础。许多应用程序将直接与GMAI模型本身进行接口,直接使用其最终输出。

GMAI带来的挑战:GMAI在实际应用过程中同样存在诸多问题。1. 由于其前所未有的多功能性,GMAI模型将难以进行验证。目前,AI模型是为特定任务而设计的,因此只需要为那些预定义的用例进行验证。然而,GMAI模型可以第一次由终端用户提出执行以前未见过的任务,因此要预测所有失败模式是明显更具挑战性的。2. 除此之外,在实际应用过程中,因为GMAI模型可以处理异常复杂的输入和输出,这使临床医生更难确定它们的正确性。3. 医疗人工智能模型可能会保持偏见,对边缘化人群造成伤害。在训练过程中,数据集中可能缺乏某些患者群体或包含有害相关性,从而导致模型产生偏见。当开发GMAI时,这些风险可能更加明显。GMAI模型的开发和使用对患者隐私构成了严重的风险。4. GMAI模型可能访问丰富的患者特征,包括临床测量和信号、分子标记和人口统计信息以及行为和感官跟踪数据。此外,GMAI模型可能使用大型架构,但较大的模型更容易记忆训练数据,并直接将其重复给用户。因此,GMAI模型可能会在训练数据集中公开敏感患者数据,通过去识别化和限制为个别患者收集的信息,可以减少数据暴露造成的损害。5. 基础模型尺寸显著增加,推高了与数据收集和模型训练相关的成本,开发这样大的模型会带来巨大的环境成本。据估计,每个大规模基础模型会产生多达数百吨的二氧化碳当量。

结论

文章介绍了GMAI模型的概念和其在医疗保健中的应用。GMAI模型能够处理多种数据模态,并具有在执行任务时学习新内容的能力和利用领域知识的能力,这为医疗保健任务提供了无限的机会。GMAI的灵活性使得模型能够适应新的环境和应对新兴疾病和技术的变化,而无需经常重新训练。此外,GMAI应用程序将部署在传统的临床环境和远程设备上。但是,GMAI模型也存在独特的挑战,包括验证模型的准确性、收集和保护大规模的训练数据以及应对计算成本。作者敦促AI社区和临床利益相关者在早期就仔细考虑这些挑战,以确保GMAI在医疗保健领域持续为临床医生和患者提供价值。最终,GMAI为医疗保健带来了前所未有的可能性,支持医生完成各种重要任务,克服沟通障碍,使高质量的医疗保健更广泛地可及,并减轻医生的行政负担,使他们有更多时间与患者交流。

参考资料

Moor, M., Banerjee, O., Abad, Z.S.H. et al. Foundation models for generalist medical artificial intelligence. Nature 616, 259–265 (2023). 

https://doi.org/10.1038/s41586-023-05881-4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/504793.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

磁盘和文件系统管理

个人简介&#xff1a;云计算网络运维专业人员&#xff0c;了解运维知识&#xff0c;掌握TCP/IP协议&#xff0c;每天分享网络运维知识与技能。座右铭&#xff1a;海不辞水&#xff0c;故能成其大&#xff1b;山不辞石&#xff0c;故能成其高。个人主页&#xff1a;小李会科技的…

Deepnlp EquationGPT公式搜索引擎搜Latex源码和论文

公式搜索引擎常用功能 DeepNLP的EquationGPT用的比较多功能: 网址&#xff1a;EquationGPT Largest Equation Database & Engine powered by GPT 1. 公式搜索引擎&#xff0c;输入公式搜索数学公式的Latex代码和相应论文。 2. 目前覆盖了计算机(机器学习/AI)/ 数学/物理…

【设计模式】总结篇

【C语言部分】总结篇 【操作系统】总结篇 【数据库】总结篇 【计算机网络】总结篇 本文目录 1. 说说什么是单例设计模式&#xff0c;如何实现2. 简述一下单例设计模式的懒汉式和饿汉式&#xff0c;如何保证线程安全3. 说说工厂设计模式&#xff0c;如何实现&#xff0c;以及它的…

判断无穷积分是绝对收敛还是条件收敛---练习题

本篇文章重点讨论一般无穷积敛散性的判别。&#xff08;即被积函数在所积区间符号不定&#xff0c;既有正的&#xff0c;也有负的&#xff09; 不论是绝对收敛还是条件收敛&#xff0c;它本身一定是 收敛的。 狄利克雷判别法&#xff1a; 例题&#xff1a; 首先&#xff0c;将…

(4)Qt——基本组件

目录 1. Designer 设计师** 2. Layout 布局*** 3. 基本组件 3.1 QWidget** 3.2 ui指针 3.3 QLabel 标签** 3.4 QAbstractButton 按钮类** 3.5 QLineEdit 单行文本输入框** 3.6 QComboBox 组合框** 3.7 一组与数值相关的组件* 1. Designer 设计师** Designer是一款独立的用于设计…

【Java】进程通信(共享内存)

&#x1f388;博客主页&#xff1a;&#x1f308;我的主页&#x1f308; &#x1f388;欢迎点赞 &#x1f44d; 收藏 &#x1f31f;留言 &#x1f4dd; 欢迎讨论&#xff01;&#x1f44f; &#x1f388;本文由 【泠青沼~】 原创&#xff0c;首发于 CSDN&#x1f6a9;&#x1f…

PyQt5桌面应用开发(12):QFile与线程安全

本文目录 PyQt5桌面应用系列segment faultgdb backtraceopen & readQFile总结 PyQt5桌面应用系列 PyQt5桌面应用开发&#xff08;1&#xff09;&#xff1a;需求分析 PyQt5桌面应用开发&#xff08;2&#xff09;&#xff1a;事件循环 PyQt5桌面应用开发&#xff08;3&…

怎么恢复回收站?分享4个宝藏方法!

案例&#xff1a;怎么恢复回收站 【请问大家怎么恢复误删的文件呀&#xff1f;如果回收站被清空了&#xff0c;又应该怎么恢复呢&#xff1f;】 电脑回收站是我们存储被删除文件的地方。但是有时候&#xff0c;我们会不小心把一些重要的文件或者照片误删了。这时候&#xff0…

LED驱动程序框架

1. 字符设备驱动程序框架 2. 基于分层思想的LED驱动 2.1 把驱动拆分为通用的框架和具体的硬件操作 把驱动拆分为通用的框架(leddrv.c)、具体的硬件操作(board_X.c)&#xff1a; 如图&#xff1a; 以面向对象的思想&#xff0c;改进代码 抽象出一个结构体&#xff1a; 每个…

数据库管理-第七十三期 最近(20230509)

数据库管理 2023-05-09 第七十三期 最近1 证书2 EMCC 13.5.0.143 破百总结 第七十三期 最近 五一前后&#xff0c;除了X8那台的故障以外&#xff0c;还是做了或者探索了一些其他的东西。 1 证书 在五一假期的最后一天&#xff0c;还是在家通过线上的方式通过了1Z0-902&#…

Springboot +Flowable,三种常见网关的使用(排他、并行、包容网关)(一)

一.简介 Flowable 中常用的网关主要有三种类型&#xff0c;分别是&#xff1a; 排他网关并行网关包容网关 下面来说下这三种的网关的概念和用法。 二.排他网关 排他网关&#xff0c;也叫互斥网关&#xff0c;截图如下&#xff1a; 排他网关有一个入口&#xff0c;多个有效…

亚马逊云科技发力医疗与生命科学行业,加速数字化创新

2023年4月27日&#xff0c;亚马逊云科技医疗与生命科学行业峰会召开&#xff0c;会议汇聚了业界专家和思想领袖&#xff0c;共同探讨行业数字化转型和创新之道。作为全球医疗及生命科学行业云计算引领者&#xff0c;亚马逊云科技将围绕数据、算力和行业用户体验三大需求发力&am…

MySQL百万数据深度分页优化思路分析

业务场景 一般在项目开发中会有很多的统计数据需要进行上报分析&#xff0c;一般在分析过后会在后台展示出来给运营和产品进行分页查看&#xff0c;最常见的一种就是根据日期进行筛选。这种统计数据随着时间的推移数据量会慢慢的变大&#xff0c;达到百万、千万条数据只是时间…

UWA发布 | Unity手游性能蓝皮书

最新2022年度Unity手游蓝皮书出炉&#xff01;此次发布分析了2022年1月至2023年3月期间&#xff0c;游戏行业使用Unity引擎进行手游开发过程中及游戏上线后的性能表现&#xff0c;从测试机型分布、引擎各模块开销、内存占用等方面进行汇总分析&#xff0c;反映了Unity手游行业的…

Flink dataStream,如何开窗,如何进行窗口内计算

目录 开窗方式 windowAll() window() 窗口类型 基于时间 基于数量 开窗后的处理函数 全量聚合函数&#xff08;也叫窗口函数&#xff09; 增量聚合函数 增量聚合函数携带一个全量聚合函数 开窗方式 windowAll() 对于没有keyBy的数据流 window() 对于KeyBy后的数据…

交工技术文档表格-SH3503-2001

(阀门试验记录)(管道补偿器安装记录)(管道组成件校验性检查记录)(SHA级管道管螺纹、密封面加工记录)(高压、SHA级管道弯管加工记录)(管道静电接地测试记录)管道系统安装检查与压力试验记录)管道系统泄露性与真空试验记录)(管道吹洗、清洗脱脂记录)(给排水压力管道强度及严密试验…

685页40万字某省市场监管智慧应用一体化项目(word可编辑)

1.2.3.1 数字XX公共能力建设现状 1.2.3.1.1 数字XX通用基础应用平台现状 通用基础应用平台提供具有共性特征的跨部门、跨层级业务应用&#xff0c;与本项目有关的平台包括某省网上办事大厅、某省政务服务 APP 统一平台&#xff08;X政通 APP&#xff09;、某省公共信用信息平…

一次SQL的完整处理流程

流程&#xff1a; 1. 客户端到连接器是通过TCP/IP SSL通信协议连接的&#xff0c; 2.连接器验证MySQL权限信息是否正常&#xff0c;连接量是否正常&#xff0c;长时间没有连接服务器会自动断开等等 &#xff1b; 3. 然后到解析器&#xff0c;通过客户端发过来的sql进行语法解析…

电力系统储能调峰、调频模型研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

FS2114恒流模式的PWM升压IC,内置过温、关断、欠压、过流保护

FS2114是升压DC-DC转换器。其内置0.2Ω功率MOSFET的PWM电路&#xff0c;使该稳压器具有高效率。内部补偿网络还可以程度地 减少了6个外部元件的数量。 0.6V精密基准电压&#xff0c;内部软启动功能可以减低浪涌电流。 FS2114采用SOT23-6L封装&#xff0c;为应用节省空 间PCB。…