Med-PaLM M走向通用医学AI(2023+Towards Generalist Biomedical AI)

news2024/11/18 11:30:19

摘要:

医学本质上是多模式的,具有丰富的数据模式,包括文本、成像、基因组学等。灵活编码、集成和大规模解释这些数据的通才生物医学人工智能(AI)系统可以潜在地实现从科学发现到医疗服务等有影响力的应用。为了使这些模型的发展,我们首先策划了MultiMedBench,这是一个新的多模式生物医学基准。MultiMedBench包含14个不同的任务,如医学问题回答,乳房x线摄影和皮肤病学图像解释,放射学报告生成和总结,以及基因组变体调用。然后我们介绍Med-PaLM Multimodal (Med-PaLM M),这是我们对通用生物医学人工智能系统的概念验证。Med-PaLM M是一个大型多模态生成模型,可以灵活地编码和解释生物医学数据,包括临床语言、成像和基因组学,具有相同的模型权重集。Med-PaLM M在所有MultiMedBench任务上达到了与最先进的性能竞争或超过最先进的性能,通常远远超过专业模型。我们还报告了零概率泛化到新的医学概念和任务、跨任务的正迁移学习和紧急零概率医学推理的例子。为了进一步探索Med-PaLM的能力和局限性,我们对模型生成(和人类)胸部x射线报告进行了放射科医生评估,并观察到在模型尺度上令人鼓舞的表现。在246张回顾性胸部x光片的并列排名中,临床医生在高达40.50%的病例中对Med-PaLM M报告的偏好超过放射科医生的报告,这表明了潜在的临床实用性。虽然在实际用例中验证这些模型还需要大量的工作,但我们的研究结果代表了多面手生物医学人工智能系统发展的一个里程碑。

贡献点:

1.我们推出MultiMedBench,这是一个新的多模式生物医学基准,跨越多种模式,包括医学成像、临床文本和基因组学,具有14种不同的任务,用于培训和评估通才生物医学人工智能系统。

2.Med-PaLM M是一个多任务、多模式的生物医学人工智能系统,可以使用相同的模型权重集进行医学图像分类、医学问题回答、视觉问题回答、放射学报告生成和汇总、基因组变体调用等。Med-PaLM M在MultiMedBench的多个任务上达到与最先进的(SOTA)专业模型竞争或超过最先进的性能,而无需任何特定于任务的定制。

3.除了任务绩效的定量评估之外,我们还观察到zero-shot医学推理,对新医学概念和任务的概括以及任务间的正迁移的证据。这些实验表明,这种系统在下游数据稀缺的生物医学应用中具有很大的潜力。

4.除了自动化指标外,我们还对Med-PaLM M在不同模型尺度上生成的胸部x射线报告进行放射科医生评估。在246张回顾性胸部x光片的盲法并列排名中,临床医生表示,在高达40.50%的病例中,对Med-PaLM M报告的偏好超过放射科医生的报告。此外,最好的Med-PaLM M模型平均每份报告有0.25个临床显著错误。这些结果与先前研究的人类基线相当,提示潜在的临床应用。

MultiMedBench:通用生物医学AI的基准

MultiMedBench是一个多任务、多模式的基准测试,包括12个去识别的开源数据集和14个单独的任务。它衡量了通用生物医学人工智能执行各种临床相关任务的能力。该基准涵盖了广泛的数据源,包括医学问题、放射学报告、病理学、皮肤病学、胸部x射线、乳房x光检查和基因组学。

任务类型:问题回答、报告生成和总结、视觉问题回答、医学图像分类和基因组变体调用。

模式:文本,放射学(CT, MRI和x射线),病理学,皮肤科,乳房x光检查和基因组学。

输出格式:所有任务的开放式生成,包括分类。

MultiMedBench包括5种任务类型的14个独立任务和跨越7种生物医学数据模式的12个数据集。该基准总共包含超过100万个样本。纯语言任务包括医学问题回答,包括Singhal等人中使用的三个MultiMedQA任务,以及放射学报告总结。他们被挑选出来评估模型理解、回忆和操纵医学知识的能力。多模态任务包括医学视觉问题回答(VQA)、医学图像分类、胸部x光报告生成和基因组变体调用,这些任务非常适合评估这些模型的视觉理解和多模态推理能力。表1概述了MultiMedBench中的数据集和任务——基准测试总共包含超过100万个样本。有关各个数据集和任务的详细描述,请参见章节A.1。如下图。

Med-PaLM M:通用生物医学人工智能的概念验证

 Med-PaLM M有以下结构构成:注意,Med-PaLM M不仅继承了这些预训练模型的体系结构,还继承了编码在模型参数中的一般领域知识。

Pathways Language Model (PaLM) :Chowdhery等人引入的Pathways Language Model (PaLM)是一种使用Pathways[50]训练的基于密集连接的decoderonly Transformer[45]的大型语言模型(LLM), Pathways[50]是一种大规模ML加速器编排系统,可实现跨TPU pod的高效训练。PaLM训练语料由7800亿个令牌组成,这些令牌代表了网页、维基百科文章、源代码、社交媒体对话、新闻文章和书籍的混合体。PaLM模型分别以8亿个、62亿个和5400亿个参数的大小进行训练,并且所有三个PaLM模型变体都是针对训练数据的一个历元进行训练的。在发布公告时,PaLM 540B取得了突破性的性能,在一系列多步骤推理任务上超过了经过微调的最先进模型,在BIG-bench上超过了人类的平均表现。
Vision Transformer (ViT) :Dosovitskiy等人引入的Vision Transformer (ViT)将Transformer架构扩展到图像和视频等视觉数据。在这项工作中,我们考虑了两个ViT预训练模型作为vision |5编码器,即Chen等人的40亿(4B)参数模型和Dehghani等人的220亿(22B)参数模型。这两种模型都是通过监督学习在大约40亿张图像的大型分类数据集上进行预训练的。
PaLM-E :Driess等人提出的PaLM-E是一种多模态语言模型,可以处理包括文本、视觉和传感器信号在内的多模态输入序列。主要的PaLM- e模型使用预训练的PaLM和ViT,最初是为嵌入式机器人应用开发的,但在OK-VQA和VQA v2等多种视觉语言基准上表现出色。此外,PaLM-E还提供了在单一提示中交织图像、文本和传感器信号的灵活性,使模型能够在完全多模态的情况下做出预测。PaLM-E还展示了一系列广泛的功能,包括零射击多模态思维链(CoT)推理和少量射击上下文学习。因此,我们利用PaLM-E模型作为Med-PaLM的基础架构。
在我们的研究中,我们考虑了三种不同的LLM和视觉编码器的组合- PaLM 8B与ViT 4B (PaLM- e 12B), PaLM 62B与ViT 22B (PaLM- e 84B)和PaLM 540B与ViT 22B (PaLM- e 562B)。除了Driess等人[10]所描述的跨多个机器人实施例的任务外,所有模型都在不同的视觉语言数据集上进行了预训练。
Med-PaLM M是通过微调和调整PaLM-E模型来开发的。
数据和预处理:我们将MultiMedBench中的所有图像调整为224 × 224 × 3,同时保留原始的宽高比(如果需要的话)。将灰度图像沿通道维度叠加,将灰度图像转换为3通道图像。特定于任务的预占有方法,如类平衡和图像数据增强。

指令任务提示和一次性实例:我们的目标是训练一个通用的生物医学人工智能模型,使用统一的模型架构和一组模型参数来执行具有多模态输入的多个任务。为此,我们通过指令调优同时使用不同任务的混合训练模型。具体来说,我们为模型提供了特定于任务的指令,以提示模型在统一的生成框架中执行不同类型的任务。任务提示符由一条指令、相关上下文信息和一个问题组成。例为了使模型能够更好地遵循指令,对于大多数任务,我们在任务提示符中添加了一个纯文本的“一次性范例”,以调节语言模型的预测。一次性示例帮助用部分输入-输出对提示模型。重要的是,对于多模态任务,我们用一个虚拟文本占位符(文本字符串“<img>”)替换了范例中的实际图像:这(i)保留了单图像训练的训练计算效率,并且(ii)绕过了来自多个图像的给定文本令牌和图像令牌之间交叉注意的潜在干扰。我们的结果表明,该方案在提示模型生成所需的响应格式方面是有效的。

模型训练:我们对MultiMedBench任务上PaLM-E预训练的12B、84B和562B参数变体进行了微调。这些混合比率是根据经验确定的,因此它们与每个数据集中的训练样本数量近似成正比,并确保每个任务中至少有一个样本存在于一个批次中。在训练期间更新整个模型参数集,对PaLM-E模型进行微调。对于多模态任务,图像标记与文本标记相互交织,形成PaLM-E模型的多模态上下文输入。对于所有调优任务,多模态上下文输入最多包含一个图像。然而,我们注意到Med-PaLM M能够在推理过程中处理具有多个图像的输入。我们使用动量为β1 = 0.9,dropout为0.1的Adafactor优化器[58],并采用恒定的学习率调度。在我们的微调实验中,针对不同的模型大小,我们使用了不同的超参数集。由此产生的模型Med-PaLM M (12B、84B和562B)适用于生物医学领域,具有编码和解释多模态输入的能力,并执行包括医学(视觉)问题回答、放射学报告生成和总结、医学图像分类和基因组变体调用在内的任务

实验结果:总之,最好。


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/831305.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

记录一个Spring自己注入自己的一个坑

问题代码如下&#xff1a; 原本是要在ActiveMqListener中注入ActiveMqSender方法的&#xff0c;在自动补全的时候没有注意&#xff0c;变成了图上的情况。 该问题会导致服务启动时卡住&#xff0c;不报错也没有异常信息。代码上也不会有任何提示。排查起来比较困难。在此特别记…

mysql 、sql server 常见的区别

&#xff2e;&#xff35;&#xff2c;&#xff2c;   处理 MySQL IFNULL(col , val) SQL Server ISNULL(col,val) 表名、列名等 一般不推荐用保留字 &#xff0c;如果非要保留字 MySQL 用用着重号&#xff0c;即 反引号 包括 select col from GROUP SQL Server 用用着重号…

2023-07月:人工智能趋势总结

疯狂AI周&#xff01; 我将详细介绍本周所有最重要的新闻&#xff0c;所以请坐下来&#xff0c;放松&#xff0c;享受更新&#xff01; 1. Android 版 ChatGPT 本周最令人兴奋的消息之一是宣布推出适用于 Android 的 ChatGPT 移动应用程序。 您已经可以从 Google Play 商店预…

2023年国家留学基金委(CSC)青年骨干教师项目即将开始申报

国家留学基金委&#xff08;以下简称CSC&#xff09;的青年骨干教师出国研修项目&#xff08;即高校合作项目&#xff09;&#xff0c;将于2023年9月10-25日进行网上报名及申请受理。知识人网小编特提醒申请者注意流程及政策&#xff0c;以防错过申报时间。 青年骨干教师项目&a…

从比亚迪海豹拆解,详看电机技术

样件采购请联&#xff1a;shbinzer 拆车邦 样件采购请联&#xff1a;shbinzer 拆车邦 比亚迪海豹最大的亮点就是全新的纯电平台e平台3.0&#xff0c;比亚迪最新技术的结晶&#xff0c;不仅延续了比亚迪引以为傲的超安全刀片电池&#xff0c;并且使用了电池与车身融为一体的设计…

使用tinyxml解析和修改XML文件

首先要清楚XML文件包含哪些元素&#xff1a; 他是由元素、文本或者两者混合物组成。元素可以拥有属性&#xff0c;元素是指从开始标签到结束标签的部分。 <?xml version"1.0" encoding"UTF-8" ?> <books><book id"1001">&…

企业邮箱费用详解!了解企业邮箱的费用及其相关信息

对于需要可靠的邮箱平台的企业来说&#xff0c;企业邮箱可能是最好的解决方案。有许多供应商提供企业邮箱服务&#xff0c;他们通常每月都有相应的费用。 在考虑企业邮箱的成本时&#xff0c;有几件事要记住。首先&#xff0c;您应该考虑使用邮箱服务的用户数量&#xff0c;因为…

【Leetcode】73.矩阵置零

一、题目 1、题目描述 给定一个 m x n 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 示例1: 输入:matrix = [[1,1,1],[1,0,1],[1,1,1]] 输出:[[1,0,1],[0,0,0],[1,0,1]]示例2: 输入:matrix = [[0,1,2,0],[3,4,5,2],[1,3,1…

[Linux]手把手教你制作进度条小程序

[Linux]制作进度条小程序 文章目录 [Linux]制作进度条小程序C语言中的\n和\r字符缓冲区的刷新策略进行进度条代码编写 C语言中的\n和\r字符 C语言中字符分为两种: 可显字符控制字符 其中可显字符就是字符a这类的字符&#xff0c;控制字符就是\n这种控制字符。 对于我们制作…

车载开发智能座舱技术——【Surface渲染流程】

SurfaceFlinger智能座舱技术是一种车载开发中的创新技术&#xff0c;它能够实现高效的图形渲染和多媒体处理&#xff0c;为驾驶员和乘客提供更好的车内体验。本文将介绍SurfaceFlinger智能座舱技术的概念和原理&#xff0c;并详细解析Surface的渲染流程和相关代码示例。 一、S…

解决多开 sap 瓶颈 需要用同样的权限 打开,都是administrators 或者都是 普通用户

设置排程情况下&#xff0c;用户登录时运行&#xff0c;用最高权限运行 If my problem description is very simple, sorry. But I found the reason: the startup permissions of sap and python are not the same. For example, both of these should be run with admini…

如果室温超导被验证成功,它会是算力的永动机吗?

近期&#xff0c;有韩国科学家团队表示&#xff0c;他们发现了全球首个室温超导材料。室温超导&#xff0c;即在室温条件下实现的超导现象。而“超导”是指导体在某一温度下&#xff0c;电阻为零的状态。 如果室温超导被验证成功且可以被应用&#xff0c;没有电阻的超导体基本不…

Spring Data JPA 的开发神级IDEA插件 -- JPA Buddy

1. 概述 JPA Buddy是一个广泛使用的IntelliJ IDEA插件&#xff0c;面向使用JPA数据模型和相关技术&#xff08;如Spring DataJPA&#xff0c;DB版本控制工具&#xff08;Flyway&#xff0c;Liquibase&#xff09;&#xff0c;MapStruct等&#xff09;的新手和有经验的开发人员…

SAP从入门到放弃系列之凭证批次(Documentary Batches)-Part1

目录 一、概述二、配置三、测试3.1 采购入库3.2 生产投料3.3 批次追溯 一、概述 凭证批次只是一个虚拟的批次&#xff0c;库存是不做批次管理的&#xff0c;但是通过虚拟批次可以做到物料的可追溯性。相对启用批次管理来说库存管理成本比&#xff0c;工作量更小&#xff0c;复…

通过私有化部署的企业智能名片,作用究竟有多大?

“在21世纪最为重要的是什么&#xff1f;” “是人才&#xff0c;更是人脉。” 为了拓展人际关系&#xff0c;建立更密切的联系和合作联络。在商务交流中&#xff0c;互相交换正式、可信的名片是必不可少的一环。 但是&#xff0c;你有没有意识到呢&#xff1f; 每年全球交换…

Pre-trained models for natural language processing: A survey(NLP领域预训练模型研究综述)

Pre-trained models for natural language processing: A survey(NLP领域预训练模型研究综述)_笔记 零、摘要 简洁的介绍了语言表征学习的研究进展&#xff0c;以及描述了如何将PTMs&#xff08;pre-training models&#xff09;应用于下游任务&#xff0c;并概述了未来的潜在…

树莓派更换软件源

​ 目录 1、备份源列表&#xff1a;在更改软件源之前&#xff0c;最好备份你当前的源列表文件。 2、编辑源列表文件&#xff1a;使用文本编辑器&#xff08;例如nano或vi&#xff09;打开/etc/apt/sources.list文件。 3、更换软件源&#xff1a;在文件中找到原始的官方源地…

串讲Maven本地仓库、私服、中央仓库

前言介绍 近期整理材料和搭建平台环境&#xff0c;重新系统了解了Maven一整套流程。特整理如下&#xff1a; 图1 图中分本地仓库和远程仓库&#xff1a; 本地仓库&#xff1a;自己电脑上存储资源的仓库&#xff0c;连接远程仓库获取资源。 远程仓库&#xff1a;非本机电脑上…

【多模态】ALIGN——使用噪声文本数据进行视觉语言感知预训练

ALIGN: A Large-scale ImaGe and Noisy-text embedding 目录 &#x1f36d;&#x1f36d;1.网络介绍 &#x1f36d;&#x1f36d;2.大规模噪声图像文本数据集 &#x1f438;&#x1f438;2.1图像过滤器 &#x1f438;&#x1f438;2.2文本过滤器 &#x1f36d;&#x1f3…

ubuntu服务器配置ftp服务

需求&#xff1a;配置ftp服务用于在windows电脑上直接浏览、下载、上传ubuntu服务器上的文件&#xff0c;用于文件共享&#xff0c;方便实用 效果&#xff1a;用户打开windows资源管理器后输入ftp://xxx.xxx.xxx.xxx &#xff08;公网IP地址&#xff09;后&#xff0c;即可浏览…