多模态在医疗中的应用

news2025/1/17 0:16:22

多模态是把要检索的模态融合起来,做整体的检索,查询和检索的必须至少有一个模态是相同的,也就是要查询和检索的模态都已经在融合模态里了。

跨模态是检索结果和查询的模态是不同,如图像检索文本,视频和音频。跨模态检索的关键在于对不同模态的关系进行建模,难点就是语义对齐。

今天为大家介绍的是来自Julián N.Acosta和Guido J.Falcone的一篇关于多模态生物医药AI的综述。目前大多数人工智能在医学上的应用都是使用单模态数据来处理特定的任务,例如计算机断层扫描显像(CT)和视网膜图像。

在这里插入图片描述

相比之下,临床医生在诊断、进行预后评估和决定治疗计划时,会处理来自多个源的多模态的数据。在这篇综述中,作者探索了多模态数据在个性化医疗、数字临床试验、远程监测和护理、流行病监测、数字孪生技术和虚拟健康助手方面可能的应用,并介绍了相关的数据、建模和隐私挑战以及克服这些挑战有前途的策略。

1. 概念

多模态学习框架能够从不同模态的数据中学习,而不需要不同的模型架构。理想地,统一的多模态模型将结合不同类型的数据(图像、生理传感器数据以及结构化和非结构化文本数据等),为跨模态的类似概念产生对齐的表示(例如,狗的图片,并且单词‘狗’应该产生类似的内部表示),并提供任务所要求的任意类型的输出。

在过去的几年里,已经从应用于特定模态的架构–例如用于图像的卷积神经网络,或用于文本的循环神经网络–过渡到Transformer这一相对新颖的架构,该架构已经在各种输入和输出模态和任务上显示出良好的性能。Transformer的一个很有希望的方面是能够用未标记的数据学习有意义的表示,这在生物医学人工智能中是至关重要的,因为获得高质量标记所需的资源有限且昂贵。

2. 产生的原因

3. 运作的机制

3.1 数据的收集

成功开发多模态数据支持的应用程序的第一个要求是收集、管理和协调大型注释数据集,因为再复杂的技术也无法派生出数据中不存在的信息。相关的研究,例如UK Biobank于2006年开始注册,最终参与者人数超过50万,并计划在注册后跟踪参与者至少30年。这个大型生物库从参与者那里收集了多层数据,包括社会人口统计和生活方式信息、身体测量、生物样本、12导联心电图和EHR(电子健康记录)数据。其他国家也开展了类似的活动,如China Kadoorie Biobank和Biobank Japan等等。

这些数据集中的多模态数据的可用性可能有助于在一系列不同的任务中实现更好的诊断性能。例如,最近的工作表明,在识别肺栓塞和区分急性呼吸衰竭的常见原因(如心衰、肺炎或慢性阻塞性肺疾病)方面,影像学和电子病历数据的结合优于单独的每种模式。

4. 存在的问题

4.1 数据的获取

在生物医学人工智能的设置中,数据可能并不容易获得,因为原始数据打标签, 需要该领域的专家知识。

这一问题的一个可能的解决方案是利用一种模态的可用数据来帮助使用另一种模态进行学习,这是一种称为“共同学习”的多模态学习任务。例如,一些研究表明,对未标记的语言数据进行预训练的Transformer可能能够很好地推广到其他任务。在医学方面,一种名为“CycleGans”的模型架构,它用非配对的非对比或对比CT扫描图像进行训练,被用于生成非对比或对比CT扫描图像。

多维数据在收集、链接和注释这些数据方面带来了广泛的挑战。医学数据集可以沿着多个轴进行描述,包括样本大小、表型分析的深度、随访的时间和间隔、参与者之间的互动程度、参与者的异质性和多样性、数据的标准化和协调程度以及数据来源之间的关联度。

数据的挑战有以下几个方面。第一,生物医学数据集的多样性至关重要,因为它是确保推广到更广泛人群的第一步。第二,多模态人工智能的一个必要步骤是将数据集中可用的所有数据类型适当地联系起来,这是另一项挑战。第三,是丢失数据的比例通常很高。虽然在某些情况下,在训练前简单地排除有缺失数据的患者是一种选择,但当其他因素影响缺失数据时,可能会出现选择偏差,而且通常使用统计工具来弥补这些缺失更合适,例如多重插补。第四,在进行收集健康数据的研究时,会有引起几种偏见的风险,需要采取多种方法来监测和减轻这些偏见

4.2 特征的维度

另一个重要的建模挑战与多模态健康数据中包含的极高数量的维度有关,统称为“维度诅咒”。随着维度数量的增加,携带这些特征的某些特定组合的人的数量减少,从而导致数据集盲点,即特征空间的一部分没有任何观测。这些数据集盲点可能会损害模型在现实生活预测方面的性能。

可以使用几种策略来缓解这一问题。第一种,使用最高性能的任务收集数据(例如,用于运动控制的快速手指敲击,而不是日常运动中被动收集的数据)。

第二,确保大而多样的样本量(即条件与模型临床部署时预期的条件相匹配)。

第三,使用领域知识指导特征工程和选择,适当的模型训练和正则化,严格的模型验证和全面的模型监测(包括监测训练数据和部署后发现的数据之间的差异)。

展望未来,开发能够整合先前知识的模型(例如,已知的基因调控途径和蛋白质相互作用) 可能是克服维度诅咒的另一种有希望的方法。

4.3 模态融合的方式

在多模态学习中,组合来自不同模态的数据的过程被称为“多模态融合”,这不是简单地将几个模态分别输入到模型中。不同数据模态的融合可以在该过程的不同阶段进行。最简单的方法包括在任何处理之前串联输入模态或特征(早期融合)。虽然简单,但这种方法并不适用于许多复杂的数据模态。一种更复杂的方法是在训练过程中组合并共同学习这些不同模态的表示(联合融合),允许特定于模态的预处理,同时仍然捕获数据模态之间的相互作用。最后一种方法是为每种模态训练单独的模型,并结合输出概率(后期融合),这是一种简单而稳健的方法,但错过了从模态之间的相互作用中提取信息的机会。

4.4 算力的需求

与多模态模型相关的许多其他重要挑战仍然存在。对于一些模态(例如,三维成像),即使只使用单个时间点的模型也需要很大的计算能力,而同时处理大规模组学或文本数据的模型是一个重要的基础挑战。

4.5 数据隐私

多模态人工智能在健康领域的成功发展需要数据的广度和深度,这包含了比单一模态人工智能模型更高的隐私挑战。研究人员提出和探索了多种技术解决方案,以确保在训练多模态人工智能模型的同时确保安全和隐私,包括差异隐私、联邦学习、同态加密和群学习。

边缘计算也可以用于保护隐私。与云计算相反,边缘计算指的是让计算更接近数据来源的想法(例如,接近环境传感器或可穿戴设备)。与联邦学习等其他方法相结合,边缘计算通过避免将敏感数据传输到中央服务器来提供更高的安全性。

5. 现有的解决方法

6. reference

Acosta, J.N., Falcone, G.J., Rajpurkar, P.et al.Multimodal biomedical AI.Nat Med(2022)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/96322.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022-12-17 TCP/IP 协议栈_2

TCP/IP 协议栈_2前言一、TCP/IP协议栈四层协议系统二、封装和分用总结前言 既然要学习计算机网络编程, 就不得不提计网祖师爷 W Richard Stevens, 天妒英才, 先生于1999年就早早陨落. 不知多少人凭着先生所著 “TCP/IP详解” 以及 “UNIX网络编程” 吃的盆满钵满. 而至今可说还…

深入浅出 - Rust 所有权与内存管理机制

一、从变量说起 fn main() {// 基本数据类型let a 5;let b a;// 指针let ptr_a &a;let ptr_b &b;println!("a value {}", a);println!("b value {}", b);println!("ptr_a value {:p}", ptr_a);println!("ptr_b value {:p}…

未来笔试重点(1)

一起成为更优秀的人 1.数组笔试重点考察 1.1整型数组与sizeof 1.2字符数组与sizeof 1.3sizeof与字符串 1.4strlen与字符串 2.指针笔试重点考察 2.1指针与sizeof 2.2指针与strlen sizeof与整型数组 int a[] { 1,2,3,4 };printf("%d\n", sizeof(a));printf(…

NMS与Soft NMS算法解析以及numpy实现

1. NMS算法 1.1 什么是NMS算法 NMS全称为Non Maximum Suppression,中文意思是非极大值抑制,字面意思就是不是极大值的元素被抑制掉,其实就是筛选出局部最大值得到最优解。NMS算法被广泛运用于目标检测算法处理网络输出的边界框。 1.2 为什…

浅谈Linux内核页面换入换出

【推荐阅读】 浅谈linux 内核网络 sk_buff 之克隆与复制 深入linux内核架构--进程&线程 了解Docker 依赖的linux内核技术 怎么在Windows下使用Makefile文件 浅析linux内核网络协议栈--linux bridge 0x00内存页面分类与换入换出规则 内存页面分为用户页面和内核页面。…

GDT践行(第一期):起床---运动--阅读

这里记录每周GDT践行记录.【2022】年第【51】周的第【6】天 封面图 第三部分:起床---运动--阅读 ❝ 小贴士: 在学校,出租房,宾馆,工位很多因素导致 学习区,运动区 卧室 都是同一个地方 环境导致你彻底彻底糊…

[附源码]Python计算机毕业设计Django课程在线测评系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

JVM部分知识点

目录 JVM主要组成部分及其作用? JAVA程序运行机制详情 JVM运行时的数据区 堆和栈的区别? Java垃圾回收机制 Java中有哪些引用类型? 如何判断对象是否可以被回收? JVM中的永久代会发生垃圾回收吗? JVM有哪些垃圾…

我国航空煤油行业发展趋势:燃油附加费复收 或将缓解企业经营压力

根据观研报告网发布的《中国航空煤油市场现状深度研究与投资前景分析报告(2022-2029年)》显示,航空煤油是石油产品之一,别名无臭煤油,主要由不同馏分的烃类化合物组成。航空煤油密度适宜,热值高&#xff0c…

【C语言】浮点型的存储方式

目录 一、浮点型和整型存储方式一样吗? 二、浮点型的存储规则 2.1 S,M,E求法 2.2 如何存放S,M,E 2.2.1 IEEE 754规定 2.2.2 特别的规定 2.2.3 验证 2.3 取出规则 2.3…

改造冰蝎马,实现免杀之default_aes php

本专栏是笔者的网络安全学习笔记,一面分享,同时作为笔记 文章目录 文章目录文章目录前文链接前言效果目标密码验证功能免杀后话前文链接 WAMP/DVWA/sqli-labs 搭建burpsuite工具抓包及Intruder暴力破解的使用目录扫描,请求重发,漏…

[附源码]Python计算机毕业设计黑格伯爵国际英语贵族学校官网Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

5G无线技术基础自学系列 | 单站点验证概述

素材来源:《5G无线网络规划与优化》 一边学习一边整理内容,并与大家分享,侵权即删,谢谢支持! 附上汇总贴:5G无线技术基础自学系列 | 汇总_COCOgsta的博客-CSDN博客 单站点验证是指在基站硬件安装调试完成…

RNA-seq 详细教程:可视化(12)

学习内容 了解如何为可视化准备数据了解如果利用可视化来探索分析结果火山图可视化热图可视化可视化结果 当我们处理大量数据时,以图形方式显示该信息以获得更多信息,可能很有用。在本课中,我们将让您开始使用探索差异基因表达数据时常用的一…

【数电实验】移位寄存器与计数器

实验四 移位寄存器与计数器 一 实验目的 1 掌握任意进制计数器的构成方法; 2 熟悉双向移位寄存器的使用方法。 二 实验内容 1 任意进制计数器的构成方法: 用中规模集成计数器74HC161和与非门74LS00,构成十进制计数器。要求分别使用同步预…

精华推荐 | 【深入浅出RocketMQ原理及实战】「性能原理挖掘系列」透彻剖析贯穿RocketMQ的事务性消息的底层原理并在分析其实际开发场景

什么是事务消息 事务消息(Transactional Message)是指应用本地事务和发送消息操作可以被定义到全局事务中,要么同时成功,要么同时失败。RocketMQ的事务消息提供类似 X/Open XA 的分布事务功能,通过事务消息能达到分布式事务的最终一致。 事务消息所对应的场景 在一些对…

docker学习笔记(五)单个服务镜像部署

引言 当前微服务项目已经大面积普及,对于新需求迭代上线有许多疑惑的部分,比如线上的某些功能不能重启,在这种情况下我们需要部署和启动项目就不能搞大范围重启或干脆重新制作镜像,这种方式都是不可取的,这时候就需要…

重学webpack系列(二) -- webpack解决的问题与实现模块化的具体实践

只是根据几个想法,我们便创造出了webpack打包工具,它能够根据我们在前端项目中遇到的疑难杂症对症下药,那么这一章我们就一起来探讨一下我们项目落地所遇到的种种问题。 前端实践中的问题 Jsx / Tsx编译问题Less / Scss编译问题TypeScript编…

【Pintos】实现自定义 UserProg 系统调用 | 添加 syscall-nr 系统调用号 | 编写新的参数调用宏

💭 写在前面:本文讲解的内容不属于 Pintos 的 Project 项目,而是关于 userprog 如何添加系统调用的,学习如何额外实现一些功能到系统调用中以供用户使用。因为涉及到 src/example 下的Makefile 的修改、lib 目录下 syscall-nr 系统…

门诊排队叫号系统,有序叫号就诊,适用医院医院、门诊部、诊所等

排队叫号系统,是将互联网信息技术与门诊预约、签到、提醒、叫号、接诊等环节相结合,实现门诊流程式便捷叫号服务。 为助力门诊营造一个良好有序的就诊环境,打造科学合理的就诊流程,今天给大家推荐一款一款便捷排队叫号系统&#x…