AI在医学领域:HMARL首个多器官诊断AI框架

news2024/9/26 1:17:48

        多器官疾病因其对多个器官系统的同时影响而带来了显著的挑战,这需要复杂和适应性的治疗策略。尽管在人工智能驱动的医疗决策支持系统方面取得了最新进展,但现有的解决方案通常限于单个器官系统。它们往往忽视了器官系统之间复杂的相互依赖性,因而未能提供在实际应用中有用的全面治疗建议。例如,COVID-19这种疾病,虽然主要影响呼吸系统,但也可能引起免疫系统、神经系统和消化系统的功能障碍。另一种例子是脓毒症,这是一种严重的状况,由身体对感染的反应失调触发。脓毒症可能导致广泛的炎症、凝血异常和代谢紊乱,进而演变为多器官功能障碍,这需要全面和适应性的治疗策略。 

       本文提出HMARL框架,通过为每个器官系统分配专门的智能体,并模拟智能体间的动态交互,实现跨器官的协调治疗策略。

其他类似文章:

AI在医学领域:GluFormer一种可泛化的连续血糖监测数据分析基础模型

MMII 的多模态医学图像交互框架:更直观地理解人体解剖结构和疾病

1 方法

分层的多智能体强化学习(HMARL)系统

  • 根智能体(MRt):负责选择五种主要行动之一,包括无治疗(A0 Rt)、仅神经(ANeu Rt)、仅心血管(ACar Rt)、仅肾脏(ARen Rt)或器官混合(AOMix Rt)。
  • 神经特定智能体(MNeu):当选择神经特定行动时,会调用此智能体。它从四种可能的行动中选择:仅S1(AS1 Neu)、仅S2(AS2 Neu)、仅S3(AS3 Neu)或它们的混合(AMix Neu)。
  • 心血管特定智能体(MCar):当选择心血管特定行动时,会调用此智能体。它从三种可能的行动中选择:仅IV(AIV Car)、仅Vaso(AV A Car)或IV和Vaso的混合(AMix Car)。
  • 肾脏特定智能体(MRen):当选择肾脏特定行动时,会调用此智能体。它直接从四种利尿剂水平或透析中选择。
  • 器官混合智能体(MOMix):当推荐复杂的多器官治疗时,会调用此智能体。它通过与其他器官特定智能体(MNeu、MCar、MRen)进行器官间通信来访问它们的剂量建议。
  • 内部器官通信:在同一器官系统内,当推荐单一器官的剂量混合时,相关的子智能体会进行通信,以便混合智能体可以整合来自各自子智能体的见解。
  • 器官间通信:在推荐复杂的多器官治疗时,MOMix智能体会与其他器官特定智能体进行通信,以获取它们的治疗建议

1.1 层次化分解

将复杂的多器官治疗推荐任务分解为可管理的子任务,每个子任务由专门的子智能体处理。

  • 根智能体:选择主要行动,包括不治疗、仅神经治疗、仅心血管治疗、仅肾脏治疗或器官混合治疗。
  • 器官特异性智能体:根据根智能体的选择,推荐特定器官的治疗方案,例如神经系统的麻醉、镇痛和镇静,心血管系统的静脉输液和血管加压药,肾脏系统的利尿剂和透析。
  • 混合智能体:当需要推荐复杂的多器官治疗方案时,混合智能体通过跨器官通信与器官特异性智能体协作,整合来自不同器官的信息,并选择合适的治疗方案组合。
  • 1.2 强化学习组件

1.2.1 状态

  • 统一状态表示:在根智能体级别,学习统一的特征表示,提取患者健康状况的广泛指标及其动态变化,为后续更细致的推荐奠定基础。
  • 目标状态表示:在器官级别,对统一状态表示进行微调,学习与特定器官相关的特征表示,例如心脏功能指标或肾功能指标。

1.2.2 行动

每个智能体操作在自身局部状态和行动空间内,选择合适的治疗方案或治疗方案组合。

1.2.3 奖励

混合奖励系统,包括基于死亡率的终端奖励和基于临床指导的间歇奖励,确保智能体能够学习到有效的治疗策略。

1.3 Q学习

  • 使用选项框架和半马尔可夫决策过程进行学习,允许智能体执行单步或多步行动,并根据行动的执行情况更新 Q 值。
  • 根智能体的 Q值更新依赖于其选择的行动和器官特异性智能体的 Q 值。
  • 器官特异性智能体的 Q 值更新依赖于其选择的行动和接收到的奖励。
  • 混合智能体使用 QMix 架构进行训练,将子智能体的 Q 值合并为一个统一的 Q值,并通过单调性约束确保一致性决策。
  • 1.4 训练过程

  • 第一阶段:训练根智能体,学习统一的特征表示。
  • 第二阶段:使用训练好的根智能体学习到的特征表示,训练器官特异性智能体和混合智能体。

2 实验

     HMARL 框架在管理脓毒症(一种复杂的多器官疾病)方面进行了广泛的实验评估。

2.1 数据集

  • 使用 MIMIC-IV 数据库中 30,440 名符合 Sepsis-3 诊断标准的患者数据。
  • 数据范围从诊断前 24 小时到诊断后 48 小时,形成最多 72 小时/患者的窗口。
  • 患者状态数据包括 48 个生理测量值,如生命体征、实验室检测结果、严重程度评分和人口统计数据。
  • 数据被分为 75% 的训练集和 25% 的测试集。

2.2 基线模型

  • Clinician: 从测试集中记录的临床医生行动轨迹中提取的策略。
  • Single D3QN (D3QN-S): 使用 Dueling DQN 的单智能体模型,预测所有动作组合。
  • Single SoftAC (SoftAC-S): 使用 Soft Actor-Critic 的单智能体模型,预测所有动作组合。
  • Organ-specific D3QN (D3QN-O): 三个独立的 D3QN 智能体,分别对应神经、心血管和肾脏系统。
  • Treatment-specific D3QN (D3QN-T): 六个独立的 D3QN 智能体,分别对应 S1、S2、S3、IV、血管加压素和利尿剂/透析。
  • Organ-coordinated QMix (QMix-O): 使用 QMix 混合网络的三智能体合作模型,每个智能体对应一个器官系统。
  • Treatment-coordinated QMix (QMix-T): 使用 QMix 混合网络的六智能体合作模型,每个智能体对应一个治疗水平。

2.3 评估指标

2.3.1 平均回报 (Average Returns)

使用 VCWPDIS指标评估学习到的策略的平均回报,该指标考虑了学习策略和临床医生策略之间的共同子轨迹。

2.3.2 死亡率 (Mortality Rate)

使用临床医生策略中死亡率和预期回报之间的关系来估计学习策略的死亡率。

2.3.3 死亡率与预期回报的关系 (Mortality vs. Expected Return)分析死亡率与预期回报之间的相关性,有效策略应显示强负相关性。

(a) D3QN-S(单智能体Dueling DQN)

(b) SoftAC-S(单智能体Soft Actor-Critic)

(c) QMix-O(器官协调QMix)

(d) QMix-T(治疗协调QMix)

(e) 提出的方法(本研究提出的HMARL模型)

2.3.4 死亡率与推荐剂量差异的关系 (Mortality vs. Difference in Recommended Dosage)

分析死亡率与临床医生和学习策略之间推荐剂量差异的关系,有效策略应与导致低死亡率的临床医生剂量一致,并偏离导致高死亡率的剂量。

2.4 结果

  • HMARL 模型在平均回报、死亡率、死亡率与预期回报的关系以及死亡率与推荐剂量差异的关系方面均优于所有基线模型,包括临床医生策略。
  • HMARL 模型的个体智能体也表现出有效的局部策略,进一步增强了整体策略的可靠性。
  • HMARL 模型的策略与临床医生策略在多器官治疗决策方面存在一定的一致性,尤其是在与患者生存相关的决策上。
  • HMARL 模型的双层状态表示和跨智能体通信机制对处理任务复杂性至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2121248.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

搜维尔科技:SenseGlove触觉反馈数据手套为人形机器人遥操作提供精确的控制和交互方案

SenseGlove触觉反馈数据手套 使用市场上唯一一款结合力反馈、振动触觉反馈和运动捕捉以及紧凑无线设计的触觉手套来收集数据。 遥操作机器人 远程机器人向人类提供触觉反馈,提供更强的真实感和更高的性能,以及安全性和控制力。远程机器人的 SenseGlov…

适用于BLE室内定位系统的自适应路径损耗模型

自适应路径损耗模型(ADAM):提升BLE室内定位精度的创新方法 室内定位系统(IPS)在物联网、智慧城市等领域中扮演着至关重要的角色。然而,由于室内环境的复杂性(如信号多径效应、障碍物等),传统的定位方法往往面临精度不足的问题。本文介绍了一种新颖的模型——ADAM(Ad…

【毕设项目五】基于SpringBoot+VUE的公共卫生教育与宣传系统

基于SpringBootVUE的公共卫生教育与宣传系统 项目介绍 系统有两种角色:管理员和普通用户。 (1)健康教育资源 (2)活动管理 (3)反馈与建议 (4)用户管理 管理员实现功…

快速上手指南:在Windows系统中下载Ollama,一键启动大模型体验!

1. 下载ollama 官网下载安装: ollama.com 2. 拉取大模型 llama 3.1 终端中输入 ollama pull llama3.1,等待安装 3. 运行 llama3.1 ollama run llama3.1接下来就可以和模型对话了 退出 /bye运行 /? 查看更多聊天中命令 其他 ollama github&#x…

150Kg载重履带式无人车底盘技术详解

150Kg载重履带式无人车底盘,作为现代智能移动平台的重要组成部分,专为复杂地形作业设计,如野外勘探、灾难救援、农业自动化及军事侦察等领域。该底盘集成了先进的动力技术、稳定的履带行走系统、精准的遥控与控制系统以及模块化的设计理念&am…

[数据集][目标检测]河道垃圾检测数据集VOC+YOLO格式2274张8类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2274 标注数量(xml文件个数):2274 标注数量(txt文件个数):2274 标注…

【安全知识】访问控制模型DAC、MAC、RBAC、ABAC有什么区别?

不同的公司或软件提供商,设计了无数种控制用户访问功能或资源的方法。但无论哪种设计,都可归到四种经典权限模型里——自主访问控制(DAC, Discretionary Access Control)、强制访问控制(MAC, Mandatory Access Control)、基于角色访问控制(RBAC, Role-ba…

SprinBoot+Vue高校就业管理系统设计与实现的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质…

C语言代码练习(第十九天)

今日练习: 52、有一个已经排好序的数组,要求输入一个数后,按原来排序的规律将它插入数组中 53、输出"魔方阵"。所谓魔方阵是指它的每一行,每一列和对角线之和均相等。 54、找出一个二维数组中的鞍点,即该位置…

如何判断两个ip地址在同一子网

在电脑网络中,了解如何判断两个IP地址是否位于同一子网是一项基础而重要的技能。这对于网络管理、故障排查以及安全策略的实施都至关重要。下面就一起跟着虎观代理小二了解一下吧。 要判断两个‌IP地址是否在同一子网,可以通过以下步骤进行:‌…

Bootstrap简介

Bootstrap 一.Bootstrap简介 什么是Bootstrap? Bootstrap 是一个用于快速开发 Web 应用程序和网站的前端框架。Bootstrap 是基于 HTML、CSS、JAVASCRIPT 的。 为什么使用Bootstrap? 快速开发:Bootstrap 提供了一套预设的CSS样式和JavaScript组件,如…

SAP B1 营销单据 - 单据字段介绍(上)

背景 营销单据,SAP B1 中一群神秘的单据,在官方说明文档中并未指明【营销单据】范围,却经常使用这一说法。它们结构相似,在 用户定义字段(UDF) 功能里统一受【营销单据】部分增加字段的影响,可以相互复制(…

骨传导耳机哪个牌子最好?深度优选五款优质精品机型

身为有着多年工作经验的数码博主,在近期工作中发现,许多人因为选择了不合适的劣质骨传导耳机,非但没有享受到音乐与通话的便捷与舒适,反而出现了听力损伤的情况。在这里跟大家说一下,选择骨传导耳机不要盲目选择&#…

[翻译] Vue 3.5 发布

翻译自 vue 官方博客 地址:https://blog.vuejs.org/posts/vue-3-5 今天,我们很高兴地宣布 Vue 3.5 “Tengen Toppa Gurren Lagann” 发布! 此次要版本不包含任何重大更改,并且包括内部改进和有用的新功能。我们将在这篇博文中介绍…

ETL数据集成丨MySQL到MySQL的数据迁移实践

前言 MySQL数据迁移至另一MySQL数据库的过程,不仅是数据复制或移动的操作那么简单,它还涉及到一系列策略性考量和技术优化,旨在实现数据的高效、安全传输,以及确保目标系统的高性能运行。其深远意义在于为企业的数字化转型提供强…

智慧水务建设的基本内容

智慧水务解决方案的主要对象客户是全国各地水务投资集团、水务局、水司、水厂、农水办,也会有少量项目涉及到住建局或城管局。解决方案通常会以具体的某个业务单位的职能工作为切入点,配合物联感知、大数据分析、人工智能等技术手段,为城市供水、乡村供水的水质安全、供水调…

纯CSS实现海浪文字效果

如图所示,这是一个很炫酷的文字波动效果,文字呈现出一个海浪波动的效果,这样的动画效果可以显著加强文案本身的含义。本文将解析如何使用纯CSS实现这个特效,基于这个动图可以分析出实现这个效果的主要功能要点: 整体呈…

室内小间距LED显示屏操作指南

随着LED显示技术的迅速发展,小间距LED显示屏在城市的各个角落逐渐普及。它不仅提升了城市形象,还丰富了人们的日常生活。小间距LED显示屏以其高清、节能等特点,广泛应用于各类室内场景,如会议室、展览馆、指挥中心等。然而&#x…

嵌入式鸿蒙系统开发语言与开发方法分析

大家好,今天主要给大家分享一下,HarmonyOS系统的主力开发语言ArkTS语言开发方法,它是基于TypeScript(简称TS)语言扩展而来。 第一:ArkTS语言基本特性 目的:声明式UI,让开发者以更简洁,更自然的方式开发高性能应用。 声明式 UI基本特性: 基本UI描述:ArkTS定义了各种装饰…

【STM32 Blue Pill编程】-定时器输入捕获与频率计数

定时器输入捕获与频率计数 文章目录 定时器输入捕获与频率计数1、定时器介绍2、硬件准备及接线2、模块配置2.1 定时器配置2.2 串口配置3、信号频率测量计算4、代码实现在本文中,将介绍在STM32CubeIDE中配置定时器的工作模式为输入捕获模式,并通过编程对外部输入信号进行频率计…