Agent心理诊所上线!基于1.3K抑郁症问诊对话,上海交大团队搭建大模型对话Agent,可初诊抑郁症

news2024/10/9 21:42:38

心理健康问题是当今社会最大的挑战之一,根据 WHO 的世界心理健康报告,约有 2 亿 4,600 万人患有抑郁障碍,平均每 10 万人中就有 3,153 个案例,可以说,这是最常见的精神障碍之一。

然而,如今在心理健康方面的医疗资源仍然不足,尤其是在低收入和中等收入国家。此外,在所有国家和地区,专业的心理健康医疗资源主要集中在城市和大型机构,造成了医院资源分配的不平衡, 使得饱受抑郁障碍等精神障碍折磨的患者,难以及时获取相应的医疗辅助。

为了更好地分配医疗资源,缓解资源紧张的困境,高效且准确的自动化抑郁症诊断方法重要且关键。在多种自动化的诊断方法中,对话智能体 (Conversational Agents) 因其成本效益、节省时间和维护用户匿名性而被认为十分有效。值得注意的是,当诊断对话不断深入,Agent 的对话策略需要随患者的精神状态以及医患关系的进展而变化, 这无疑为对话 Agent 的搭建提出了严峻挑战。

针对上述问题,上海交通大学 X-LANCE 实验室吴梦玥老师团队与德克萨斯大学阿灵顿分校 UTA、天桥脑科学研究院 (TCCI) 和 ThetaAI 公司一同合作,搭建了一种自动化大模型对话 Agent 模拟系统——智能体心理诊所 AMC (Agent Mental Clinic), 用于抑郁症的初步诊断。这一系统可以同时模拟精神科医生和潜在抑郁症患者,并模拟抑郁症问诊对话。此外,为了优化对话流程,指导精神科医生,AMC 还设计了一个指导员的角色,为精神科医生提供下一轮对话的指导,系统中的所有角色,都是既可以由真人扮演或由大模型实现。

为了更好地适应诊断环境的需求,AMC 利用流行的大模型 Agent 构建的思路,同时还提出了三层记忆存储结构和全新的记忆检索机制,以实现更高效准确的抑郁症问诊和初筛。这一对话系统不仅可以用于对潜在抑郁症的患者进行初步筛查,还可以用于对实习精神科医生或者学生进行培训,在正式进入科室实习前提供一些辅导和帮助。而可由专业精神科医生扮演的指导员角色,也为基于大模型的精神科医生 Agent 提供了可行的优化思路。

相关研究以「Depression Diagnosis Dialogue Simulation: Self-improving Psychiatrist with Tertiary Memory」为题,已发表预印本。

研究亮点:

  • 搭建了一个新型的对话 Agent 模拟系统,模拟患者 Agent 和精神科医生 Agent 之间的诊断会话,为培训实习精神科医生和初步筛查潜在抑郁症患者提供了有效的新方法。

  • 提出创新的三层式记忆结构和记忆检索模块,增强 Agent 在诊断阶段总结技能,为未来在抑郁症诊断和对话模拟的优化提供全新的方向。

  • AMC 系统在抑郁症诊断和自杀预测方面都有提升,且该框架可应用于其他特定领域,适合有限标注案例的训练。

在这里插入图片描述

论文地址:
https://arxiv.org/abs/2409.15084

开源项目「awesome-ai4s」汇集了百余篇 AI4S 论文解读,并提供海量数据集与工具:

https://github.com/hyperai/awesome-ai4s

D4 数据集,经专业医生核验

D4 数据集是由吴梦玥老师团队采集并经过专业医生质量核验的。 对话数据集的收集有 3 个阶段:

  • 在社交媒体等平台发放问卷,搜集并建构真实潜在抑郁症患者的个人画像。
  • 招募并培训模拟患者和模拟医生,为模拟患者提供采集到的抑郁症患者画像,然后让模拟医生和模拟患者进行抑郁症问诊对话。
  • 将采集到的模拟对话交由专业的精神科医生,对问诊对话的质量进行核验,并对质量合格的对话进行抑郁症严重程度的诊断和症状总结。

在这里插入图片描述

收集 D4 数据集的 3 个阶段

经过采集和核验后,吴梦玥老师团队一共搜集了 1,339 段满足质量的对话用于组建抑郁症问诊数据集 D4,抑郁症程度分为无(430 段对话),轻度(342 段对话),中度(368 段对话),和重度(199 段对话)四个大类,平均对话轮数为 21.6 轮。之后,吴梦玥老师团队提出 SEO 抑郁症症状诊断标注框架对 D4 数据集进行了标注。

在这里插入图片描述

创新的三层式记忆结构和记忆检索模块

研究人员提出了一种三层的记忆存储结构和全新的记忆检索机制的自动化大模型对话 Agent 模拟系统,包括 3 个模块:
患者 (Patient) Agent: 利用基于 D4 用户画像和抑郁症问诊对话提取出的用户信息,对患者 Agent 进行初始化的操作。AMC 从 D4 中选取了 100 个经典案例作为训练集,利用 GPT-4 提取问诊对话中的事件信息作为患者初始的记忆节点。

精神科医生 (Psychiatrist) Agent: 利用了 ICD-11 中对于抑郁障碍的描述和诊断依据进行初始化,并随着诊断的进行积累患者的电子病历和总结出的诊断技能。

指导员 (Supervisor) 插件: 用于比较精神科医生 Agent 对患者 Agent 诊断的结果,并总结经验交由精神科医生 Agent 存储。

在这里插入图片描述

AMC 系统概览

整个 AMC 系统的运作流程如图所示,一共有 6 个步骤:

  1. 利用基于 D4 采集到的由 GPT-4 生成的患者画像初始化一批患者 Agent。其中抑郁障碍的诊断结果在患者的问诊的过程中不会提供给患者 Agent。2. 患者 Agent 和精神科医生 Agent 进行抑郁症问诊聊天。

  2. 在第二步的过程中,指导员插件会根据对话的进行追踪患者提及的症状并提供下一步的对话建议给精神科医生 Agent。

  3. 在问诊对话结束后,指导员插件比较精神科医生 Agent 最后对患者的诊断结果和 D4 中存储的真实医生的诊断结果。5. 指导员插件将根据诊断结果的比较,总结出提供给精神科医生 Agent 的指导意见,并将其提供给精神科医生 Agent。

  4. 结束一次问诊流程后,精神科医生呼唤下一个患者 Agent 来进行诊断,重复这一流程。

在这里插入图片描述

AMC 系统运作流程

为了更好的检索适应的记忆来处理对话和诊断,研究人员建构了三层的 Agent 记忆架构:对话历史,电子病历,和总结技能。 其中:

  • 对话历史 (Diagnosis History) 是当前对话的历史纪录;

  • 电子病历 (Electronic Medical Records) 是在每个患者问诊结束后由精神科医生 Agent 总结的对话摘要,包括患者的主诉、症状和一些其他事件类信息;

  • 总结技能 (Diagnosis Skills) 是由指导员插件总结并存储进精神科医生 Agent 记忆中的指导意见,为后续优化对话流程,诊断准确性都有帮助。

在这里插入图片描述

AMC 的三层记忆架构

实验结论:提升抑郁症与自杀倾向诊断准确率

为评估 AMC 的有效性,研究人员在 D4 的测试集上做了 2 组实验。

其一是利用 D4 的原始对话作为精神科医生 Agent 和患者 Agent 的问诊对话进行诊断,用于检验模型的诊断能力。其二是通过精神科医生 Agent 和患者 Agent 之间的对话进行诊断,综合考察 Agent 的角色扮演能力和诊断能力。

研究人员分别统计了在抑郁障碍和自杀倾向上的诊断准确率(类别均为无,轻度,中度,和重度)。通过比较加入层次结构的记忆和没有记忆的 AMC 系统,结果证明在测试集上模型的整体表现都有提升,验证了 AMC 在利用层次化记忆架构上的有效性,无论是单纯的诊断还是对话+诊断,都能有一定的提升。

在这里插入图片描述

抑郁症诊断的实验结果

为了进一步验证三层记忆结构的有效性, 研究人员进行了消融实验,同时增加电子病历和总结技能的记忆,能对模型的准确率带来稳定的提升,证明了三层记忆结构的有效性。

在这里插入图片描述

三层记忆结构的消融实验结果

为了验证指导员插件的有效性, 研究人员也进行了插件的消融实验。实验表明,指导员插件也对 AMC 系统的架构起到了一定的提升效果。

在这里插入图片描述

指导员插件的消融实验结果

探索声音的奥秘

近年来,AI 在多种疾病的诊疗中展现出强大能力,例如基于语音实现呼吸疾病、肠胃疾病的检测。而精神疾病诊疗则是由于缺乏高质量的相关数据,而进展缓慢。究其原因,精神疾病患者大多数仍存在病耻感,加之相关诊疗记录涉及患者隐私,所以难以形成规模化的数据集供 AI 模型训练所用。

而吴梦玥课题组的主要研究方向便是计算精神病学与音频理解中的病理语音研究, 上述研究所采用的 D4 数据集是她带领团队构建的全球第一个符合临床标准的开源抑郁症问诊对话数据集,为相关研究提供了扎实的基础。

值得一提的是,吴梦玥老师的个人经历也非常丰富,拥有心理声学研究背景,致力于将AI与心理健康研究相结合。HyperAI超神经曾与吴梦玥老师进行深度访谈,点击查看完整报道:上海交大吴梦玥:用言语智能技术,为精神疾病开出第一张诊疗单。

本研究论文的第一作者是上海交通大学电子信息与电气工程学院计算机系博士兰焜耀, 他本科毕业于上海交通大学信息安全专业,主要研究方向为精神疾病诊疗对话系统,曾获 2023 数学医学技术及应用创新大赛二等奖,第十三届全国大学生信息安全竞赛一等奖。

在这里插入图片描述

上海交通大学电子信息与电气工程学院计算机系博士兰焜耀

其课题组所属的上海交大 X - LANCE 实验室全称为上海交通大学跨媒体语言智能实验室, 成立于 2012 年,前身是智能语音实验室 (SpeechLab),经过多年发展,成为了涵盖视听文语言信息处理核心各研究领域的「跨模态语言智能实验室」。

在这里插入图片描述

实验室 12 周年合影

目前,跨媒体语言智能实验室的教师组有 1 位教授、4 位副教授和 1 位科研助理,拥有超 20 名博士研究生,超 30 名硕士研究生,还包括 ACM 班、AI 班、IEEE 班、电院 CS 等专业、巴黎卓越工程师学院、密西根学院等的超 30 名本科生。

实验室获得了包括国家重点研发计划、自然科学基金委优秀青年科学基金在内的诸多国家和企业项目支持。实验室与思必驰科技股份有限公司深度合作,成立了「上海交通大学思必驰智能人机交互联合实验室」。实验室可调动丰富的数据资源以及多达数百块 H800、A800、A10 等 GPU 卡的丰富计算资源,是国际上极少数可以进行产业级大尺度数据分析和研究的人工智能实验室之一。

欢迎心理学背景以及对计算心理健康感兴趣的同学加入研究~
实验室主页:

https://x-lance.github.io/zh/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2200099.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

终于有人把思科认证全部说清楚了

思科作为全球领先的网络设备供应商,其认证体系在全球范围内被广泛认可; 但是大部分了解的朋友都只知道CCNA、CCNP和CCIE,但对思科的整个系统不是很清楚。 随着Cisco产品线的扩大和市场份额的不断提升,Cisco认证产品从当初仅有的路…

Kubernetes的Pod调度:让你的应用像乘坐头等舱!

一、Kubernetes 中 Pod 调度的重要性 在 Kubernetes 的世界里,Pod 调度就像是一个繁忙的交通指挥官,负责把小车(也就是我们的 Pod)送到最合适的停车位(节点)。调度不仅关乎资源的合理利用,还关乎…

【投稿优惠|稳定检索】2024 年信息学、网络与电子工程国际会议(INEE 2024)

2024 年信息学、网络与电子工程国际会议 2024 International Conference on Informatics, Networks, and Electronic Engineering 【1】大会信息 会议名称:2024 年信息学、网络与电子工程国际会议 会议简称:INEE 2024 大会时间:请查看官网 …

P-Tuning v2:一种普遍有效的提示调整方法

人工智能咨询培训老师叶梓 转载标明出处 预训练语言模型通过微调(fine-tuning)来适应特定任务虽然效果显著,但存在训练成本高、参数存储量大等问题。为了解决这些问题,清华大学的研究者们提出了一种名为P-Tuning v2的提示调整&am…

whistle配合app抓包

whistle配合app抓包 1.前置准备2.手机配置3.手机安装证书1.前置准备 下载启动whistle,本例使用默认的127.0.0.1:8899 需要保证Capture TUNNEL CONNECTS处在开启状态: 输入命令:w2 start,获取当前局域网的ip地址,并记录: 2.手机配置 打开无线局域网连接dxm_phone,配置…

Codeforces Round 833 (Div. 2)

比赛链接:Dashboard - Codeforces Round 833 (Div. 2) - Codeforces B. Diverse Substrings 题意: 思路: 当字符串长度 > 10 时,每个字符出现的次数至少是 2 次 ( 0 ~ 9 个出现一次,剩余字符出现 ) 当字符串长度…

Kali Linux 下载与安装手册

目录 Kali 是什么? 通过Kali官方网站下载 Kali 是什么? Kali Linux,前称BackTrack,是一个基于Debian的Linux发行版,专为数字取证和渗透测试而设计。它由Offensive Security Ltd.开发和维护,旨在为安全专…

10.10 题目总结(累计)

1.完成所有任务需要的最少轮数(思路) 思路:将数组的数依次放到map里面,如果有相同则在原有的基础上加一,然后全部放完之后,就遍历map,然后计算总次数,然后有一次的的则直接返回. AC: class Solution {public int minimumRounds(int[] tasks) {HashMap<Integer, Integer>…

【C++】--类和对象(3)

&#x1f911;个人主页: 起名字真南 &#x1f911;个人专栏:【数据结构初阶】 【C语言】 【C】 目录 1 深入构造函数2 类型转换3 static成员4 友元函数5 内部类6 匿名对象 1 深入构造函数 之前我们实现构造函数的时候&#xff0c;初始化成员变量都是在函数体内赋值&#xff0c…

linux-冯诺伊曼体系结构以及操作系统

冯诺依曼体系结构 我们不畅见到计算机&#xff0c;如笔记本&#xff0c;不常见的如服务器&#xff0c;大部分都遵循着冯诺伊曼体系结构 截至目前&#xff0c;我们所认识的计算机&#xff0c;都是由一个个硬件组件组成。 输入单元&#xff1a;包括键盘 , 鼠标&#xff0c;扫描…

鸿蒙开发之ArkUI 界面篇 二十四 计数器案例

计数器案例&#xff0c;点击’-‘按钮&#xff0c;数字减少1&#xff0c;点击啊‘’按钮&#xff0c;数字加一 分析&#xff1a;这里需要三个组件&#xff0c;外层容器是Row&#xff0c;从左往右的组件分别是ButtonTextButton&#xff0c;涉及到修改更新界面&#xff0c;变量需…

Java语言教程:打造你的第一款五子棋游戏 JAVA学习攻略心得总结

目录 Java语言教程&#xff1a;打造你的第一款五子棋游戏 游戏简介 游戏代码 自学Java攻略及功能 1. Java基础知识 2. 面向对象编程&#xff08;OOP&#xff09; Java简介 游戏简介 五子棋&#xff0c;又称连珠&#xff0c;是一种两人对弈的棋类游戏。五子棋的规则简单易…

红帽7—Mysql路由部署

MySQL Router 是一个对应用程序透明的InnoDB Cluster连接路由服务&#xff0c;提供负载均衡、应用连接故障转移和客户端路 由。 利用路由器的连接路由特性&#xff0c;用户可以编写应用程序来连接到路由器&#xff0c;并令路由器使用相应的路由策略 来处理连接&#xff0c;使其…

添加菜品到购物车

分析 数据库设计 代码开发 三个步骤&#xff1a; 判断当前商品是否已经在购物车中如果在购物车中&#xff0c;更新购物车中商品数量如果不在购物车中&#xff0c;添加到购物车 controller层 /*** 添加购物车** return*/PostMapping("/add")ApiOperation("添加购…

MediaTek携手“天玑芯世界探索官”辛芷蕾,开启科技新世界

2024年10月9日&#xff0c;MediaTek举办 2024天玑旗舰芯片新品发布会&#xff0c;正式发布旗舰 5G 智能体 AI 芯片天玑 9400。发布会上&#xff0c;MediaTek回顾了天玑品牌5周年的辉煌历程&#xff0c;展望了AI技术将推动人类进入一个充满人文关怀和情感交流的智慧科技新世界&a…

智能优化算法-引力搜索优化算法(GSA)(附源码)

目录 1.内容介绍 2.部分代码 3.实验结果 4.内容获取 1.内容介绍 引力搜索优化算法 (Gravitational Search Algorithm, GSA) 是一种基于牛顿万有引力定律的元启发式优化算法&#xff0c;由Rashedi等人于2009年提出。GSA通过模拟天体之间的引力作用来搜索最优解&#xff0c;适用…

.NET周刊【9月第4期 2024-09-22】

国内文章 .NET常见的几种项目架构模式&#xff0c;你知道几种&#xff1f;&#xff08;附带使用情况投票&#xff09; https://www.cnblogs.com/Can-daydayup/p/18421685 文章介绍了软件项目的几种架构模式&#xff0c;包括三层架构、MVC、DDD、整洁架构和CQRS。这些模式通过…

算法:双指针系列(二)——对撞指针

双指针系列&#xff08;二&#xff09;——对撞指针 &#xff08;一&#xff09;盛水最多的容器&#xff08;一&#xff09;题目分析&#xff08;二&#xff09;代码展示 二、有效的三角形个数&#xff08;一&#xff09;题目分析&#xff08;二&#xff09;代码展示 三、查找总…

Scalable TCP 如何优化长肥管道

来看一个极简的拥塞控制实现 net/ipv4/tcp_scalable.c&#xff0c;去掉注释不到 50 行代码。它的介绍在 Scalable TCP-improving performance in highspeed networks。由于太简单&#xff0c;估计没什么人会在意。 本文说一下它背后的道理。 无论 bic/cubic&#xff0c;westw…

从0开始linux(10)——进程(2)进程属性

欢迎来到博主的专栏&#xff1a;从0开始linux 博主ID&#xff1a;代码小豪 文章目录 进程与操作系统并发与并行进程的状态 linux的进程状态 进程与操作系统 进程的状态可分为3种&#xff0c;分别是新建态&#xff0c;运行态&#xff0c;终止态&#xff0c;就绪态与阻塞态。状态…