LLM | 面向对话式医疗健康场景的医疗大模型

news2024/11/15 12:14:50

近日,复旦大学数据智能与社会计算实验室 (Fudan-DISC) 开发并开源了一个专门针对医疗健康对话式场景而设计的医疗领域大模型:DISC-MedLLM。

图片

DISC-MedLLM

DISC-MedLLM 是一个专为医疗健康对话场景而打造的领域大模型,它可以满足您的各种医疗保健需求,包括疾病问诊和治疗方案咨询等,为您提供高质量的健康支持服务。

DISC-MedLLM 有效地对齐了医疗场景下的人类偏好,弥合了通用语言模型输出与真实世界医疗对话之间的差距,这一点在实验结果中有所体现。

图片

得益于以目标为导向的策略,以及基于真实医患对话数据和知识图谱,引入LLM in the loop 和 Human in the loop的多元数据构造机制,DISC-MedLLM 有以下几个特点:

  • • 可靠丰富的专业知识。以医学知识图谱作为信息源,通过采样三元组,并使用通用大模型的语言能力进行对话样本的构造。
  • • 多轮对话的问询能力。以真实咨询对话纪录作为信息源,使用大模型进行对话重建,构建过程中要求模型完全对齐对话中的医学信息。
  • • 对齐人类偏好的回复。病人希望在咨询的过程中获得更丰富的支撑信息和背景知识,但人类医生的回答往往简练;通过人工筛选,构建符合人类偏好的高质量的小规模行为微调样本,对齐病人的需求。

模型效果演示

疾病问诊

图片

治疗方案咨询

图片

数据集

为了训练 DISC-MedLLM ,我们构建了一个高质量的数据集,命名为 DISC-Med-SFT,其中包含了超过47万个衍生于现有的医疗数据集重新构建得到的样本。我们采用了目标导向的策略,通过对于精心选择的几个数据源进行重构来得到SFT数据集。这些数据的作用在于帮助模型学习医疗领域知识,将行为模式与人类偏好对齐,并对齐真实世界在线医疗对话的分布情况。

图片

模型部署

首先,您需要安装项目的依赖环境

pip install -r requirements.txt

利用Hugging Face的transformers模块来进行推理

    >>> import torch
>>> from transformers import AutoModelForCausalLM, AutoTokenizer
>>> from transformers.generation.utils import GenerationConfig
>>> tokenizer = AutoTokenizer.from_pretrained("Flmc/DISC-MedLLM", use_fast=False, trust_remote_code=True)
>>> model = AutoModelForCausalLM.from_pretrained("Flmc/DISC-MedLLM", device_map="auto", torch_dtype=torch.float16, trust_remote_code=True)
>>> model.generation_config = GenerationConfig.from_pretrained("Flmc/DISC-MedLLM")
>>> messages = []
>>> messages.append({"role": "user", "content": "我感觉自己颈椎非常不舒服,每天睡醒都会头痛"})
>>> response = model.chat(tokenizer, messages)
>>> print(response)

运行命令行Demo

python cli_demo.py

运行网页版Demo

streamlit run web_demo.py --server.port 8888

模型微调

可以使用与模型数据集结构相同的数据对模型进行微调。这里只提供全参数微调的代码:

deepspeed --num_gpus={num_gpus} ./train/train.py --train_args_file ./train/train_args/sft.json

模型评测

包括在单轮QA问题中提供准确答案的能力以及在多轮对话中完成系统性问诊、解决咨询需求的能力。

单轮QA评测

在单轮对话评测中,构建了一个基准测试数据集,其中包含从两个公开医疗数据集中收集的多项选择题,并评估模型回答的准确性。

图片

多轮对话能力评测

对于多轮对话评测,首先构建了一些高质量的诊疗对话案例,然后让 GPT-3.5 扮演这些案例中的患者角色,并与扮演医生角色的模型进行对话。利用 GPT-4 来评估整段每段对话的主动性、准确性, 帮助性和语言质量。

评测基于三个不同的数据集:Chinese Medical Benchmark (CMB-Clin)、Chinese Medical Dialogue Dataset (CMD) 和 Chinese Medical Intent Dataset (CMID),其中 CMB-Clin 模拟了现实世界的问诊过程,而 CMD 和 CMID 则分别着重从科室专业性和用户意图的角度进行评估。

CMB-Clin数据集评测结果:

图片

CMD数据集评测结果:

图片

CMID数据集评测结果:

图片

参考资料

原文信息

DISC-MedLLM: Bridging General Large Language Models and Real-World Medical Consultation

DOI

10.48550/arXiv.2308.14346

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2058804.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

嵌入式堆栈、ARM寄存器

栈里面存放的内容:局部变量和系统信息,函数调用链路也是系统信息的一环 ARM寄存器 LR:程序跳转的时候,返回到的地址就保存到此处 PC:程序计数器,pc 要执行的下一条指令地址,就存放在此处&#…

Obsidian Publish的开源替代品Markopolis

什么是 Markopolis ? Markopolis 是一款旨在提供 Markdown 文件的 Web 应用和 API 服务器。它允许您以网站形式共享 Markdown 笔记,并使用 API 与 Markdown 文件交互和操作它们。类似于 Obsidian Publish,但又不会被锁定在 Obsidian 生态系统…

FMS 2024:多家厂商CXL技术方案总览

CXL(Compute Express Link)联盟自成立以来一直是FMS闪存峰会的常客。在2022年的峰会上,CXL联盟宣布了CXL 3.0版本规范,随后在2023年的超级计算大会上推出了CXL 3.1版本。起初,CXL作为一种主机到设备的互联标准&#xf…

【LiteX】【仿真】使用litex_sim在Python环境中实现FPGA SoC仿真测试

目录 介绍环境依赖litex_sim 入门仿真litex_server、litex_cli、litescope_cli仿真调试litex_sim仿真窗口litex_server窗口litex_cli窗口litescope_cli窗口 波形DUMP方法一:导出指定时间段的波形方法二:在命令行中配置寄存器控制波形导出方法三&#xff…

BI分析实操案例分享:零售企业如何利用BI工具对销售数据进行分析?

在当下这个竞争激烈的零售市场,企业如何在波诡云谲的商场中站稳脚跟,实现销售目标的翻倍增长? 答案可能就藏在那些看似杂乱无章的数字里。 是的,你没有看错,答案正是那些我们日常接触的销售数据。它们就像是宝藏&…

92.SAP ABAP - RFC函数外部调用时的debug - 笔记

当RFC函数被外部系统访问,需要联合调试时,也需要debug模式,打断点进行跟踪。这种要如何做呢? 目录 1.SE37进入程序,通过菜单Utilities-Settings进入 2.ABAP Editor-Debugging Tab页面 3.单击Set/Delete External Br…

软件设计师全套备考系列文章7 -- 树、二叉树、图

软考-- 软件设计师(7)-- 树、二叉树、图 文章目录 软考-- 软件设计师(7)-- 树、二叉树、图前言一、树的基本概念二、二叉树的基本概念三、二叉树的考点四、线索二叉树五、平衡二叉树六、图 前言 考试时间:每年5月、11…

制冷系统四通阀、截止阀和单向阀

一、 四通阀 (一)作用:是热泵型空调中的关键部件,起制冷系统中制冷、制热转换的作用,通过更换压缩机排气管和回气管进入蒸发器和冷凝器的方向,从而达到制冷和制热目的。亦可以用于除湿系统的换向化霜。 (二)工作原理&#xff1…

java接口 controller层接收list集合传参,postman 调用接口时required parameter XXX is not present

开发过程中开发一个java接口 controller层接收list集合传参,然后postman调用一直不成功,报错 使用RequestParam方式,如果postman 调用接口时报错required parameter XXX is not present 可能是(value“items”)跟你输…

微信小程序--31(todolist案例)

一.功能 输入待办事件添加代办事件删除代办事件 二、步骤 1.添加输入框 .wxml代码&#xff1a; <!-- 1.输入框 --><input type"text" bindinput"handleInput" value"{{text}}" /> .wxss代码&#xff1a; /* 1.输入框样式 */ i…

百度地图API快速使用 - 以批量算路为例讲解

目录 1. 开发文档链接 2. 开发流程说明 &#xff08;1&#xff09;首先-创建应用获取访问应用的AK &#xff08;2&#xff09; 查看文档的示例代码并分析 3. 简单改编示例的代码 1. 开发文档链接 批量算路 | 百度地图API SDK (baidu.com)https://lbsyun.baidu.com/faq/ap…

Adobe After Effects的插件--------3D Stroke

3D Stroke是蒙版路径描边插件。它是AE的外置插件,需要自己下载,可以在lookAE中下载。 该插件会依据图层上的蒙版路径(内部)创建蒙版,并且使原蒙版失效。 基础属性 英文属性名中文属性名描述Path路径用来选择图层上的某一段蒙版路径,若 Use All Paths 属性未勾选,该属性…

【SQL】下属员工数量

目录 题目 分析 代码 题目 表&#xff1a;Employees ----------------------- | Column Name | Type | ----------------------- | employee_id | int | | name | varchar | | reports_to | int | | age | int | -------------------…

ubuntu虚拟机磁盘扩容

首先&#xff01;&#xff01;&#xff01;关闭虚拟机 step1&#xff1a;更改虚拟机设置 【右键】你想修改的虚拟机&#xff0c;点【设置】&#xff0c;或者直接点图上位置 选择【硬盘】&#xff0c;右边【拓展】&#xff0c;弹出的窗口中修改你想修改的大小&#xff08;我从…

Chat App 项目之解析(七)

Chat App 项目介绍与解析&#xff08;一&#xff09;-CSDN博客文章浏览阅读259次&#xff0c;点赞7次&#xff0c;收藏2次。Chat App 是一个实时聊天应用程序&#xff0c;旨在为用户提供一个简单、直观的聊天平台。该应用程序不仅支持普通用户的注册和登录&#xff0c;还提供了…

手持气象站的工作原理

TH-SQ5手持气象站是现代气象监测技术中的一种便捷工具&#xff0c;它允许用户随时随地进行气象环境的检测。这种便携式设备通常集成了多种传感器&#xff0c;用于实时测量和记录温度、湿度、气压、风速、风向和光照等气象参数。手持气象站具备轻便的外观设计&#xff0c;适合户…

梦颜时光记录点滴心情经历网站html源码

梦颜时光记录点滴心情经历网站html源码,源码由HTMLCSSJS组成&#xff0c;记事本打开源码文件可以进行内容文字之类的修改&#xff0c;双击html文件可以本地运行效果&#xff0c;也可以上传到服务器里面 https://download.csdn.net/download/huayula/89652517

win11使用注册表禁用自动更新

由于Win11的突然更新&#xff0c;导致日常工作时带来诸多不便&#xff0c;这里使用注册表禁用Win11自动更新操作&#xff0c;注意设置错误可能导致其他问题 1.使用快捷键winR打开运行窗口输入命令“regedit”&#xff0c;或在开始中搜索“regedit”打开注册表。 2.导航到以下路…

Robotics: Aerial Robotics 部分笔记——Week4

感知与估计 SLAM全称Simultaneous Localization and Mapping&#xff0c;即同时定位与制图典型的控制估计模块及部分传感器频率 非线性控制 对偏离平衡态较远的无人机进行控制&#xff0c;之前的线性化就不再适用。计算方法&#xff1a;PD控制计算 u 1 u_1 u1​&#xff0c…

WPF用户控件User Control的使用-在MVVM架构下实现能量条效果

一、用户控件介绍 定义&#xff1a; 用户控件是由一组现有的WPF控件组成&#xff0c;并在一个XAML文件中定义的可重用的控件。它可以包含多个控件、布局和行为&#xff0c;形成一个独立的、可在应用程序中多次使用的模块。 特点&#xff1a; 可重用性&#xff1a;用户控件的…