【LLM】医疗大语言模型:CareGPT

news2024/11/26 22:45:21

向AI转型的程序员都关注公众号 机器学习AI算法工程

CareGPT (关怀GPT)是一个医疗大语言模型,同时它集合了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型,包含LLM的训练、测评、部署等以促进医疗LLM快速发展。

在这里插入图片描述

特性:

  1. 添加ChatGPT fine-tuning实现,推荐有额度的朋友在ChatGPT上进行微调实验;
  2. 支持ChatGPT-Next-Web部署微调的模型;
  3. 支持Gradio部署微调的模型;
  4. 支持LLaMA、LLaMA-2全系列模型训练;
  5. 支持LoRA、QLoRA,包括后续PPO、DPO强化学习训练;
  6. 支持模型与知识库结合问答;
  7. 开源了超过60个医院科室的导诊材料信息;
  8. 开发了支持GPT-4/ChatGPT模型蒸馏医学数据的工具,能够批量生成各种用于构建知识库和微调的数据;
  9. 聚合了丰富的开源医学LLM、LLM训练的医学数据、LLM部署资料、LLM测评以及相关LLM的资源整理;
  10. 我们参与了医学LLM的CMB榜单评测-IvyGPT,在测试中,我们领先ChatGPT及一众开源医学LLM

数据集

预训练数据
  • LLM-Pretrain-FineTune/data_pretrain
  • MedicalGPT/pretrain
  • zysj
  • TCM-Ancient-Books (近700项中医药古籍文本)
  • epfl-llm/guidelines
监督训练数据
  • icliniq-10k(en)
  • HealthCareMagic-100k(en)
  • ShenNong_TCM_Dataset
  • ✅ChatMed_Consult_Dataset
  • Chinese-medical-dialogue-data
  • cMedQA2
  • ✅Huatuo-26M
  • cMedQA2
  • webMedQA
  • PubMedQA
  • CMCQA
  • ✅QiZhenGPT
  • ✅LLM-Pretrain-FineTune/data_sft
  • Medical-Dialogue-System
  • IMCS-V2
  • CHIP-MDCFNPC
  • MedDG
  • ✅HuatuoGPT-sft-data-v1
  • MedicalGPT/finetune
  • ✅shibing624/medical
  • medAlpaca/data
  • ✅Zhongjing/sft
  • medical_dialog
  • huatuo_encyclopedia_qa
  • Med-ChatGLM/data
  • CMB
  • GenMedGPT-5k(en)
  • Alpaca-CoT(general)
  • ✅DISC-Med-SFT
  • ✅HuatuoGPT2_sft_instruct
  • FreedomIntelligence/Medbase_data
  • openmedlab/Awesome-Medical-Dataset
奖励训练数据
  • MedicalGPT/reward
  • Zhongjing/rw
  • comparison_gpt4_data
  • HH-RLHF
  • UltraFeedback

全流程训练

1.安装依赖

代码语言:javascript

conda create -n llm python=3.11
conda activate llm
python -m pip install -r requirements.txt

LLaMA模型下载:https://blog.csdn.net/u014297502/article/details/129829677# 转为HF格式
python -m transformers.models.llama.convert_llama_weights_to_hf \
--input_dir path_to_llama_weights--model_size 7B --output_dir path_to_llama_model
  • LLaMA-2模型下载:https://huggingface.co/meta-llama

2.数据配置

数据集配置、PT、SFT、RW数据格式

dataset_info

如果您使用自定义数据集,请务必在 dataset_info.json 文件中以如下格式提供您的数据集定义。

在这里插入图片描述

其中 promptresponse 列应当是非空的字符串。query 列的内容将会和 prompt 列拼接作为模型输入。history 列应当是一个列表,其中每个元素是一个字符串二元组,分别代表用户请求和模型答复。

PT example data

.txt格式,一行一个无监督数据。

Machine learning (ML) is a field devoted to understanding and building methods that let machines “learn” – that is, methods that leverage data to improve computer performance on some set of tasks.

Machine learning algorithms build a model based on sample data, known as training data, in order to make predictions or decisions without being explicitly programmed to do so. Machine learning algorithms are used in a wide variety of applications, such as in medicine, email filtering, speech recognition, agriculture, and computer vision, where it is difficult or unfeasible to develop conventional algorithms to perform the needed tasks.

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2035353.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Datawhale AI 夏令营】动手学大模型应用开发Task1 Baseline 精读

【Datawhale AI 夏令营】动手学大模型应用开发Task1 Baseline 精读 开源大模型文件预览 Baseline 1.导入库 # 导入所需的库 from transformers import AutoTokenizer, AutoModelForCausalLM import torch import streamlit as st2.模型下载 # 源大模型下载 from modelscope…

将电脑打造成私人网盘,支持外网访问之详细操作教程

你想过把自己电脑打造成随时随地访问的网盘吗?就是那种拥有一个属于自己的影音库,不用担心被和谐,随时可以登录访问电脑上的各种文件,相比传统网盘省心又安全。 使用Everything和节点小宝将电脑搭建成私人网盘,可以实现…

嵌入式面经篇三——数据类型

文章目录 前言一、数据类型1、用变量 a 给出下面的定义2、下面的代码输出是什么,为什么?3、写出 float x 与“零值”比较的 if 语句。4、下面代码有什么错误?5、下面代码输出是什么?6、下面代码运行后会是什么现象?7、…

24年日语能力(JLPT)考试报名流程图解

报名方式 搜索JLPT中国教育考试网,在线报名,一般学生党从教育网入口登录,社会人士从公网入口登录 报名时间 N1-N5 8月20日 7:00 - 8月27日14:00 注册时间 8月13日7:00 - 8月27日14:00 报名步骤 阅读报考提示,注册个人信息→…

此处不允许使用 ‘空‘ 类型

说明:受最近看的书《设计模式之美》(小争哥)的影响,最近编码有意将一些业务逻辑写在对象里面,增强封装性。在此记录一次项目启动时的报错,如下: 原因:当你在实体类对象中&#xff0c…

UniApp开发的开源工厂设备管理维护系统

本文来自:UniApp开发的开源工厂设备管理维护系统 - 源码1688 前端小程序演示地址: 后台测试网址: https://shebeiguanli.azheteng.cn/pyswkAWtig.php/addon?refaddtabs 测试账户: admin 测试密码: admin888 前端…

【Python】python泰坦尼克号生存预测 (源码+数据集+PPT+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

黑神话悟空游戏攻略大全 黑神话悟空内存占用多少 国产3A级游戏《黑神话:悟空》评测代码已发 黑神话悟空测试画质130g MacBook可以玩黑神话悟空吗

《黑神话:悟空》的评测代码已向媒体与测评人员发放,评测解禁日期定在8月16日。目前发放的评测代码仅限于PC版,并未涉及PS5版。《黑神话:悟空》将于8月20日发售,登陆PC(Steam/Epic/WeGame)和PS5。玩家将扮演一位“天命人…

Mybatis原理分析

一、总结 MyBatis的基本工作原理就是:先封装SQL,接着调用JDBC操作数据库,最后把数据库返回的表结果封装成Java类。 1. JDBC有四个核心对象: (1)DriverManager,用于注册数据库连接。 &#xf…

基于单片机的智能楼道灯光控制系统设计

摘要:基于单片机的智能楼道灯光控制系统设计由人体感应模块、光照强度检测模块、灯光控制模块、声音传感器模块、声光报警模块等组成。以单片机为核心,通过检测光照强度和红外人体感应相结合,实现了对楼道内灯光的控制,从而达到节…

vue-cli 中 配置 productionSourceMap 为 false 失效?

背景 最近 发现 vuecli 构建的 项目中配置的 productionSourceMap 为 false 后 ,生产代码 还是能够看到 sourceMap 文件 。 原因 生效前提条件 得设置 NODE_ENV 为 production 才会生效! 解决 直接修改生产环境的配置 NODE_ENV 为 production 直接覆…

二.PhotoKit - 相册权限(彻底读懂权限管理)

引言 用户的照片和视频算是用户最私密的数据之一,由于内置的隐私保护功能,APP只有在用户明确授权的前提下才能访问用户的照片库。从iOS14 开始,PhotoKit进一步增强了用户的隐私控制,用户可以选择指定的照片或者视频资源的访问权限…

阿里淘天landing,是结束也是新的开始(附校/社招内推码)

阿里3个多月landing成功,是结束也是新开始,望我们往后一切顺利~ 因为个人发展规划,今年开始找工作,但负责的业务实在繁忙,所以一边面试一边整理资料,每天都在挤海绵。 今年的就业形势着实不乐观&#xff0c…

NPN传感器与汉姆485总线驱动器限位功能使用

传感器输出的引脚电平是由传感器是常闭还是常开决定的;light on和 dark on决定的是触发信号; PNP-NO常开:在没有信号触发时,输出线是悬空的(即VCC电源线和OUT线断开),输出为低电平或不确定状态…

【推荐】免费一年期的SSL证书现在哪里可以申请到

免费一年期的SSL证书虽然不像以前那样普遍易得,但仍有部分途径可以申请到。以下是一些可能的申请渠道: JoySSL 特点:JoySSL是自主品牌SSL证书,安全性和兼容性都有保障。它提供教育版和政务版域名的一年期免费DV单证书。申请流程&…

java中RSA分段加解密及Data must not be longer than异常处理

谈到RSA非对称加密,作为开发的我们第一想到的是安全,几乎不会被破解,以及公钥加密,私钥解密这些。在Java代码中,我们常使用一些现成的工具类如hutool中提供的工具类、网上在线的或者博客上的RSAUtils工具类来实现公钥私…

解决BkwinProject无法编译运行问题

#ifdef _UNICODE // 如果定义了 _UNICODE,这意味着程序正在使用 Unicode 字符集进行编译。 // Unicode 字符集是现代 Windows 应用程序普遍使用的字符编码方式,支持多语言字符。#if defined _M_IX86 // 如果定义了 _M_IX86,这意味着程序正…

【源码交付】数字化产科管理平台:一个集孕期产检、健康宣教、随访、住院、产后42天管理的专科管理系统

项目介绍: 数字化产科管理平台是一个集孕期产检、健康宣教、随访、住院、产后42天管理的专科管理系统,由门诊、住院、数据统计三大功能模块组成,与院内系统HIS/LIS/PACS数据对接,实现以孕妇为中心的全面、高效、多元的全周期服务…

用的到linux-系统性能监控(内存、CPU、硬盘、IO)-Day6

前言: 在Linux系统中,实时监控系统的资源使用情况(如内存、硬盘、CPU、网络和IO等)是非常重要的,它可以帮助你了解系统的健康状况,及时发现潜在的性能瓶颈或问题。下面将介绍一些常用的命令和工具&#xff…