9个已开源的GPT4平替分享(附开源代码+论文)

news2024/11/23 8:11:25

资料整理自网络,有误欢迎指正

对于想要研究大模型的同学来说,目前ChatGPT无疑是最好的学习对象,但等它开源估计是不太可能了,所以学姐今天整理了一些开源的类GPT模型,帮助大家更好的理解大模型背后的机理。

PS:有的功能还不错,也可以上手玩耍玩耍。

开源链接都贴上了,不想复制粘贴的同学看文末直接领

1.Colossal AI

“夸父”AI,大规模并行AI训练系统,基于LLaMA预训练模型。作为ChatGPT的平替,开源了完整的RLHF流水线,包括,监督数据收集、监督微调、奖励模型训练和强化学习微调等。

  • 优势:高效、简单、可扩展,功能多,包含AIGC

  • 缺点:不完全支持中文,基于GPT-3

  • 模型能力:集成现有的GPT-3 、GPT-2模型,能够提升模型效率

  • 训练:
    • 第一阶段(stage1_sft.py):SFT监督微调阶段,该开源项目没有实现,这个比较简单,因为ColossalAI无缝支持Huggingface,本人直接用Huggingface的Trainer函数几行代码轻松实现,在这里我用了一个gpt2模型,从其实现上看,其支持GPT2、OPT和BLOOM模型;

    • 第二阶段(stage2_rm.py):奖励模型(RM)训练阶段,即项目Examples里train_reward_model.py部分;

    • 第三阶段(stage3_ppo.py):强化学习(RLHF)阶段,即项目train_prompts.py。

代码中的cores即原始工程中的chatgpt,cores.nn在原始工程中变成了chatgpt.models。

开源地址:https://github.com/hpcaitech/ColossalAI

2.ChatGLM

智谱AI研发,基于千亿参数大模型的支持中英双语的对话机器人。

  • 优势:支持中英双语、开源平替里面参数规模较大的对话大模型

  • 缺点:模型记忆和语言能力较弱,数学、编程类解答能力较弱

  • 模型能力:
    • 自我认识

    • 提纲写作

    • 文案写作

    • 邮件写作助手

    • 信息抽取

    • 角色表演

    • 评论比较

    • 旅游方向

  • 训练:
    • 62亿参数

    • 针对中文提问和对话进行了优化

    • 经过约1T标准符号的中英双语训练,辅以监督微调、反施自助、人类反施强化学习等技术的支持

开源地址:https://github.com/THUDM/ChatGLM-6B

3.LLaMa

Meta打造的一个650 亿参数的大语言模型,可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。

  • 优势:在生成文本、对话、总结书面材料、等任务上方面表现良好,支持20种语言。

  • 缺点:对中文支持不足

开源地址:https://github.com/facebookresearch/llama

4.LLaMa-ChatLLaMA

由于 LLaMA 大模型系列没有使用 RLHF 方法,因此初创公司 Nebuly AI 开源了 RLHF 版 LLaMA(ChatLLaMA)的训练方法。

  • 优势:
    • 更便宜,完整的开源实现,允许用户基于预训练的 LLaMA 模型构建 ChatGPT 风格的服务;

    • LLaMA 架构更小,使得训练过程和推理速度更快,成本更低;

    • 内置了对 DeepSpeed ZERO 的支持,以加速微调过程;

    • 支持各种尺寸的 LLaMA 模型架构,用户可以根据自身偏好对模型进行微调

  • 缺点:不支持中文

5.BELLE

精通中文,基于斯坦福 Alpaca项目,70 亿参数的中文对话大模型。

  • 优势:
    • 数据:参考斯坦福大学的Alpaca项目,针对中文场景进行了优化,利用ChatGPT生了多样化、高质量的数据,包括日常对话、知识问答、文本生成等,有助于模型在各种中文场景中的表现。

    • 模型:基于Bloom和LLAMA,训练了出具效果的对话模型,并完全开放了这些模型的参数,大大降低使用和科研的门槛

    • 轻量化:开源了对话模型的量化版本,包括8bit, 4bit, 其中4bit版本模型checkpoint大小仅为6.9G,运行仅需8.4G显存。

开源地址:https://github.com/LianjiaTech/BELLE

6.PaLM-rlhf-pytorch

作者Phil Wang,在 PaLM 架构之上实现 RLHF,它基本上是使用 PaLM 的 ChatGPT

  • 优势:
    • 基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF)

    • 采用了ChatGPT一样的强化学习机制,能让AI的回答更加符合情景要求,降低模型毒性

开源地址:https://github.com/lucidrains/PaLM-rlhf-pytorch

7.OpenAssistant

旨在让每一个人都可以访问基于聊天的大语言模型。

  • 优势:
    • 开源聊天助手,其可以理解任务、与第三方系统交互、动态检索信息。

    • 据说是第一个在人类数据上进行训练的完全开源的大规模指令微调模型

  • 缺点:中文效果不佳、受底层模型的限制

开源地址:https://github.com/LAION-AI/Open-Assistant

8.OpenChatKitk

前OpenAI研究员所在的Together团队,以及LAION、Ontocord.ai团队共同打造,包含200亿个参数,用GPT-3的开源版本GPT-NoX-20B进行微调

  • 优势:
    • 提供了一个强大的的开源基础,为各种应用程序创建专用和通用的聊天机器人

    • 该 kit 包含了一个经过指令调优的 200 亿参数语言模型、一个 60 亿参数调节模型和一个涵盖自定义存储库最新响应的可扩展检索系统

开源地址:https://github.com/togethercomputer/OpenChatKit

9.stanford_alpaca

Stanford Alpaca是一个Instruction-following的LLaMA模型,即一个对LLaMA模型进行指令调优的结果模型

开源地址:https://github.com/tatsu-lab/stanford_alpaca

关注下方《学姐带你玩AI》🚀🚀🚀

回复“大模型”获取开源代码+必读论文

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/506719.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

io,nio,aio区别

文章目录 前言io类型介绍同步阻塞io同步非阻塞ioio多路复用异步io 普通ionioChannelChannel实现基本的 Channel代码 示例 BufferBuffer的基本用法Buffer的capacity,position和limitcapacitypositionlimit Buffer的类型Buffer的分配向Buffer中写数据从Buffer中读取数据 Selector…

CSS 实现任意角度圆环

参考链接: css 制作圆环 - 掘金 主要思路: 利用 CSS 的 clip-path 属性进行裁剪 clip-path 具体信息参考 polygon() - MDN (mozilla.org) 该属性原理是:利用多边形进行对图形的裁剪。 根据具体代码,去分析 clip-path: polyg…

JavaWeb:Servlet、ServletContext、HttpServletResponse、HttpServletRequest 的详细内容

文章目录 JavaWeb - 02一、Servlet1. 简介2. HelloServlet3. Servlet 原理4. Mapping 原理 二、ServletContext1. 共享数据2. 获取初始化参数3. 请求转发4. 读取资源文件 三、HttpServletResponse1. 方法介绍2. 应用:下载文件3. 应用:创建验证码4. 应用&…

office web apps在线office文件预览部署及问题处理

文件下载链接网盘: 链接: https://pan.baidu.com/s/1OmWM5END0jyWESGzFCniEw 提取码: ejpg 基本环境需要两台机,1台为域控,1台为 (office web apps ,需要加入到域) 主机1:添加域控服务 安装完…

设备树简介

设备树 设备树简介 设备树是一种描述硬件的数据结构,它起源于OpenFirmware(OF)。 在Linux 2.6中, ARM架构的板极硬件细节过多地被硬编码在arch/arm/plat-xxx和arch/arm/mach-xxx中,采用设备树后,许多硬件…

python操作字典

# 字典 score{"张三":"23","王五":"45"} print(score) dctdict(name张三,age20) print(dict) print(type(score)) # 字典元素的获取 print(score[张三]) print(score.get(张三)) # 判断是否是字典中的元素 print(王五 in score) # 为字…

浅析AI视频智能识别技术如何助力智慧平安校园建设

校园安全一直是学生健康成长、全面发展的前提与保障。校园门口伤害事件的频发与校园内应急事件的突发,让建设平安校园的任务愈加急迫。校园人流量大、监控点多,安保人员无法同时盯住上百个视频画面,亦无法保证24小时有效监控。传统的校园安防…

软件测试简历项目经验怎么写?一篇足矣解决

一、前言:浅谈面试 面试是我们进入一个公司的门槛,通过了面试才能进入公司,你的面试结果和你的薪资是息息相关的。那如何才能顺利的通过面试,得到公司的认可呢?面试软件测试要注意哪些问题呢?下面和笔者一起来看看吧。这里分享一…

OpenGL(十一)——材质

目录 一、前言 二、物体材质 三、光源材质 一、前言 OpenGL材质是模拟现实世界中不同材质物体表面,如木制箱子和钢制箱子对光的反射程度不同。物体材质对接受光散射程度不同,较少散射产生较小高光点,较多散射则会产生较大高光点。前面章节…

如何节约ChatGPT消耗的token

如何节约GPT的token.md 原文链接:小回博客 如何节约GPT的token 一、模拟一下携带上下文的流程: 第1次问答: 你:帮我写一个1000字的文案(13) gpt: xxxxxx (1000)第2次问答: 你:谢…

《我命由我不由天》蔡志忠——笔记三

目录 经典摘录 1、大脑是用来思考的 2、养生主 3、自己的问题,自己找答案 4、42岁自学英文 5、终身阅读 6、打不垮我们的终究使我们更强大 7、大环境下失业 8、生命只能兑现此刻 经典摘录 1、大脑是用来思考的 罗素非常反对制式教育,他说&#…

有哪些比较好的测试用例管理工具?

“新入职小型创业公司,想要一个比Excel高效且好用的工具。”我预料很多人会提TestLink、Jira、PingCode 等一堆平台,都2023年了,若还是复制粘贴的10年前这一套,那就让人看不下去了。为了让大家少走弯路,所以我写了这篇…

【自用】配置minGW、vscode配置ESP-IDF环境

步骤总览 1.配置minGW 2.下载安装esp-idf软件 3.将vscode esp-idf插件 和 esp-idf软件进行关联 一、配置minGW 1.下载 链接:https://pan.baidu.com/s/1j6ITlNDDyivKwpWNBjASvg?pwd0108 提取码:0108 2.解压 解压上面下载的压缩包即可 3.配置环境变…

EFDC建模方法及在地表水环境评价、水源地划分、排污口论证应用

目录 专题一 软件安装 专题二 EFDC模型讲解 专题三 一维河流模拟实操(上机操作) 专题四 建模前处理(上机操作) 专题五 EFDC网格剖分介绍(上机操作) 专题六 EFDC二维湖库水动力模拟/非保守染色剂模拟&…

prometheus监控数据持久化

前置条件 1.规划两台主机安装prometheus # kubectl get nodes --show-labels | grep prometheus nm-foot-gxc-proms01 Ready worker 62d v1.23.6 beta.kubernetes.io/archamd64,beta.kubernetes.io/oslinux,kubernetes.io/archamd64,kubernetes.io…

5.Redis持久化

5.Redis持久化 总体介绍持久双雄一图:Redis persistence RDB(Redis Database)官网介绍RDB(Redis 数据库):RDB 持久性以指定的时间间隔执行数据集的时间点快照。能干嘛?案例演示:需求…

图像处理——连接IP摄像头上传到服务器实现目标识别

前言 1.项目的需求是,本地连接IP摄像头,然后把图像上传到图像处理服务器器进行处理,得到的结果返回本地。 2.IP摄像头使用的是大华的摄像头,目标识别用的yolov5的模型,服务器用的是flask,实现语言是pytho…

【闪击Python】字符串的创建和驻留机制

💌 博客内容:字符串的创建和驻留机制 😀 作  者:陈大大陈 🚀 个人简介:一个正在努力学技术的准前端,专注基础和实战分享 ,欢迎私信! 💖 欢迎大家&#x…

Dear Reality 发布全新 EXOVERB MICRO 混响插件

空间感混响效果新高度 Dear Reality 发布全新 EXOVERB MICRO 混响插件 Dear Reality 针对立体声制作推出最新的混响插件 EXOVERB MICRO,提供一流的真实感和空间感混响效果,将立体声混音技术提升至新高度。这个紧凑型音频插件功能非常强大,采…