5个值得一试的开源大语言模型

news2024/11/24 20:41:20

5个值得一试的开源大语言模型

人工智能已经成为我们生活中不可或缺的一部分,而LLM(大型语言模型)处于这一变化的最前沿。 在对话式人工智能方面,大语言模型的性能最为关键。 虽然像 OpenAI 的 GPT-4 这样的商业大语言模型已经引起了所有人的关注,但开源模型在性能和流行度方面正在迅速赶上。 在社区和机构的不断贡献下,开发人员现在有机会访问更强大的开源对话式 AI 模型。这些开源模型得益于源代码开放的天然优势,可以提供更好的灵活性、更广泛的社区支持、更透明的技术细节,关键是可以极大节约时间和降低成本。

在这里插入图片描述

“模型开源”与“代码开源”不完全相同。虽然“开源”一词通常意味着源代码可供任何人使用、修改和分发,但人工智能模型开源可能并非总是如此。 例如,一些“开源”模型是部分开源的,因为它们是从 LLaMA 进行微调的,而 LLaMA 并未完全向公众开源,而且模型训练的数据集有时也是私有不开放的。另外需要注意的是,这些模型可能是开源的,但具有限制它们使用方式的限制性许可条件。因此,大家在使用开源模型时,一定要仔细考虑“开源”在每个特定情况下的含义,并且仔细阅读开源许可和使用条款。

文章目录

    • 半开源模型
      • 1. Vicuna
      • 2. GPT4ALL
      • 3. Koala
    • 全开源模型
      • 4. Dolly 2.0
      • 5. OpenAssistant

半开源模型

1. Vicuna

img

  • 官网: https://vicuna.lmsys.org/
  • GitHub: https://github.com/lm-sys/FastChat
  • Demo: https://chat.lmsys.org/

Vicuna 是最近最炙手可热的开源聊天机器人模型。 据说该模型效果接近 90% 的 ChatGPT 质量,令人印象深刻。该模型基于经过微调的 LLaMa-13B 模型,由一群来自美国多个著名机构的天才开发者开发。 Vicuna 根据从 ShareGPT 获取的对话数据集进行了微调,ShareGPT 是一个可以发布使用 ChatGPT 进行的不同对话的网站。

为了对 Vicuna 进行基准测试,开发人员使用了一种有趣的方法。 他们向 Alpaca、Bard 和 ChatGPT 等不同模型提供提示,然后为每个模型生成一个分数。 结果,LLaMa 得分最低,因为它没有微调,而 Alpaca 表现不错。 然而,Vicuna 的表现优于 Alpaca,并且在测试中非常接近 Bard。 ChatGPT 得分为 100%,因为这是对标的模型。

值得注意的是,为聊天机器人构建评估体系依然是一个悬而未决的问题,需要进一步研究。 如何针对不同的模型制定出最佳的提示策略是研究的重要方向之一,因此针对单一模型的评估方法仍然很有价值。

img

2. GPT4ALL

img

  • 官网: https://gpt4all.io/index.html
  • GitHub: https://github.com/nomic-ai/gpt4all
  • Python API: https://github.com/nomic-ai/pygpt4all
  • Web UI: https://github.com/nomic-ai/gpt4all-ui

GPT4ALL 是最近发布的语言模型,一经推出就在 NLP 社区引起轰动。 它是由一家名为 Nomic AI 的公司在 LLaMA 语言模型之上构建的,可以用于商业目的(有在 Apache-2 许可下发布的 GPT4ALL-J)。 然而,需要注意的是,用于训练模型的数据是使用 OpenAI 的 GPT-3.5 turbo API 生成的,这可能是会违反 OpenAI 的服务条款。 因此,在更好地理解其训练数据的法律含义之前,不建议将该模型用于商业目的。

GPT4ALL 是一个有趣的项目,它建立在 Alpaca 和其他语言模型的工作之上,使用特定数据集微调语言模型并对其进行扩展,通过使用大量的提示-响应对来训练更健壮和通用的模型。 提示-响应对使用 GPT-3.5 turbo 生成,生成的数据集使用 Nomic AI 开发的工具进行过滤,该工具可以轻松搜索和过滤提示-响应对。

GPT4ALL 另一个有趣的特性是它能够在 Apple 的 M1 和 M2 芯片上运行。这个特性让 GPT4ALL 可以在笔记本电脑、手机等便携式设备上运行。GPT4ALL 的创建者提供了在这些设备上设置模型的详细说明,这使得用户可以轻松上手该工具。

性能方面,GPT4ALL 可与一众最先进的语言模型相媲美。 Nomic AI 报告称,该模型实现了较低的事实困惑度,这是语言模型广泛使用的基准。这表明 GPT4ALL 能够对范围广阔的提示生成高质量的响应,并且能够处理复杂而细微的语言任务。

3. Koala

img

  • 主页: https://bair.berkeley.edu/blog/2023/04/03/koala/
  • GitHub: https://github.com/young-geng/EasyLM
  • Demo: https://chat.lmsys.org/?model=koala-13b

Koala 模型是为学术研究而创建的对话模型,在基于对话的两种类型(Distillation Data/Open-source Data)监督微调数据集上进行了训练。该模型建立在 LLaMA 之上,并且评估表现通常优于 Alpaca ,并且在超过一半的情况下与 ChatGPT 接近。

Koala 主要利用从网络上抓取的数据进行训练,大部分是对话数据,包括来自 ChatGPT 和其他公共数据集的数据。 构建 Koala 的 LLaMA 模型接受了数万亿 token 的训练,使其始终成为强大的科研模型。Koala 的训练代码、模型权重以及权重增量都在 Meta AI 的许可限制下公开可用 。100 名不同人士使用 Amazon Mechanical Turk 对该模型进行了对话微调和评估。

用于训练 Koala 的数据集是高质量小数据集的集合,包括来自 SharedGPT 的 ChatGPT 蒸馏数据,去重和去除非英语数据后包含约 30,000 个示例。 实际训练中使用了更多的数据集,例如 Human GPT Comparison Corpus 和其他开源数据集,例如 30K Open Instruction Generalist standard Stanford 数据集,20K OpenAI webGPT 和 93K OpenAI summarization。 这些是公开可用的各种数据集,都在训练期间使用过。

Koala 的优势不在于数据量,而在于数据质量。他们精选了问答、人类反馈和与现有大型语言模型对话的组合来创建用于训练 Koala 的数据集。 人类评估在提高 Koala 表现方面起着至关重要的作用。

全开源模型

4. Dolly 2.0

在这里插入图片描述

  • 博客主页: https://www.databricks.com/blog/2023/04/12/dolly-first-open-commercially-viable-instruction-tuned-llm
  • GitHub: https://github.com/databrickslabs/dolly/
  • Huggingface 主页: https://huggingface.co/databricks/dolly-v2-12b

Dolly 2.0 是 Databricks 最近发布的模型,这是 Dolly 模型的第二个版本。 Databricks 开发 Dolly 2.0 的目标是制作一个既可用于商业又可用于研究的模型。他们所做的主要改动之一是将基础模型由 LLaMa 换成 Pythia,然后对其微调以获得出色的效果。Databricks 意识到他们之前使用的基于 ChatGPT 或 GPT-3 生成的数据集不适合商业用途,因此他们创建了一个包含 15,000 个指令任务的新数据集,并由公司 5,000 名员工标记了数据。

Databricks 让员工标注数据包括七项具体任务:

  • 开放式问答,涉及提出可能有或可能没有正确答案的问题,需要了解世界。
  • 封闭式问答,可以使用参考文本中的信息回答问题。
  • 从维基百科中提取信息,注释者在其中复制段落并提取事实信息。
  • 通过将段落提炼成简短的摘要来总结来自维基百科的信息。
  • 头脑风暴,要求开放式构思和可能选项列表。
  • 分类,注释者在其中对类成员资格或文本属性做出判断。
  • 创意写作涉及写诗或情书等任务。

5. OpenAssistant

在这里插入图片描述

  • 主页: https://open-assistant.io/
  • GitHub: https://github.com/LAION-AI/Open-Assistant
  • Demo: https://open-assistant.io/chat

Open Assistant 是由 Yannic Kilcher,一位备受欢迎的 YouTube博主,以及来自 LAION AI 和开源社区的一些开发者发起的项目。 该项目旨在构建一个完全开源的 ChatGPT 风格的项目。允许用户在线使用该模型或根据特定需求对其进行微调。

Open Assistant 的用户界面跟 ChatGPT 非常类似,都是对话式交互。用户可以单击进入不同的聊天并开始与模型对话。到目前为止,oasst-sft-6-llama-30b 模式是列表中唯一可选的模型,它在 Open Assistant 数据集上进行了监督微调,并可通过多个预设参数进行调整,例如 top-ktop-ptemperature。 Open Assistant会根据社区反馈更改这些设置以获得更好的响应。

img

Open Assistant 最吸引人也是最独特的部分是其基于 Web 的仪表板,它允许用户完成任务并帮助训练 AI 模型。 用户可以从各种类型的任务中进行选择,例如对提示进行分类或对模型回复进行排名。完成任务会获得积分,用户可以在仪表板上跟踪他们的进度和级别。甚至会显示排名前 5 的贡献者。这是模型创建者需要考虑的关键事项,因为模型访问的数据越多(越开放),其性能就越好。一套友好的用户界面是大家积极使用并为项目做出贡献的好方法。

img

如果您想基于 Open Assistant 开发应用,可以查看 Open Assistant 的 GitHub 代码库。该项目发布了许多不同的模型,还发布了完整的数据集。


以上是本文全部内容。

希望您能从本文中有所收获,感谢您的阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/555320.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jdk13至15——文本块特性

文本块在jdk13中第一次预览,jdk14第二次预览,jdk15正式版; 终于不用在多行字符串中加一堆\n和一堆\"和一堆了; 之前需要这么麻烦: Testvoid test() {String s "testabcd\n" "aaa\n" "…

【机器学习】贝叶斯分类与概率图模型

文章目录 第五章 贝叶斯分类与概率图模型5.1、贝叶斯决策与贝叶斯分类5.1.1、贝叶斯基本原理5.1.2、朴素贝叶斯分类器(naive bayes)5.1.3、半朴素贝叶斯 5.2、有向图与无向图一般概念5.2.1、有向图5.2.2、无向图5.2.3、条件独立性5.2.4、图模型推理的概念…

海睿思分享 | 浅谈企业数据资产管理

1、什么是数据资产 与实物资产、无形资产一样,数据资产首先表现为是一种资源。也就是说,并非所有的数据资源都可以升级为数据资产。作为“资产”的数据资源,大体表现为以下两种形式:一是可以通过合理应用创造出新的价值。二是通过…

【k8s】Jenkins实现Java springboot应用CI、CD实践 【二】

一、运行Jenkins流水线流程思路: 场景1:常规java应用,使用jenkins pipeline 交付到Kubernetes集群中1、准备好java代码、Dockerfile、 deploy. yaml资源清单文件CI阶段: 1、获取代码 2、漏洞扫描 3、检测漏洞扫描结果,如果正常则…

OpenAI ChatGPT3.5-turbo实际解决问题能力评测

OpenAI ChatGPT3.5-turbo实际解决问题能力评测 ​ 程序员在coding的时候会经常遇到需要查阅资料的情况,最好的结果是直接能拿到一份好用的demo版本code,本次我们来评测:bing搜索和chatGPT3.5,解决实际问题:“html 图片…

【Proteus仿真】51单片机矩阵按键+中断+数码管显示+串口输出

【Proteus仿真】51单片机矩阵按键中断数码管显示串口输出 📌相关篇《【Proteus仿真】51单片机矩阵按键扫描外部中断使用》📍《【Proteus仿真】51单片机串口输出实验》🎈 《【Proteus仿真】51单片机定时器计数共阴数码管驱动显示》 &#x1f5…

PMP-敏捷管理知识总结

敏捷管理 敏捷管理 01敏捷开发是一种以人为核心、迭代、循序渐进的开发方法,在敏捷开发中,项目的构建被切分成多个子项目,各个子项目的成果都经过测试,具备集成和可运行的特征 。 敏捷项目管理简化了繁琐的流程和文档管理&…

考研考公太卷了,出国留学能弯道超车吗?

这届年轻人太难了! 国内高考人数越来越多,考上好大学的难度很大。2022年,高考报名人数是1193万,但考上本科的只有466万,考上双一流大学的不足50万,上双一流大学考生的比例不到5%。 高考只是卷的开始&…

软件代码设计-小优化(五)

产品需求: 按照天统计策略信收信人数和收信次数。以前策略信只有发送是没有收集的,现在要数据咋办,得收集啊。 设计方案: 因为策略信的发送是在一个单独的工程里,没有连接数据库。于是收集策略信放到了redis的list里&a…

第03章 流程控制语句

流程控制语句是用来控制程序中各语句执行顺序的语句,可以把语句组合成能完成一定功能的小逻辑模块。 程序设计中规定的三种流程结构,即: 顺序结构 程序从上到下逐行地执行,中间没有任何判断和跳转。 分支结构 根据条件&#xff0…

软件测试理论----测试设计方法论

1、测试用例格式 (1)用例编号:用例的唯一标识,要求具有易识别性和易维护性,能能够根据用例编号识别用例的目的和作用,一般格式为:A-B-C-D 其中 A:一般表示产品或者项目名称B&#…

Linux的启动流程

文章目录 Linux的启动流程BIOS、boot loader与kernel加载BIOSboot loader加载内核检测硬件与 initramfs 的功能 Linux的启动流程 本文章参考: [Uncertainty!!]的Linux的启动流程 Linux的启动流程是一个非常复杂的过程,下面是对Linux启动流程的详细分析&a…

JDBC-Java与数据库之间的桥梁

1、JDBC 1.1、数据的持久化 持久化(persistence):把数据保存到可掉电式存储设备中以供之后使用。大多数情况下,特别是企业级应用, 数据持久化意味着将内存中的数据保存到硬盘上加以”固化”,而持久化的实现过程大多通过各种关系数…

IO流详解

IO流 1. 文件 1.1 什么是文件 文件对大家来说都不陌生: 文件是保存数据的地方,它可以保存文字、图片、视频等等例如大家平时使用的word文档、Excel文档、PPT文档等都是文件 1.2 文件流 文件在程序中是以流的形式来操作的流是指数据在数据源&#x…

mydumper - 备份恢复工具

文章目录 介绍部署安装功能 参数详解mydumpermyloader配置文件 实际示例操作性能验证 补充definerlock 总结相关链接 介绍 部署安装 # 当前最新 release wget https://github.com/mydumper/mydumper/releases/download/v0.14.4-8/mydumper-0.14.4-8.el7.x86_64.rpm# 安装 rpm…

Linux 之 firewalld 防火墙

目录 firewalld概述firewalld 与 iptables 的区别:firewalld 区域的概念firewalld防火墙预定义了9个区域:firewalld 数据处理的流程 firewalld防火墙的配置方法:永久保存配置 firewalld概述 firewalld防火墙是Centos7系统默认的防火墙管理工具&#xff…

数据分析与预处理常用的图和代码

1.训练集和测试集统计数据描述之间的差异作图&#xff1a; def diff_color(x):color red if x<0 else (green if x > 0 else black)return fcolor: {color}(train.describe() - test.describe())[features].T.iloc[:,1:].style\.bar(subset[mean, std], alignmid, colo…

国内做校园信息化的龙头企业公司有哪些?

随着数字化转型的加速&#xff0c;越来越多的学校开始寻求校园信息化的解决方案&#xff0c;相比于传统信息化模式&#xff0c;国内有哪些做校园信息化做得比较好的企业&#xff1f;他们采用的又是什么样的方式&#xff1f; 一文带你了解&#xff0c;零代码平台搭建校园信息化…

Android 14 又来了?别扶!抬起我来吧!

Android 14 又来了&#xff1f;别扶&#xff01;抬起我来吧&#xff01; 大家好&#xff0c;好久不见&#xff0c;从去年底写完年终总结之后就再也没有更新过文章&#xff0c;之前最多也就间隔一两个月时间&#xff0c;但这回间隔时间确实有点长&#xff0c;基本快半年了&…

每日一练 | 网络工程师软考真题 Day7

1、如果希望别的计算机不能通过ping命令测试效劳器的连通情况&#xff0c;可以 &#xff08;1&#xff09; 。如果希望通过默认的Telnet端口连接效劳器&#xff0c;那么下面对防火墙配置正确的选项是 &#xff08;2&#xff09; 。 &#xff08;1&#xff09; A&#xff0…