强推!大语言模型『百宝书』,一文缕清所有大模型!

news2024/9/22 10:00:15

图片

 夕小瑶科技说 原创
 作者 | 王思若

最近,大型语言模型无疑是AI社区关注的焦点,各大科技公司和研究机构发布的大模型如同过江之鲫,层出不穷又眼花缭乱。

让笔者恍惚间似乎又回到了2020年国内大模型“军备竞赛”的元年,不过那时候大模型海量算力需求限制了这注定只是少数科技公司的赛场,如今用少量资源即可在基础模型上做指令微调、人类反馈以应用到某个垂直领域,LLMs领域当前呈现出‘吊诡’的繁荣,模型和数据集存储库Hugging Face中已经有近16000个文本生成模型,社区每周都会有数百个新的模型发布,Hugging Face从2022/12到2023/6的六个月内就新增了10万个模型,一方面投资者鼓吹落地,似乎新的范式已到,另一方面,各色研究机构生怕赶不上潮流,都试图在大模型领域留下自己的一个身位。

无论如何,舞台的聚光灯早已汇聚到大模型上,在这寸‘你方唱罢,我登场’的舞台上,笔者细捋一下大型语言模型的师承和脉络,略有偏颇,欢迎小伙伴在评论区留言补充~

github地址:
https://github.com/WangHuiNEU/llm

大模型可以分为基座模型和在基座模型上进行指令微调、人类反馈对齐等instruction-tuning之后的微调模型。但实际上,正如艾伦研究所的文章‘How Far Can Camels Go?’所指明的:不同的指令微调数据集可以释放或者增强特定的能力,但并没有一个数据集或者组合可以在所有的评估中提供最佳性能,因此,我们需要一个更大强大的基座模型。

大模型研究测试传送门

GPT-4能力研究传送门(遇浏览器警告点高级/继续访问即可):(https://gpt4test.com)

实际上,更简单的可以理解为,指令微调并不会为模型增加新的能力,基座模型本身奠定了应用的范畴,指令微调只是用极少量的数据快速激发出某个领域范畴的能力强弱。实际微调过一些大模型的小伙伴可能会对此感触颇深,因此,更加合理的大模型故事线是围绕基座模型。下面将针对Google系、Meta系、OpenAI系和其他科技公司的基座模型,和基于基座的一些微调模型进行详细展开。

图片

大模型的进化树

一、Google系模型

Google在大模型赛道一直是最受关注的存在,但尴尬的是,面对着ChatGPT的强势猛攻,占据搜索领域绝大部分份额的Google在新型的检索生成竞赛中不可能猛然转身去动其核心的搜索广告业务,但在大模型领域,Google有着最为深厚的积累,例如,在2017年提出Transformer架构,2021年提出的Pathways架构在笔者看来更是将工程优化推到了极致。

Google原本分别有两个研究小组:Google Brain和Deepmind,但在今年4月合并为了 Google Deepmind,但这里依然分开去讲述。

1. 基座模型

Google Brain

模型名称时间是否开源参数规模
T52019-1013B
LaMDA2021-05137B
PaLM2022-04540B

有趣的是,LaMDA是Google早在2020年就被开发和推出的对话式语言模型,但Google考虑安全问题拒绝对公众开放,首席研究员 Daniel De Freitas 和 Noam Shazeer 因此沮丧地离开了公司【去年9月,这两位成立了基于 LLM 的聊天机器人网站Character.AI,也算是一直坚持自己的目标了】,Google在对话生成方向起了个大早,赶了个晚集,手动狗头~

PaLM是基于Google提出的高效模型训练的下一代AI架构Pathways构建的超大语言模型,5400亿的参数量,是目前最大的稠密Transformer模型,也是目前综合性能最强大的基座语言模型。

DeepMind

模型名称时间是否开源参数规模
Gopher2021-12280B
Chinchilla2022-0470B

Chinchilla是DeepMind重新思考了大模型的scaling laws(缩放定律),实证研究分析得出数据规模和参数规模一样重要,因此,训练得到的Chinchilla用仅Gopher1/4参数量反而性能显著超越Gopher,训练数据规模和训练参数一样重要!

Google DeepMind

模型名称时间是否开源参数规模
PaLM 22023-05340B(小道消息,未证实~)

4月,Google决定集中力量办大事,Google Brain和DeepMind合并为Google DeepMind。5月,谷歌I/O 2023大会,Google提出了更为强大的PaLM 2,合理的大模型缩放法则+多样化的数据集,PaLM 2无疑是Google在这波浪潮中保持头部地位的底气所在。

2. 指令微调模型

单位模型名称基座模型是否开源
Hugging FaceT0T5
GoogleFLANT5
GoogleFlan-T5/Faln-PaLMT5/PaLM
GoogleBard(生成人工智能聊天机器人)之前是LaMDA,后面是PaLM 2

基于基座模型,进行instrucion-tuning可赋予模型强大的对齐能力。这里有趣的是,2 月 6 日,Google 宣布推出 Bard,这是一款由 LaMDA 提供支持的对话式生成人工智能聊天机器人,但刚开始推出时,相对于ChatGPT差劲的性能一度让Google的股价下跌了8%,后续Google基于更强大的LaMDA做了改进,但无论内部和外部都质疑声不断,5月,Google I/O大会宣布基于PaLM 2模型对Bard做了更新。

Bard无疑是Google面对ChatGPT的回应,但检索广告占其总收入的60%,Google做不到像Bing一样直接将检索生成加入到浏览器结果中,。Google在这里选择了不同的道路,将检索和Bard做成两款互补的产品,目前Bard也一直在 bard.google.com 这块小空间里圈地自萌,目前Google计划结合基于AlpaGo中使用的技术开发出更为强大的模型Gemini。

二、Meta系模型

Meta可是所有巨头中最为拥抱开源的科技公司,Meta AI基础人工智能研究院团队首席人工智能科学家Yann LeCun表示:让AI平台安全良善实用的唯一方法就是开源。当然,Meta的开源模型也造福了国内绝大多数的大模型玩家们,再次手动狗头~

1. 基座模型

模型名称时间是否开源参数规模
OPT2022-05125M-175B
LLaMA2023-027B-65B

开源先行者Meta在OpenAI选择闭源GPT-3的情况下,对标GPT-3,直接开源千亿参数的OPT模型,但OPT相对比GPT-3模型性能差一些。之后,启发于DeepMind发现的缩放法则,Meta缩小了模型参数在更大的数据集上训练了LLaMA(Large Language Model Meta AI),130亿参数的模型与GPT-3性能大致相当,650亿参数的模型性能可以媲美Chinchilla-70B和PaLM-540B,大模型开启驼系(LLaMA)时代~

2. 指令微调模型

单位模型名称基座模型是否开源
MetaOPT-IMLOPT-175B
StanfordAlphacaLLaMA
StanfordVicunaLLaMA

LLaMA无疑最常被大家当做基座模型用来做指令微调适配到法律、医学等专业领域,特别是7月19日,Meta AI发布可免费商用的开源模型LLaMA 2, 包括7B, 13B和70B三种规模,动手快的已经用中文数据做了指令微调,例如,Llama2-chinese几天时间star数飙升1.7k,拼手速的时候到了~

图片

图片

LLaMA变体,图来源于《A Survey of Large Language Models

LLaMA的徒子徒孙们,有驼系(羊驼Alpaca, 小羊驼Vicuna),动物园系(考拉Koala,山羊Goat,熊猫Panda),神话系(姜子牙Ziya,白泽Baize),逐渐从动物园走向了神话传说~

三、OpenAI系模型

1. 基座模型

图片

如果追溯GPT系列发展的时间线,我们会发现这是一项横跨五年的技术探索,从GPT-2到GPT-3,其实也只是在几乎不改变模型框架的基础上从15亿的参数量迭代到1750亿,不同于Google推出T5、Switch Transformer和PaLM等一系列大模型的赛马机制,OpenAI‘矢志不渝’地坚持着GPT路线。

2. 指令微调模型

图片

2017年OpenAI提出RLHF(人类反馈强化学习,Reinforcement Learning from Human Feedback)技术;2022年,OpenAI将RLHF应用于GPT-3并开发出InstructGPT,相对于GPT-3更善于遵循用户意图,虽然参数量只有1.3B,比175B GPT-3模型参数少了100多倍,微调成本更是只有GPT-3的2%。

3月14日,GPT-4发布,OpenAI给出了技术报告和3分钟的预告片。GPT-4支持多模态,能够识图、生成歌词、做网站,并且刷爆了人类社会各个领域的考试,已经达到了哈佛、斯坦福等顶尖高校的水平。现已集成到微软New Bing和ChatGPT Plus。

微软Microsoft 365全面引入生成式AI助手Copilot,将GPT-4集成到了Word、Excel、PowerPoint、Outlook和Teams等应用中,用户可以提出问题并提示AI撰写草稿、制作演示文稿、编辑电子邮件、制作演示文稿、总结会议等。

四、开源社区、研究院和一些科技公司构建的大模型

1. 基座模型

为了打破 OpenAI 和微软对自然语言处理 AI 模型的垄断,前OpenAI研究副总裁Dario Amodei带领一批从OpenAI出走的员工创立了致力于提高AI安全和可解释性的人工智能安全和研究公司Anthropic。

Connor Leahy、Leo Gao 和 Sid Black 创立了专注于人工智能对齐、扩展和开源人工智能研究的组织EleutherAI。

之后Hugging Face 社区带头成立了BigScience项目,这是一个包容、开放、协作共享的大型语言模型(LLM)社区,围绕研究和创建超大型语言模型的开放式协作研讨会,由HuggingFace、GENCI和IDRIS发起的开放式合作,汇集了全球 1000 多名研究人员。

国内的包括北京智源人工智能研究院BAAI、清华和百度等也都打造了自己的基座模型。

组织模型名称时间是否开源参数规模
AnthropicAnthropic-LM v4-s32021-1252B
北京智源人工智能研究院天鹰Aquila2023-067B/33B
BaiduERNIE 3.02021-12260B
清华GLM2022-8130B
EleutherAIGPT-Neo2021-032.7B
EleutherAIGPT-J2021-066B
EleutherAIGPT-NeoX2022-0420B
BigScienceBLOOM2022-11176B

2. 指令微调模型

单位模型名称基座模型是否开源
北京智源人工智能研究院AquilaChat-7BAquila-7B
北京智源人工智能研究院AquilaChat-33BAquila-33B
BigScienceBLOOMZBLOOM
EleutherAIGPT-NeoXGPT-Neo
Baidu文心一言ERNIE 3.0
AnthropicClaude  2Anthropic-LM v4-s3

总结

本文总结了主流的基座模型以及对应的指令微调模型,希望社区的小伙伴多多讨论,一起努力构建更为强大的中文社区的语言模型~

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/815187.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

package-lock.json 作用

参照: https://www.cnblogs.com/honkerzh/p/16767566.html

【雕爷学编程】MicroPython动手做(25)——语音合成与语音识别

知识点:什么是掌控板? 掌控板是一块普及STEAM创客教育、人工智能教育、机器人编程教育的开源智能硬件。它集成ESP-32高性能双核芯片,支持WiFi和蓝牙双模通信,可作为物联网节点,实现物联网应用。同时掌控板上集成了OLED…

山西电力市场日前价格预测【2023-08-01】

日前价格预测 预测明日(2023-08-01)山西电力市场全天平均日前电价为310.15元/MWh。其中,最高日前电价为335.18元/MWh,预计出现在19: 45。最低日前电价为288.85元/MWh,预计出现在14: 00。 价差方向预测 1:实…

无涯教程-jQuery - css( properties )方法函数

css(properties)方法将键/值对象设置为所有匹配元素的样式属性。 css( properties ) - 语法 selector.css( properties ) 上面的语法可以写成如下- selector.css( {key1:val1, key2:val2....keyN:valN}) 这是此方法使用的所有参数的描述- key:value - 设置为样式属…

郑州https数字证书

很多注重隐私的网站都注重网站信息的安全,比如购物网站就需要对客户的账户信息以及支付信息进行安全保护,否则信息泄露,客户与网站都有损失,网站也会因此流失大量客户。而网站使用https证书为客户端与服务器之间传输的信息加了一个…

<Git>版本控制工具Git常见的开发操作

下载安装,环境变量配置直接百度; 1.代码拉取: 操作步骤:在正确配置完git的条件下:在本地文件夹下:右键–Git Bash -Here: 出现如下弹窗: 在黑窗口输入代码拉取路径(一般都是把命令和路径直接在外面写好,直接粘贴(在窗口右键,Paste)) 代码拉去…

JavaScript学习 -- 对称加密算法3DES

在现代的互联网时代,数据安全性备受关注。为了保护敏感数据的机密性,对称加密算法是一种常用的方法。在JavaScript中,3DES(Triple Data Encryption Standard)是一种常用的对称加密算法。本篇博客将为您展示如何在JavaS…

竞速榜实时离线对数方案演进介绍 | 京东云技术团队

一、背景 竞速榜是大促期间各采销群提供的基于京东实时销售数据的排行榜,同样应对大促流量洪峰场景,通过榜单撬动品牌在京东增加资源投入。竞速榜基于用户配置规则进行实时数据计算,榜单排名在大促期间实时变化,相关排名数据在微…

Chrome浏览器中的vue插件devtools的下载方式(使用Chrome应用商店/科学上网情况下)

目录 devtools对前端来说的好处——开发预览、远程调试、性能调优、Bug跟踪、断点调试等 下载步骤: 测试阶段: 最近做项目要使用devtools这个vue插件。 devtools对前端来说的好处——开发预览、远程调试、性能调优、Bug跟踪、断点调试等 下载步骤…

灭蚊灯上架亚马逊美国站UL1559测试报告办理

近年来,随着全球气候变暖和环境变化,蚊虫成为了世界各地人们的头疼问题。为了解决这一困扰,我司研发出一款创新的昆虫控制设备——灭蚊灯,并成功将其上架亚马逊美国站。为了满足亚马逊站对产品的要求,我们积极办理了UL…

寒假作业(蓝桥杯2016年省赛C++A组第6题 )

题目: 注:蓝桥杯2016年省赛C++A组第6题 请填写表示方案数目的整数。 题解: 由题可知这是一道全排列问题,因此我们可以使用c++的next_permutation函数对于1-13的数字进行全排列即可,并每次排列判断是否满足题意。 注意:你提交的应该是一个整数,不要填写任何多余的内…

测试|Selenium介绍及环境搭建

测试|Selenium介绍及环境搭建 1.Selenium是什么 Selenium是用来做web网站 UI自动化的测试工具/测试框架。 我们这里说的Selenium是Selenium2.0,它由Selenium IDE,Webdriver, Selenium Grid组成。 Selenium IDE是用于Selenium测试的完成集成开发环境&…

小程序反馈与投诉混淆官方修改指引

根据《微信小程序平台运营规范》5.14“混淆行为:5.14.1 恶意混淆腾讯官方功能”,相关违规类型包括但不限于以下类型。 官方“反馈与投诉”入口与样式: 违规类型1:混淆官方投诉入口 小程序中的投诉入口样式与官方投诉入口icon名称…

边缘检测(Canny算子)实现原理

当前,边缘检测算法在实际应用中越加广泛,技术趋势也是快速发展,热火朝天。很多朋友或多或少了解,需要实现各类功能,尤其是一些复杂的需求,实现更好的滤波、满足更佳的提取效果,一时半会儿无从下手。 下面小编就带大家了解关于边缘检测算子的实现原理。由于边缘检测算子常…

相约脑暴会,共创大未来——动态实时三维人体重建脑暴会

今夏我们召集江湖中的有识之士,共同探讨动态实时三维人体重建制作容积视频的方案,展开一场别开生面的脑暴会。在此,我们向全球开发者发出诚挚邀请,邀请您加入我们周三(8月2日)晚上八点通过腾讯会议进行的脑…

多重背包二进制优化

可以将混合背包看作是一个特殊的多重背包,只要转化一下即可,将s-1转为1s0转化为m/v(最大可能装下的货物); 二进制优化的精髓就在于选择物品的次数,比如有s7,我们可以分为1,2 ,4(二进制形式),1就代表选择一个…

HTTP协议+GET/POST区别

1. web开发流程 (1) HTML、CSS、JS、图片等资源通过浏览器进行整合,最终渲染出所需画面。 (2)浏览器对Web服务器进行资源请求 浏览器通过url请求资源。【HTTP协议、URL:确定唯一的一个资源】 浏览器请求…

DeepVO 论文阅读

论文信息 题目:DeepVO Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks 作者:Sen Wang, Ronald Clark, Hongkai Wen and Niki Trigoni 代码地址:http://senwang.gitlab.io/DeepVO/ (原作者并没有开源…

驶向专业:嵌入式开发在自动驾驶中的学习之道

导语: 自动驾驶技术在汽车行业中的快速发展为嵌入式开发领域带来了巨大的机遇。作为自动驾驶的核心组成部分,嵌入式开发在驱动汽车的智能化和自主性方面发挥着至关重要的作用。本文将探讨嵌入式开发的学习方向、途径以及未来在自动驾驶领域中的展望。 一、学习方向:…

备战携程面试:Redis Master-Slave异步同步进度独家解析!

Hello 大家好,我是你们的小米!今天我要和大家分享一道来自携程的面试题:Redis Master-Slave异步同步的话怎么判断Slave同步进度? Redis,作为一款非常火热的内存数据库,提供了Master-Slave的异步复制机制&a…