2023 年热门的大型语言模型 (LLMs)汇总【更新至9月26】

news2024/12/24 8:27:15

一、全景地图

整理了一张大语言模型的血缘图谱,如下图所示:

图中的大语言模型,都是自己做过评测的,主观了点,但是原汁原味,有好的可以推荐给我。

二、ChatGPT系列

ChaTGP是商业版本大语言模型的正统,但是因为各种各样的关系,衍生出来了三个不同的方向,从而形成了ChatGPT系,这里面包括ChatGPT,Claude和Bing Chat。这三者的血缘关系如下图所示:

目前为止,以上三者是大语言模型的天花板,从战力水平和能力层次来讲:ChatGPT = Bing Chat > Claude。Claude是ChatGPT项目前成员出走搞出来的东西,水平仅次于ChatGPT。微软是OpenAI最大的股东,所以Bing Chat是否构建在ChatGPT基础之上,所以二者战力水平相当。

附件:openAI 发展大事记

2020 6 OpenAI 发布了 GPT-3 ,这是一种基于互联网上数万亿个单词训练的语言模型。 它还宣布,一个相关的 API ,简称为“ API” ,将成为其第一个商业产品的核心。 GPT-3 旨在以自然语言回答问题,但它也可以在语言之间进行翻译并连贯地生成即兴文本。微软于 2020 9 22 日取得 GPT-3 独家授权。
2021 1 OpenAI 推出了 DALL-E 。 一年后,他们的最新系统 DALL·E 2 4 倍的分辨率生成更逼真、更准确的图像。
2022 11 30 OpenAI 发布了一个名为 ChatGPT 的自然语言生成式模型,它以对话方式进行交互。在研究预览期间,用户注册并登陆后可免费使用 ChatGPT 。但是该项目对一些包括中国大陆、香港在内的地区暂不可用。
2023 1 5 ,华尔街日报报道, ChatGPT 背后的研究实验室 OpenAI 正在谈判以收购要约的形式出售现有股份,交易对该公司的估值达到 290 亿美元左右,使其在没有什么收入的情况下成为账面上最值钱的美国初创公司之一。风投公司 Thrive Capital Founders Fund 正在商谈投资该笔交易。
2023 1 23 ,微软对 OpenAI 进行 100 亿 美元的投资; OpenAI 是爆红的 ChatGPT 聊天机器人的创造者。微软此前已经在 2019 年向 OpenAI 投资了 10 亿美元,目前正尝试在其必应 (Bing) 搜索引擎和微软设计应用中执行这款人工智能软件。

三、Lama系列

Llama2被称为大语言模型开源领域的安卓,是开源大语言模型的基石,给予Llama诞生了羊驼家族大语言模型。Llama大语言模型家族图谱如下所示:

四、国产系列

国际领域大语言模型之外,国内大语言模型也是蓬勃房展,目前已知的大语言模型就有一百二十多个,但是大部分都不成气候,通过实测,从直观体验来看,目前只有百度的文新一言,阿里的千问还算勉强可以。文新一言主要是矮子里面拔将军,阿里前问,主要是因为其开源到底。其他大语言模型,尤其是搞了三天就超越chatGPT的,基本上不需要浪费时间。

鬼知道他们的大语言模型哪里来的?石头缝里蹦出来个孙悟空,还能再蹦出个国产大语言模型来。这个概率不太高,不说国家的计划生育政策是否允许,但就经济压力而言,实力也不允许不是。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1043590.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ModuleNotFoundError: No module named ‘Crypto.Cipher‘或‘Crypto 的终极解决方案

1、安装wapiti漏洞扫描工具,出现这个错误,先安装pycrypto,因为在python3以上的版本中,Crypto包名变了。 1)尝试安装: pip install pycrypto 2)安装成功,找到本地python安装目录&a…

processflow基于私有云存储的多人实时协作尝试

前言 继上一篇基于oneDrive实现多人协作之后,发现Onedrive存在诸多限制之处,比如国内网络环境很差,多人协作还需要processflow用户自己注册oneDrive账号,然后oneDrive系统内进行文件分享,才能拿到分享链接进行多人协作…

一文教你学会Makefile脚本的简单应用

一文教你学会Makefile脚本的简单应用 一.什么是Makefile脚本二.Makefile语法三.使用Makefile编译多个文件3.1 运行脚本3.2 利用Makefile删除不必要文件 四.Makefile进阶语法4.1在Makefile中使用变量4.2 Makefile中通配符 五.总结 一.什么是Makefile脚本 Makefile其实就是一种脚…

Nginx:location与rewrite

目录 一.location与rewrite区别 1.1.基于Nginx的location与rewrite常用的正则表达式(Nginx的正则表达式) 二.location模块 2.1.location的三种匹配类别 2.2.location的常用匹配规则 2.3.location匹配优先级 2.4.location模块使用实例 三.rewrite…

第2讲:Vue开发环境的搭建及运行

Vue开发环境搭建步骤 1、安装node http://www.nodejs.com.cn/ 一般安装在根目录下,直接下一步下一步安装即可。如何检测安装完毕 node -v 2、第二步:安装vue-cli脚手架 npm install -g vue/cli ,查看安装版本 vue --version 3、第…

Buildroot添加自定义文件

在日常开发中,我们经常会向buildroot文件系统里添加自定义文件。本文介绍几种添加的方法 一、buildroot/system/skeleton目录 skeleton能够在目标文件系统编译完成后将指定文件覆盖到某个目录。通过这种方式,我们可以方便地添加或修改一些文件到根文件系…

【lesson11】环境变量

文章目录 环境变量的认识main函数参数问题 环境变量的认识 我们知道我们运行自己写的可执行程序的时候,我们必须带路径才能运行,可是执行系统指令的时候不用路径就能运行。 演示: 问题:系统命令可以直接运行,自己写…

单链表详细解析|画图理解

前言: 在前面我们学习了顺序表,相当于数据结构的凉菜,今天我们正式开始数据结构的硬菜了,那就是链表,链表有多种结构,但我们实际中最常用的还是无头单向非循环链表和带头双向循环链表,我们今天先…

删除表

MySQL从小白到总裁完整教程目录:https://blog.csdn.net/weixin_67859959/article/details/129334507?spm1001.2014.3001.5502 语法格式: drop table 表名; 说明:连同表结构、表中的数据都删除 案例:删除test03表,并验证 mysql> desc test03; ---…

安装Pymc3模块包问题记录

首先跟着各个方法安装,都不行,导入pymc3包时,就会报各种错;最后找了好几个博客跟着修改,最终才把pymc3包安装上了,也能导入进去了。 重新整理下安装步骤: 1、下载安装Anaconda3: …

【趣味JavaScript】5年前端开发都没有搞懂toString和valueOf这两个方法!

🚀 个人主页 极客小俊 ✍🏻 作者简介:web开发者、设计师、技术分享博主 🐋 希望大家多多支持一下, 我们一起进步!😄 🏅 如果文章对你有帮助的话,欢迎评论 💬点赞&#x1…

在C或C++中查找内存泄漏

编程软件中的内存泄漏可能很难精确定位,因为这里面有大量的数据。本文中,您可以学习如何借助运行时错误检测工具查找C和C应用程序中的内存泄漏。 什么是内存泄漏?C和C语言实例 What Is a Memory Leak? 当您面临内存泄漏时,C和C…

师德师风演讲稿写作格式:如何用三句话吸引听众的注意力

写师德师风演讲稿时,可以按照以下格式进行写作: 1. 开头部分: a. 引起听众的兴趣,可以使用一个引人入胜的故事、一个有趣的事实或者一个引人思考的问题。 b. 简要介绍自己以及演讲的主题。 2. 主体部分: a. 阐述师…

多维时序 | MATLAB实现GWO-BP多变量时间序列预测(灰狼算法优化BP神经网络)

多维时序 | MATLAB实现GWO-BP多变量时间序列预测(灰狼算法优化BP神经网络) 目录 多维时序 | MATLAB实现GWO-BP多变量时间序列预测(灰狼算法优化BP神经网络)效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.MATLAB实现GWO-BP多变量时间序列预测(灰狼算法优化BP神经网络)&…

华为云云耀云服务器L实例评测 | 云服务器搭建自己的gitlab代码仓库手把手教学

📋 前言 🖱 博客主页:在下马农的碎碎念🤗 欢迎关注🔎点赞👍收藏⭐️留言📝✍ 本文由在下马农原创,首发于CSDN📆 首发时间:2023/09/26📅 最近更新时…

crypto:Quoted-printable

题目 解压文件后可得到提示文本 好了这个没接触过,参考别的大佬wp QP为可打印字符编码,根据加密方式任何一个8位的字节值可编码为3个字符:一个等号“”后跟随两个十六进制数字(0–9或A–F)表示该字节的数值。 利用网…

完全背包 动态规划 + 一维dp数组

动态规划:完全背包理论基础 每件商品都有无限个!!! (1)0-1背包的核心代码 解决0-1背包问题(方案二):一维dp数组(滚动数组)_呵呵哒( ̄…

CodeWhisperer,非常丝滑的AI代码神器

文章目录 什么是 Amazon CodeWhisperer?快速上手CodeWhisperer安装配置如何使用 Amazon CodeWhispererCodeWhisperer初体验:hello world Python语言快速入门向文件写入数据读取csv文件排序算法之冒泡排序设计模式之单例模式 使用CodeWhisperer快速上手Py…

这本书竟然把JAVA讲的如此透彻!漫画JAVA火爆出圈!

亲爱的粉丝们,你是否曾经为学习JAVA而苦恼?繁复的代码和复杂的逻辑常常让人感到头大。不过,今天我要为大家介绍一本神奇的书——《漫画JAVA》,它以图文并茂的方式,轻松诙谐地讲解了JAVA的方方面面。在这篇文章中&#…

基于.Net Core实现自定义皮肤WidForm窗口

前言 今天一起来实现基于.Net Core、Windows Form实现自定义窗口皮肤,并实现窗口移动功能。 素材 准备素材:边框、标题栏、关闭按钮图标。 窗体设计 1、创建Window窗体项目 2、窗体设计 拖拉4个Panel控件,分别用于:标题栏、关…