ChatGPT冷观察:没有大模型的土壤,开不出ChatBot的花

news2024/9/24 3:21:58

文|智能相对论

作者|叶远风

谁在跟风,谁又有真本事能做出中国版的对标产品来?

这恐怕是ChatGPT这股热潮以来,关心中国AI发展的业界人士最想问的问题。

或者说,在中国人工智能不落后于全世界的当下,业界也在普遍渴望一个真正有实力的ChatGPT类产品出现。

但是,在一个人人都有那么点AI底子、能说出一些AI技术成果的今天,如果没有专业的、系统的判断标准,这个问题可能很难有答案——风潮下人人都像是跟风的,也都像是有能力的。

不过,IDC刚刚发布的一个关于大模型的报告,却某种程度上“附带”解决了这个问题。

在《2022中国大模型发展白皮书》中,面向大模型的发展,IDC在行业首次提出大模型评估框架,通过多维度标准,对行业主要大模型的发展状况进行了系统化的判断和评分。

当大模型能力的判断有了较为权威的行业标准后,谁能做出真正的ChatGPT类产品,其实已经有了答案。

ChatGPT是AI的一大步,但只是大模型的一小步

在问能不能之前,先要问是什么。

虽然ChatGPT的问世已经有数个月的时间,但对多数人尤其是行业外的“吃瓜群众”而言,除了知道这是AI领域的一大突破外,对它究竟是什么并没有深入地了解。

实际上,ChatGPT就是一种大规模语言模型(LLM Large Language Model),是大模型在NLP领域不断发展的一种结果。

从技术角度看,目前大模型已经深入各个AI领域,如NLP、CV、科学计算等,但它最早发端于NLP,以谷歌的BERT、OpenAI的GPT和百度文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升。

随着“大本营”NLP领域大模型的不断进化,最终OpenAI的GPT率先开出了ChatGPT这朵花。

所谓GPT,即Generative Pre-Trained Transformer,就是通过Transformer为基础模型,使用预训练技术得到通用的文本模型。

GPT家族已经先后拥有GPT-1,GPT-2,GPT-3,以及图像预训练iGPT等模型,ChatGPT本质就是GPT-3.5,只不过因为强大的对话能力突然爆火起来。不同的是,ChatGPT采用了新的指示学习(Instruction Learning)和人工反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来指导模型的训练,前者带来了理解能力,后者增强了模型效果。

无论如何,大模型良好的通用性、泛化性,以及显著降低人工智能应用门槛的优势,在ChatGPT上得到了淋漓尽致的展示。

从这个意义上看,任何NLP领域的大模型,在良好的发展之后,都会、都可以生长出自己的ChatGPT,或者,更专业的概念称为ChatBot类产品。

“智能相对论”总结目前市面上领先的NLP大模型以及ChatBot产品如下:

从这个列表可以看出两件事:

1、所有成型的ChatBot都只能是大模型发展的一种产品化结果,国外Google的Bard、国内百度的文心一言(ERNIE Bot)都是如此,其本质都是前期大模型家族的最新产品。

2、不管哪个ChatBot,能做得怎么样,几乎都取决于前期大模型家族的发展情况。

对大多数缺乏优秀大模型基础的厂商而言,要么必须花长周期重走一遍类似从“文心”到“文心一言”的路径,要么就绕过大模型直接做ChatBot——其质量可想而知。

而判断大模型家族的基础究竟如何,IDC的报告刚好就起到了作用。

此次IDC为了充分评估大模型技术能力、功能丰富度与底层深度学习平台开发能力,以及对各行业赋能的实际效果,并考虑到大模型的未来商业化前景,搭建起了大模型评估框架V1.0:

最终,IDC中国将大模型市场服务划分成了L1-L5五个层级(层级越高,厂商在大模型市场梯队越靠前),最终评价结果是当前大部分厂商能力处于L2-L3层级。其中,最为凸显的是唯一处在第一梯队的百度文心大模型,产品能力、生态能力达到L4水平,应用能力达到L3水平:

目前,被IDC高度评价的文心大模型已经建设了包括基础大模型(NLP、CV、跨模态)、任务大模型、行业大模型三大类在内的36个大模型。IDC认为,百度文心大模型在产品能力上呈现出较强技术实力和平台积累,“文心大模型+深度学习平台”创新了人工智能研发应用范式,满足市场大规模落地需求,达到行业前端水平。

IDC中国副总裁兼首席分析师武连峰表示,“大模型的背后蕴藏着一场人工智能落地模式的变革。如今火爆全球的ChatGPT背后的技术支撑正是大模型。没有对大模型的长期投入,就不会诞生ChatGPT这样的应用。在IDC提出的大模型评估框架下,百度文心大模型在本次评估中表现非常突出,是其打造文心一言的坚实基础。”

因此,国内已经宣布要做ChatGPT类产品的科技大厂中,能够最终做出类ChatGPT产品的,可能还是只有拥有中国科技企业最成熟的大模型开发工具和产品体系的百度。

当然,这个结果并不意外,国内长期坚持在大模型领域投入的,百度就是其中一。

大模型评估框架下,ChatBot两种发展路径显现

既然IDC以权威、系统的方式证明了国内(主要是百度文心、文心一言)有充分的推出ChatBot的大模型基础能力,那么为什么最先走出来被广泛关注到的还是ChatGPT?

如果从文心的发展与GPT的发展对比来看,大模型时代,ChatBot的两种发展路径的不同已经显现出来。

早在2019年3月,百度就做出了文心 ERNIE 1.0,这一技术创新与“同类”GPT-1、BERT的差距都只有几个月,且百度积累的大规模知识和海量多元数据,让文心得以快速发展。

到了2021年,ERNIE 3.0大模型即拥有千亿参数,后来ERNIE 3.0 Titan更是达到了2600亿。

这个发展过程,百度也逐渐构建起一套包括文心大模型层、工具平台层、产品与社区的三层体系,这就是IDC在报告中强调的,“模型+工具平台+生态”三级协同加速产业智能化。

说白了,百度从一开始就在想着怎么让文心大模型进产业、怎么落地获得商业价值,也是按照这个“总纲”在走、在设计其整个体系。

最典型如,文心已累计发布11个行业大模型,在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例,盯住的是解决客户的实际痛点,把大模型能力应用到客户业务流程关键环节中,求技术效果突破、求产品创新、求生产流程变革、求降本增效,等等。

在这些行业大模型往下,还有任务大模型、基础大模型的全力支撑;再往上,又有工具、产品的落地转化。

这种体系化面向产业的做法,一方面源于中国独特的产业智能化需求的大背景,另一方面与百度将AI的发展更多地转向现实产业价值有关。

如果说这种做法有什么后果,那就是集中B端落地、晦涩的技术和产品带来的技术认知不足。

现在,大洋彼岸的ChatGPT突然搞出了“大新闻”,举起了旗帜,文心基于此前的能力积累也能做出类ChatGPT的面向C端大众的ChatBot产品文心一言,于是,这就成了百度彰显自身技术能力的一个契机。

反过来看,ChatGPT则先面向C端做出了老少咸宜的大众化可触达产品,相似的技术底子下,声量自然就更高。

毫无意外的是,在OpenAI的布局中,ChatGPT接下来也会尝试走入更多垂直产业中发挥价值。

最终,两种路径都将殊途同归,实现B、C的全覆盖,只是所处阶段不同而已。

技术层不可跟风也跟不了风,但ChatBot产业应用却值得广泛尝试

做ChatBot,在技术层面不应该跟风上马,它只能是LLM的一种自然的结果。

用更直接的话说,如果认为ChatBot真的有用,想要造福自身业务或者惠及伙伴、客户,更多缺乏基础的科技大厂应该沉下心来做这件事,而不是大干快上、急着表态。

跟风哄抬股价、刺激关注并不可取,最终欺骗的是投资者和关心企业的人。

不过,在这股风潮中,于产业方而言,却并不存在什么跟风不跟风。

作为AI领域好不容易等来的确确实实可能改变价值认知的产品,ChatBot在任何产业都值得尝试,只要有益于业务都可以探索这股AI的全新力量。

之前,在ChatGPT被归入的AIGC(生成式AI)场景下,百度文心已经有大量的产业实践。

例如,ERNIE 3.0文本理解与创作API,覆盖写作文、摘要、文案、小说、对联等多项生成能力,每天服务上万用户;而基于文心大模型的智能视频合成平台则让用户在一键输入新闻图文内容链接后,就可以自动化完成视频制作,这些都大大提升了内容创造的效率和质量。

在文心一言推出后,已有携程、汽车之家、爱艺奇、大量媒体机构等宣布接入。

最近,百度方面还宣布,未来会推出生态合作计划,要吸引和支持更多伙伴加入进来,一起拓展覆盖范围更广的商业市场。

在热烈的预期之下,真实的产业成果正在被探索、走向落地。

值得一提的是,作为基于百度智能云技术打造出来的大模型,文心一言未来也将通过百度智能云对外提供服务,为产业带来真正的AI普惠,这也将根本性地改变云市场的游戏规则。之前选择云厂商更多看算力、存储等基础云服务,以后用户对云厂商的需求更加聚焦智能服务,会更多关注模型、框架、芯片以及应用,这四层架构之间的协同。云服务正从数字时代跃迁到智能时代,智能化对各行各业效率的提升将显著显现。

正如IDC所言,各行业技术买家都应该尽早拥抱大模型,利用大模型进行降本增效、产品革新,“越早开始将大模型与自身行业、任务相结合,模型与技术之间才有更多的时间进行打磨优化,在未来大模型深入各行各业的时候才能拥有话语权”。

除了“看热闹”,想要在ChatGPT带来的风潮中抓住商业机会的企业,以及对ChatBot真正有需求的产业主体,都应该行动起来了。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/351066.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AWS Directory Service

Hello大家好,我们接下来讨论AWS Directory Service,AWS目录服务的内容。 什么是微软活动目录(AD) 在认证考试中有很多的考点是关于微软AD部分的,也就是微软活动目录以及AWS活动目录服务—AWS Directory Service的内容…

PowerShell Install Mysql 8

MySQL介绍 MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。 mysql download Mysql Serverdownload创建一键安装Mysql 8自动化脚本 Expand-Archive #解压文件Start-P…

【我有一个梦想:帮你实现你的梦想】

很多人都曾有过这样的经历,某天突然对某个东西产生了兴趣,于是兴致勃勃的开始在网上各种搜,各种查,去各大论坛到处看到处问,在网上搜集很多免费的电子书,看了很多视频,最后忙活了一阵子&#xf…

若依框架如何新增自定义主题风格

若依框架新增主题风格1.实现结果2.实现步骤2.1Settings目录下2.2 variables.scss2.3 sidebar.scss2.4 Logo.vue2.5 Siderbar目录下的index.vue1.实现结果 2.实现步骤 需要改动的文件目录&#xff1a; 2.1Settings目录下 <div class"setting-drawer-block-checbox-it…

DBeaver:开源、跨平台、强大的数据库管理工具

文章目录一、简介1.DBeaver 是什么2.DBeaver 的功能3.DBeaver 的优点二、安装与配置1.系统要求2.下载与安装3.连接数据库三、总结一、简介 1.DBeaver 是什么 DBeaver 是一个流行的开源数据库客户端&#xff0c;它可以用于连接和管理多种不同类型的数据库系统&#xff0c;包括…

什么是STAR原则?

文章目录&#x1f4cb;前言&#x1f525;省流版&#x1f3af;什么是STAR原则&#x1f3af;进行过程&#x1f4cb;前言 对于大部分还在学习阶段的学生们来说&#xff0c;可能并不了解这个原则的含义&#xff0c;这里的star并不是指英文单词星星。这个原则我也是前段时间才认识到…

CS224W课程学习笔记(二):网络图的特征说明和指标实战

引言 在第二三节课中&#xff0c;主要研究的是四个关键网络属性以表征图形&#xff1a;度分布&#xff0c;路径长度&#xff0c;聚类系数和连接组件 。 这些定义主要是针对无向图的&#xff0c;而由于上一节中已经介绍了度分布&#xff0c;以及相应公式和例题&#xff0c;关于…

刚性电路板的特点及与柔性电路板的区别

打开市场上的任何一个电子产品&#xff0c;会发现里面都有一块或多块电路板。电路板是电子产品运行的核心&#xff0c;之前沐渥小编已经给大家介绍了柔性电路板&#xff0c;下面给大家介绍刚性电路板的基础知识。 刚性电路板俗称硬板&#xff0c;是由不容易变形的刚性基材制成的…

MASA Stack 1.0 发布会 —— 社区问题解答

MASA Stack 1.0 圆桌讨论 Q1&#xff1a; 全职开源的团队&#xff0c;你们的收入是什么&#xff1f; 1.首先感谢我们的金主朗诗德公司&#xff0c;朗诗德是一家大型的净水器研发、生产、销售的公司&#xff0c;我们的产品也在朗诗德公司进行了大量的落地验证&#xff0c;再次…

Kotlin新手教程二(Kotlin基本数据类型及基础语法)

一、基本数据类型 1.数字 由于Kotlin支持类型推断&#xff0c;所以在使用时若超出Int的范围则会被认定为其它类型&#xff1b;若需要显式指定Long型值&#xff0c;则需要在值后添加L后缀。 2.浮点数 3.比较两个数&#xff08; 和 &#xff09; Kotlin 中没有基础数据类型&a…

C语言(输出scanf()函数)

一.概念带入 scanf()把输入的字符串转换成整数&#xff0c;浮点数&#xff0c;字符或字符串。而printf()正好与其相反&#xff0c;把整数&#xff0c;浮点数&#xff0c;字符和字符串转换成显示在屏幕上的文本。所以scanf&#xff08;&#xff09;在使用上面会和printf有很多一…

实验十四、共源放大电路的频率响应

一、题目 利用 Multisim 从下列两个方面研究图1所示电路的频率响应。图1共源放大电路图1\,\,共源放大电路图1共源放大电路&#xff08;1&#xff09;为改善低频特性&#xff0c;应增大三个耦合电容中的哪一个最有效。 &#xff08;2&#xff09;场效应管的漏极静态电流对上限频…

审批流、工作流、业务流

是业务流、工作流、审批流 业务流&#xff1a;即业务流程&#xff0c;指为了完成某项业务而进行的各种工作的有序组合 工作流&#xff1a;即工作流程&#xff0c;指为了完成某项工作而进行的各种动作的有序组合 审批流&#xff1a;即审批流程&#xff0c;是对某项工作的审批活动…

记录一次服务器被攻击的经历

突然收到阿里云发过来的异常登陆的信息&#xff1a; 于是&#xff0c;急忙打开电脑查看对应的ECS服务器的记录&#xff1a; 发现服务器的cpu占用率异常飙升&#xff0c;所以可以大概断定服务器已经被非法入侵了。 通过自己的账号登陆后&#xff0c;发现sshd服务有异常的链接存…

TensorRT的命令行程序

TensorRT的命令行程序 文章目录TensorRT的命令行程序A.3.1. trtexecA.3.1.1. Benchmarking NetworkA.3.1.2. Serialized Engine GenerationA.3.1.3. trtexecA.3.1.4. 常用的命令行标志点击此处加入NVIDIA开发者计划 A.3.1. trtexec 示例目录中包含一个名为trtexec的命令行包装…

关于表的操作+1 数据库(4)

素材&#xff1a; 学生表&#xff1a;Student (Sno, Sname, Ssex , Sage, Sdept) 学号&#xff0c;姓名&#xff0c;性别&#xff0c;年龄&#xff0c;所在系 Sno为主键 课程表&#xff1a;Course (Cno, Cname) 课程号&#xff0c;课程名 Cno为主键 学生选课表&#xff1a;SC (…

常见的5大软件项目风险,如何进行规避?

1、客户没有或很少参与项目 日常项目开发中&#xff0c;容易出现这样的风险&#xff1a;客户在最开始的时候提交了一份文档&#xff0c;在项目启动、计划和执行阶段&#xff0c;客户没有参与&#xff0c;只是在项目收尾时进行验收&#xff0c;客户一旦发现开发结果与预期需求相…

第42天|LeetCode121. 买卖股票的最佳时机、LeetCode122. 买卖股票的最佳时机 II

1.题目链接&#xff1a;121. 买卖股票的最佳时机 题目描述&#xff1a; 给定一个数组 prices &#xff0c;它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票&#xff0c;并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法…

C++类基础(十六)

类的继承——继承与特殊成员函数 ● 派生类合成的…… – 缺省构造函数会隐式调用基类的缺省构造函数 – 拷贝构造函数将隐式调用基类的拷贝构造函数 – 赋值函数将隐式调用基类的赋值函数 struct Base {Base(){std::cout << "Base()\n";}Base(const Base&…

重生之我是赏金猎人-SRC漏洞挖掘(五)-轻松GET某src soap注入

0x01 挖掘 在对某SRC测试时&#xff0c;本人根据其证书信息收集到了部分深度子域&#xff0c;并找到了其对应的业务IP段 写了个shell脚本ffuf批量fuzz某src c段资产目录 发现了xxSRC c段的一个提供了webservice的服务器 http://180.x.x.x/webservice/ 获取到接口 http://1…