大模型竞逐,再造AI新格局

news2024/11/24 12:50:53

作者 | 辰纹

来源 | 洞见新研社

“面对AI时代,所有产品都值得用大模型重做一次。”

这是阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在2023阿里云峰会上对AIGC(生成式AI)进化的判断,在这背后则是由ChatGPT为起始点,而引发的大模型“涌现”。

其中,既包括正在中国大陆上发生的“百模大战”,科技大厂、创业公司乃至科研机构在过去的1个月时间内争先恐后的推出或宣布即将推出自己的大模型,也包括模型在突破某个规模时,出现了意想不到的能力。

图源:民生证券研究院

打响“百模大战”第一枪的是百度文心一言,随后华为盘古、360智脑、商汤日日新、阿里通义千问、京东灵犀、昆仑万维天工等大模型先后登场,后续还有腾讯混元、科大讯飞星火等大模型排队等着上线。

与此同时,美团联合创始人王慧文、搜狗创始人王小川、出门问问创始人李志飞等科技大佬重出江湖,并且带动了一批资金,开始了大模型方向的再创业。

拨开行业竞争中真假难辨的迷雾,在张勇的语境中,大模型要用怎样的方式来再造AI,对于每个参与者来说,如何才能拿到通向大模型时代的船票呢?

1.由价值驱动的“百模大战”

互联网是有记忆的,从“蔚小理”带起过的新造车大战,到滴滴快的带起过的网约车大战,从摩拜和ofo带起过的共享单车大战,再到如今由ChatGPT带起的“百模大战”,牵引着玩家扎堆入局的逻辑都是由价值驱动的FOMA心理。

“FOMA”是“Fear of Missing Out(错过恐惧)”的缩写,在营销领域特指一种营销策略,即通过制造“紧迫感”或“错过”的感觉,来促使人们参与某件事情。

大模型竞争中,参与者大多害怕错过行业起势的时间窗口,抱着“我可以不强,但不能没有”的心态上车,特别是由于包括GPT 3.5在内的大模型技术都已开源,进入门槛的障碍基本被扫平,更是吸引了大量的创业公司入局,抢着与科技大厂同时起跑。

当然,更大的内驱力还是来自于大模型的价值。

首先是来自资本市场的热炒,今年2月初时,东方财富上的“ChatGPT”板块还只有29只股票,到4月份就已经攀升到60多家。

随便点几个受益公司,360受AI、信创、数据安全和ChatGPT等概念持续轮动的影响,今年以来股价上涨超过150%,昆仑万维则从AIGC+游戏进一步拓展到“天工”3.5的发布,当前市值也较年初上涨超过260%。

更加夸张的是,华为盘古大模型4月8日发布前后,带动常山北明、川大智胜、拓维信息、麒麟安信等产业链公司股价集体上涨。此外像AI标签属性较强的科大讯飞、商汤科技在公布大模型相关业务布局后,今年股价也都有不错的表现。

东方证券就表示,ChatGPT题材是超越元宇宙、虚拟现实的大风口,资本市场今年可能会反复炒作。

大模型题材在炒作的过程中,不排除个别公司确实有投机心理存在,但对于科技大厂而言,更看中大模型对自身业务推动的价值。

比如,字节跳动无论是今日头条还是抖音,内容分发在其业务布局中处于绝对核心,其内容平台的属性同时又有内容生成的需求,这与大模型主要应用的匹配度极高。

一方面能够降低创作门槛,吸引更多的创作者加入平台,另一方面,内容分发的体验能够得到持续提升,字节跳动是不可能对大模型视而不见的。

阿里在发布通义千问时,张勇就表示,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等在内的所有产品都要接入大模型,进行全面改造。

以最先接入通义千问的钉钉为例,在钉钉文档中,可借助通义千问自动配图、创作文章、撰写邮件、生成方案;在会议中,可以完成记录、总结、生产待办事项;甚至还能帮助总结未读群聊信息中的要点......

这些肉眼可见的进化,让钉钉进一步加深了在协同办公场景竞争的护城河。

从云计算业务的角度,BAT、华为、字节跳动这种体量的科技巨头算力资源是现成的,跟进训练自己的大模型顺理成章,如果大模型后续成长走在行业前列,在一定程度上也能对云计算业务造成正向推动,实现双赢。

微软为OpenAI大模型训练提供云服务的成功就在眼前,贴上全世界第一个训出GPT-4云平台的标签,或多或少会加深Azure在客户心中的印象,在与AWS 的拔河拉锯中为自己又争取了些许优势。

2.大模型竞逐,产业融合是评判标尺

回到大模型竞争的现实,如何才能在“百模大战”中胜出?

目前跑在前面的科技大厂给出的统一答案是与产业的融合,谁的速度更快,谁的成本更低,谁的竞争就更有优势。

事实上,在大模型“涌现”之前,AI一直在探索与产业的融合,特别是像计算机视觉、语音识别、自然语言识别这类识别型AI技术,普遍采用小模型来解决一些行业中的问题,像流水线上的工业质检、交通管理中的违章识别等都是AI识别的典型能力。

这些AI在产业中有落地,但渗透的速度很慢,很大一个原因就是,小模型确实能够很好的完成指定任务,但缺点也同样明显,一个AI只能解决一个问题。

闯红灯、超速、逆行等都是交通违章,若要识别这三种违章行为,则需要对这三个场景进行三次训练,由于不具备通用性,小模型的应用范围被限定在一个很小的空间内,同时落地成本也居高不下。这也是国内AI企业一直亏钱,财报业绩长期赤字的原因所在。

大模型的出现,给AI有了一次再造的机会,其方式就是用更快的速度融入到更广阔的产业土壤之中。

阿里宣布旗下所有产品都要接入通义千问的同时,也面向企业广泛邀请参与测试,在发布会当天,阿里云就宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。

同时,中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业也表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。

在通义千问之前,百度的文心一言也是将B端“生态圈”作为宣传和业务重点,华为云盘古大模型则提出了“AI for Industries”理念。

曾有机构对BAT和华为大模型的核心差异做过总结:

百度:文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应用覆盖了电力、燃气、金融、航天等行业。

腾讯:大模型产业化应用方向主要为腾讯自身生态的降本增效服务,其中广告类应用表现出色。

阿里:M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致;另外其底层技术优势还有利于构建AI的统一底层。

华为:训练出业界首个2000亿参数以中文为核心的预训练生成语言模型。目前发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项较为重磅的行业大模型。

很显然,各家的特点都很鲜明,呈白花齐放之势,但万变不离其宗,产业融合是唯一共识。

事实上,在大模型的影响下,有些行业已经开始发生变化。

4月12日,蓝色光标发布邮件,决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。此前,蓝色光标曾宣布将接入百度文心一言的能力。

更早之前,心动游戏CEO黄一孟发文说,已有游戏团队把原画外包和翻译外包团队砍掉,当人类被替换,大模型已经开始对行业产生实际影响了。

3.云计算的现在与大模型的未来

如今,大模型的竞争混沌初开,创业公司与科技巨头同台竞争,市场的最终走向将会如何?参照云计算的发展过程,我们或许已经找到答案。

众所周知,云计算市场在海外有AWS(亚马逊)、Azure(微软)和GCP(Google)三巨头,在国内则有BAT和华为,之所以是科技巨头成为云计算的绝对主角,主要在于云计算的特点,需要达到一定的规模才能产生边际效应,而在此之前,需要投入大量资源进行基础设施建设。

阿里云直到成立13年后,才在2022财年首次实现年度盈利,在其背后是遍布全球的上百个数据中心与超200万台服务器构建的云服务基础设施体系。

与云计算类似,大模型也需要耗费大量的算力资源与海量的数据成本,曾有机构估算,OpenAI训练GPT-3的成本为几百万到千万美元;训练GPT-4时,调用了上万片英伟达A100显卡,耗费的成本大约为数千万至一亿美元。

随着GPT的迭代,其训练花费将成指数级增长,有传闻,百度在训练文心一言时,调用了几乎所有的A100显卡,由此可见,大模型终究也将是少数人的游戏。

出门问问创始人李志飞在接受媒体采访时,也表达过通用AI大模型有时间窗口的观点,“人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来,小的团队就没有戏了。”

李彦宏说,“重新做一个ChatGPT没有多大意义,基于语言大模型开发应用机会很大,但没有必要再重新发明一遍轮子”,表达的也是同样一个意思。

话已经说到这个份上了,大模型创业还有机会吗?半导体行业的一些有趣现象或许可以打开我们的思路。

英特尔一直在孜孜不倦的尝试突破摩尔定律的物理极限,经常会花费数倍于前一代产品的成本来推动CPU的更新与迭代,市场上经常会出现新一代CPU的价格是上一代产品的10倍,甚至百倍的情况。

追求性能的用户固然会追捧新一代CPU,可是在巨大的价差面前,仍然会有相当数量的用户选择使用上一代产品。

同样的道理,GPT-3和GPT-4在训练成本上有差距,同时随着大模型向前进化,训练成本的差距会更大,科技巨头探索在大模型的最前沿,在其身后会存在若干有代差、精度要求较低、“够用就行”的大模型,而这或许就是创业公司的机会,在成本、市场需求、技术进步的三者之间找到平衡,不断调整策略。

另外一个方面,深入行业的垂类大模型也值得一试,王小川表示,尽管垂类模型的通用性没法与OpenAI抗衡,但可以通过针对具体场景优化,在细分场景里达到与OpenAI相近的效果,从而积累用户、构建起生态,跑通小闭环。

关于大模型创业,360创始人周鸿祎就很乐观,“中国不会只有一个大语言模型,将来每个行业,企业甚至每个人都有自己定制的GPT大模型。” 

4.结语

从长期来看,大模型是一场持久战,因而无论是现在入局,还是几个月或是几年后再入局,在本质上并没有什么区别,大模型竞争的核心不是抢速度,争第一,而是要沉下心来想清楚,在这场长跑中如何分配体力,如何获取资源,顺顺利利的跑到终点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/461596.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Shiro学习笔记,一篇就够用了

目录 一、Shiro基础 1.1Shiro定义: 1.2Shiro架构: 1.3快速上手: 二、Spring整合Shiro 2.1导入spring整合shiro的依赖 2.2两个配置类 寻找maven版本号:Maven Repository: org.apache.shiro shiro-core (mvnrepository.com) Shiro官网:Apache Shiro | Simple. Java. Securi…

C. Trailing Loves (or L‘oeufs?)(求某个质因子在n的阶乘中的个数 + 思维)

Problem - C - Codeforces Aki喜欢数字,尤其是那些带有尾随零的数字。例如,数字9200有两个尾随零。Aki认为数字拥有的尾随零越多,它就越漂亮。 然而,Aki认为,一个数字拥有的尾随零的数量并不是固定的,而是…

微搭低代码调用第三方API

目录 1 创建项目2 获取实时天气API3 创建APIs4 小程序中调用总结 应粉丝要求,我们本篇介绍一下微搭中如何调用第三方API。我们的应用开发中比较常见的一类需求是开发一个天气的功能,方便用户访问应用的时候实时的看到今天最新的天气情况。 第三方的天气…

虚拟机安装使用经验

1 VMware 跟 VirtualBox 在网络上可以看到很多对比的资料,比如这篇: VirtualBox 和 VMware的区别 VMware 分商业版跟非商业版,我们这里仅讨论非商业版,也就是 VMware Workstation Player,支持在 Linux、Windows、Mac OS 等系统上…

docker容器:Docker consul的容器服务更新与发现

目录 一、Docker consul 1、什么是服务注册与发现 2、什么是consul 3、consul部署 ①实验目的 ②实验环境及拓扑 ③consul配置 ④registrator后端配置 ⑤测试发现功能是否正常 4、consul-template部署 ①准备template nginx模板文件 ②编译安装nginx ③安装templa…

LVS-keepalived

文章目录 一、keepalived1、KEEPALIVED作用2、KEEPALIVED原理3、KEEPALIVED工作模式4、KEEPLIVED问题及优化 二、实验1.LVSKeepalived 高可用群集 总结 一、keepalived 1、KEEPALIVED作用 保证负载均衡的高可用性,完美解决了LVS所有问题,可以检查后端服…

【随笔】转发/转向(服务器重定向,服务器转发,服务器跳转)和重定向(客户端重定向,客户端转发,客户端跳转)

文章目录 1.转发(转向)和重定向图解2.例子3.区别 1.转发(转向)和重定向图解 图:转发(转向) 图:重定向 2.例子 转发:A找B要钱,B没钱,于是B向C…

OSPF路由协议解释

目录 OSPF路由协议OSPF数据包类型OSPF邻区状态OSPF的邻接关系建立过程 路由名词解释OSPF开源项目 OSPF路由协议 OSPF简介 1、(Open Shortest Path First),开放式最短路径优先,它属于链路状态路由协议,大部分路由将由O…

ChatGPT进化的过程简介

Chat GPT可以做什么? 分点列条的回答问题 写代码或SQL 翻译 语法检查 ChatGPT官方还未公开论文,ChatGPT有一个“孪生兄弟”InstructGPT,InstructGPT有论文,可以根据InstructGPT论文推导ChatGPT的训练过程: ChatGPT的…

React函数组件语法(N)

文章目录 react学习的说明新的官网全力投入现代React与Hooks React简介概述官网特点生态 React脚手架create-react-app官网创建和启动项目项目结构sass支持 Vite创建和启动项目项目结构常见配置 虚拟DOM什么是虚拟DOM虚拟DOM优缺点优点:缺点: 虚拟DOM实现…

MySQL死锁的原因和处理方法

MySQL死锁的原因和处理方法 表的死锁产生原因解决方案 行级锁死锁产生原因1解决方案1产生原因2产生原因3解决方案 表的死锁 产生原因 用户A访问表A(锁住了表A),然后又访问表B;另一个用户B访问表B(锁住了表B),然后企图访问表A;这时用户A由于用户B已经锁住表B,它必须…

LeetCode349. 两个数组的交集

题目链接 LeetCode349. 两个数组的交集 题目描述 题解 题解一(Java) 作者:仲景 因为数据范围和长度都限制在1000,所以直接使用数组即可 因为数据范围和长度都在1000内,所以碰到数字可以直接arr[i] i来表示这个数字…

如何有效的开展接口自动化测试,一篇就行

一、简介 接口自动化测试是指使用自动化测试工具和脚本对软件系统中的接口进行测试的过程。其目的是在软件开发过程中,通过对接口的自动化测试来提高测试效率和测试质量,减少人工测试的工作量和测试成本,并且能够快速发现和修复接口错误&…

手写Spring框架---IOC容器实现

目录 框架具备的最基本功能 实现容器前奏 创建注解 提取标记对象 extractPacakgeClass里面需要完成的事情 获取项目类加载器的目的 为什么不让用户传入绝对路径 类加载器ClassLoader 统一资源定位符URL ClassUtil提取标记类 获取包下类集合 装载目标类的集合 获取…

Git相关使用

私人博客 许小墨のBlog —— 菜鸡博客直通车 系列文章完整版,配图更多,CSDN博文图片需要手动上传,因此文章配图较少,看不懂的可以去菜鸡博客参考一下配图! 系列文章目录 前端系列文章——传送门 后端系列文章——传送…

APP UI自动化测试思路总结 ,教你彻底学会APP自动化测试

目录 一,开发语言选择 二,UI测试框架选择 1,Appium 2,Airtest 3,选择框架 三,单元测试框架选择 四,测试环境搭建 1,测试电脑选择 2,测试手机选择 3,…

【Redis】Redis管道

面试题 如何优化频繁命令往返造成的性能瓶颈? Redis是一种基于客户端-服务端模型以及请求/响应协议的TCP服务。一个请求会遵循以下步骤: 客户端向服务端发送命令分四步(发送命令→命令排队→命令执行→返回结果),并监听Socket返回&#xf…

基于matlab仿真相控天线阵列在波束成形MIMO-OFDM系统中的使用

一、前言 本例显示了相控阵在采用波束成形的MIMO-OFDM通信系统中的使用。它使用通信工具箱和相控阵系统工具箱中的组件,对组成发射器和前端接收器组件的辐射元件进行建模,用于MIMO-OFDM通信系统。使用用户指定的参数,您可以根据不同空间位置和…

Django自动化测试平台搭建落地全过程(附视频教程+源码)

目录 前言 一、平台基础架构设计 二、自动化测试工具选择与集成 三、平台功能开发 四、总结 前言 自动化测试在现代软件开发中扮演着至关重要的角色,它可以显著提高测试效率和准确性,并帮助开发团队更快地发布高质量的软件产品。Django作为一种流行…

Hudi数据湖技术之集成Spark

目录 1 环境准备1.1 安装MySQL 5.7.311.2 安装Hive 2.11.3 安装Zookeeper 3.4.61.4 安装Kafka 2.4.1 2 滴滴运营分析2.1 需求说明2.2 环境准备2.2.1 工具类SparkUtils2.2.2 日期转换星期 2.3 数据ETL保存2.3.1 开发步骤2.3.2 加载CSV数据2.3.3 数据ETL转换2.3.4 保存数据至Hudi…