大模型落地竞逐,云计算大厂“百舸争流”

news2024/11/18 19:30:10

作者 | 辰纹

来源 | 洞见新研社

从ChatGPT到Sora,从图文到视频,从通用大模型到垂直大模型……经过了1年多时间的探索,大模型进入到以落地为先的第二阶段。

行业的躁动与资本的狂热相交汇,既造就了信仰派的脚踏实地,也产生了投机者的浑水摸鱼,如今回头,大模型落地到底进行的怎样了,大模型厂商们又是如何实践的?

我们今天选取阿里、百度、腾讯、华为这四个头部云计算厂商,从他们或明或暗的战略路线,来窥视出大模型落地的路径分野。

01 阿里云:闭源开源两线并举 

不久前结束的阿里云AI智领者峰会·北京站上,阿里云CTO周靖人直接亮明了“底牌“,“阿里云是全球唯一一家既在持续做(大)模型开发,又做大量(大)模型开源的公司。”

之所以会两线并举,周靖人的解释是,为了满足用户和开发者生态对基础模型的不通需求,这也是“模型即服务“的内涵之一。

具体实践中,阿里云此次大会发布了闭源SOTA大模型通义千问2.5,根据权威基准OpenCompass的测评结果,通义千问2.5得分追平了GPT-4 Turbo,为国产大模型取得的最高排名。

开源路线上,自2023年8月以来,阿里云陆续开源了十数款模型,据官方公布数据显示,目前通义开源模型下载量已经超过了700万,最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70。

虽然有了基础模型,但是各行各业的需求不同,即便是同一行业中的不同企业,他们之间的需求也很难被统一,因而标准化的基础模型很难被直接用起来,为此,阿里云贴着开发者生态的场景需求,升级了AI Infra平台——百炼,推出了百炼 2.0。

百炼 2.0依托阿里云AI基础设施,同时对模型开发、应用开发和算力底座等工具进行了升级,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。

作为国内最大的云厂商,阿里云拥有最为庞大的业务规模和覆盖最全面的客户群体,在AI路线还远没有收敛的行业背景下,一面是客户需求的驱动,一面是对技术踏空的隐忧,阿里云在大模型上全面布局也就可以理解了。

如果再将阿里云3月份时的史上最大力度降价相关联,可以看出,阿里云的种种动作都指向一个目标,即实现云和人工智能业务的螺旋上升,暗含着对未来业绩增长的长远考量。

02 百度云:以AI原生应用为矛 

在几家云计算大厂中,百度云的规模最小,但由于大模型与百度一直坚持的AI技术路线强关联,加之去年3月推出文心一言后,又陆续在大模型工具平台、大模型对自身应用重构、大模型生态建设等方面,进行了一系列体系化的出击,使得其成为大模型行业中极为重要的一支力量。

百度的打法并不复杂,一方面通过对文心一言的持续进化,保证文心一言的能力始终处于第一梯队,去年的百度世界大会上推出的文心大模型4.0版本的参数规模达到万亿级别,综合能力不逊色于GPT-4。

另一方面强调原生应用重要性,李彦宏分析大模型应用竞争的本质是表示:“企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。”这事实上也是百度在大模型落地上的竞争策略:加速冲刺,多方探索应用可能,尤其看重“AI原生应用”。

百度首先用大模型对自己的产品进行了全面改造和焕新,基于现有的用户基础,获得真实使用反馈后,反过来加速大模型的迭代;然后与云服务相结合,提供智能算力资源和训练工具,帮助其他企业开发自己的模型。

为此,百度智能云推出了一系列平台或工具产品,如帮助生成营销材料的“擎舵”、文心大模型插件开发平台“灵境”,企业级大模型生产平台“千帆”等。

百度云今年春季召开的首届生态大会中,宣布面向三类市场——头部市场、价值市场和高潜市场,厘清与伙伴之间的分工协作边界,实现协同作战,其目的也是为了将场景快速闭环,加速大模型落地。

03 腾讯云:以实用主义落地实体经济 

腾讯入局大模型的时间比较晚,直到去年9月的腾讯全球数字生态大会上才正式发布自研的通用大语言模型混元大模型,在行业中一直是比较低调和另类的存在。

混元大模型发布之前,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生曾阐述过腾讯的大模型价值观,“通用大模型不一定是满足行业场景需求的最优解。企业需要有针对性的行业大模型,结合自己的数据做训练或精调,在合理的成本下,打造实用性更高的智能服务。”

实用主义由此被提炼出来。

一方面是关注大模型解决具体问题而不是参数大小,另一方面是用什么样的技术组合更有效率的解决问题。

腾讯云副总裁、腾讯云智能负责人吴运声曾表示:“几亿、几十亿、几百亿还是一千多亿,我们并不关心模型参数的那个数字,我们更关注的怎么解决客户的问题,希望用最有效,最低成本的手段去解决客户的问题。”

在具体实践上,腾讯云有着非常清晰的思考,第一步,铆钉标杆客户;第二部辐射整个上下游产业链的腰部企业,而破局的关键就是实体经济

目前,腾讯云已经携手政务等行业的头部企业,在20余个行业探索了超50个行业大模型的应用解决方案。以腾讯云数智人工厂为例,腾讯云MaaS能力可以让数智人分身复刻缩短至24小时,大幅降低成本。在文旅领域推出的文旅大模型,金融领域打造的OCR大模型都是已经落地的案例。

04 华为云:以算力底座为基础深入千行百业 

与很多大模型厂商在刚入局时死磕技术,专注于对标ChatGPT的能力有所不通,华为云的大模型战略一开始就是奔着落地去的,去年的世界人工智能大会上,华为轮值董事长胡厚崑演讲时表示,人工智能的发展关键在于“走深向实”,华为的定位是赋能产业升级,服务好千行百业,服务好科学研究。

围绕这个定位,华为的大模型战略出现了两条路径,一是大模型领域,从通用大模型到行业大模型,让人工智能使能行业,助力科研;二是算力领域,打造强有力的算力底座。

华为云盘古大模型3.0发布时,提出了“不作诗只做事”的口号,按照“5+N+X”三层架构,即基础模型、行业模型和场景模型,目前已经落地金融、制造、政务、煤矿、铁路等10多个行业,支撑400多个业务场景的AI应用落地。

一个最典型的场景,煤矿的智能化升级中,盘古矿山大模型只需导入海量无标注的矿山场景数据进行预训练,即可进行无监督自主学习,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景的通用。目前,盘古矿山大模型已在全国8个矿井规模使用。

做强算力底座方面,华为的关键词是“自研”和“开放”

在相对底层的计算效率研究方面,华为的打法是架构创新,基于自研的达芬奇架构,推出昇腾处理器,围绕昇腾芯片打造昇腾AI集群,国内建设的规模最大的AI计算集群深圳鹏城云脑II期不但实现了全栈软硬件的自主可控,还蝉联了多项全球AI性能榜单的冠军,算力达到1000P。

不难看出,华为不但直接卖“鱼”,还传授“捕鱼”技巧。

05 结语 

综上所述,这四家云计算大厂对于大模型的落地虽然在打法上各有侧重,但目标还是非常一致,基本上都是在自身原有业务的基础上进行延展,或继续加长自己的长板,或开发出新的增量。

值得一提的是,除了在大模型的技术和业务层面进行竞争之外,这几家大厂还广泛参与到大模型创业公司的投资之中,目前中国估值前五的生成时AI独角兽(月之暗面、智谱AI、Minmax、零一万物和百川智能),阿里的参投率为100%,腾讯则投了百川智能、智谱 AI 、MiniMax 3家,此外深言科技、无问芯穹等大模型公司也曾进入到腾讯的投资名单。

这也是说,大模型的竞争不仅仅只停留在大模型上,资本层面的暗战同样激烈。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1683706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

二十五篇:嵌入式系统揭秘:基础理论与实践探索

嵌入式系统揭秘:基础理论与实践探索 1. 嵌入式系统的定义与特性 1.1 详细解释 嵌入式系统,作为一种特殊的计算机系统,其设计目的是为了执行一个或多个特定的功能。与通用计算机相比,嵌入式系统通常被集成到更大的设备中&#xf…

web压力测试,要不要过滤掉JS,CSS等请求?

在进行性能测试(压测)时,是否过滤掉对JavaScript、CSS等静态资源的请求,取决于你测试的目标和目的。 是测试服务端的性能还是前端的性能。这两种目的所涉及到的测试场景和工具等方法是不一样的。 一般的web产品,像cs…

dify:开源 LLMOps平台。

单纯笔记: 一、关于 Dify dify/README_CN.md at main langgenius/dify GitHub Dify 是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以…

vite+ts+mock+vue-router+pinia实现vue的路由权限

0.权限管理 前端的权限管理主要分为如下: 接口权限路由权限菜单权限按钮权限 权限是对特定资源的访问许可,所谓权限控制,也就是确保用户只能访问到被分配的资源 1.项目搭建 创建vite项目 yarn create vite配置别名 npm install path -…

不用从头训练,通过知识融合创建强大的统一模型

在自然语言处理(NLP)领域,大型语言模型(LLMs)的开发和训练是一个复杂且成本高昂的过程。数据需求是一个主要问题,因为训练这些模型需要大量的标注数据来保证其准确性和泛化能力;计算资源也是一个…

关于基础的流量分析(1)

1.对于流量分析基本认识 1)简介:网络流量分析是指捕捉网络中流动的数据包,并通过查看包内部数据以及进行相关的协议、流量分析、统计等来发现网络运行过程中出现的问题。 2)在我们平时的考核和CTF比赛中,基本每次都有…

【Linux取经路】进程通信——共享内存

文章目录 一、直接原理1.1 共享内存的的申请1.2 共享内存的释放 二、代码演示2.1 shmget2.1.1 详谈key——ftok 2.2 创建共享内存样例代码2.3 获取共享内存——进一步封装2.4 共享内存挂接——shmat2.5 共享内存去关联——shmdt2.6 释放共享内存——shmctl2.7 开始通信2.7.1 pr…

安全攻防基础

一、安全是什么?就是三个基础原则 安全就是保护数据 1. 机密性 对未授权的主体不可见 开发人员不能拥有敏感数据的访问权限 密钥要复杂 显示器伤的数据被别有用心的人窥探 2. 完整性 没授权的人不可修改数据 3. 可用性 被授权的主体可读 二、如何解决安全问题…

Rust面试宝典第14题:旋转数组

题目 给定一个数组,将数组中的元素向右移动k个位置,其中k是非负数。要求如下: (1)尽可能想出更多的解决方案,至少有三种不同的方法可以解决这个问题。 (2)使用时间复杂度为O(n)和空间…

微服务远程调用 RestTemplate

Spring给我们提供了一个RestTemplate的API,可以方便的实现Http请求的发送。 同步客户端执行HTTP请求,在底层HTTP客户端库(如JDK HttpURLConnection、Apache HttpComponents等)上公开一个简单的模板方法API。RestTemplate通过HTTP方法为常见场景提供了模…

VisualStudio2022的使用

Visual Studio 2022 的安装、卸载和使用方法详解 一、安装Visual Studio 2022 1. 下载Visual Studio 2022 要安装Visual Studio 2022,需要先下载安装程序。可以从微软的官方网站(Visual Studio下载页面)下载免费的社区版(Commun…

非平稳信号的傅里叶变换与短时傅里叶变换

一、仿真一个非平稳的时间序列。 N 10000; t 0:N-1; z1 4.2*sin(2*pi/20.*t5); z2 2.2*sin(2*pi/100.*(10.001*t).*t8); w1 randn(length(t),1); yz1z2w1; figure;plot(y,LineWidth,1.5);grid on; ylabel(Signal); xlabel(Time); 二、傅里叶变换(FFT&#xff…

网创教程:WordPress插件网创自动采集并发布

网创教程:WordPress插件网创自动采集并发布 使用插件注意事项: 如果遇到404错误,请先检查并调整网站的伪静态设置,这是最常见的问题。需要定制化服务,请随时联系我。 本次更新内容 我们进行了多项更新和优化&#x…

保护共享资源的方法(互斥锁)

我最近开了几个专栏,诚信互三! > |||《算法专栏》::刷题教程来自网站《代码随想录》。||| > |||《C专栏》::记录我学习C的经历,看完你一定会有收获。||| > |||《Linux专栏》&#xff1…

一个基于vue、nuxt.js的网盘搜索项目,且持续开源和维护;目的实现人人都可以拥有自己的网盘搜索网站;

一个基于vue、nuxt.js的网盘搜索项目,且持续开源和维护;目的实现人人都可以拥有自己的网盘搜索网站; 🌐Github地址 https://github.com/unilei/aipan-netdisk-search 🌐在线体验 https://so.aicompasspro.com/

我在去哪儿薅到了5块钱火车票代金券,速薅

哈哈,亲爱的薅羊毛小伙伴们! 刚刚在去哪儿大佬那儿发现了一个超级薅羊毛福利!我只花了短短两分钟,就搞到了一张5块钱火车票代金券,简直是天上掉馅饼的节奏啊! 话不多说,薅羊毛的姿势给你们摆好…

202473读书笔记|《但愿呼我的名为旅人:松尾芭蕉俳句300》——围炉夜话,身顿心安,愿每个人都能在爱里自由驰骋

202473读书笔记|《但愿呼我的名为旅人:松尾芭蕉俳句300》——围炉夜话,身顿心安,愿每个人都能在爱里自由驰骋 😍😍🤩🤩 译者序正文二正文三正文四正文五正文六正文七 《但愿呼我的名为旅人&…

【动手学强化学习】第 6 章 Dyna-Q 算法知识点总结

【动手学强化学习】第 6 章 Dyna-Q 算法知识点总结 本章知识点基于模型的强化学习与无模型的强化学习方法简介无模型的强化学习方法基于模型的强化学习方法 强化学习算法的评价指标Dyna-Q算法Dyna-Q 算法的具体流程Dyna-Q 代码实践 本章知识点 基于模型的强化学习与无模型的强…

前端 CSS 经典:好看的标题动画

前言&#xff1a;好看的标题动画实现。 效果&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><…

syncthing文件夹同步与版本管理

1 前言 syncthing可以用来同步文件夹里的所有文件&#xff0c;并且有不错的版本管理&#xff0c;基本每次更改文件&#xff0c;20-40秒就被扫描到了&#xff0c;非常丝滑&#xff1b;这次以此来同步obsidian的插件和文件&#xff0c;达到多端同步&#xff1b; 我家里有一台台…