梭哈大模型,阿里云成了跟风者?

news2024/12/29 10:05:43

        伴随AI大模型潘多拉魔盒打开,云市场GameChanger已到来。对阿里云这个昔日老大哥而言,从“领先者”变为“跟风者”,是否还有机会去重塑行业规则?

        这可能是张勇全面掌舵阿里巴巴7年以来,事关未来最重要的一次“梭哈”。

        “阿里巴巴所有产品将接入通义千问,进行全面改造。”一周前的北京国家会议中心,阿里云峰会上,首次以阿里云CEO身份公开亮相的张勇,站在舞台中央揭开了“通义千问”大模型的面纱。 

        这是张勇挂帅阿里云后带来的首个待验证作品。根据张勇宣布,天猫、钉钉、高德地图、淘宝、优酷、盒马等27个阿里集团旗下APP产品,都将接入“通义千问”大模型进行全面改造。

        将所有阿里产品聚合同一技术架构下,和2015年张勇刚掌舵阿里时,提出的著名“大中台,小前台”组织战略路径非常相似——当然如今回头看去,“大中台”战略难言成功,早在2020年张勇就开始自我反思,并在今年史无前例的组织变革中,彻底拆分为“1+6+N”。

        如果说当初推出“大中台”是创新者、引领者,但在如今GPT大模型军备竞赛上,阿里云却落后了许多,甚至成为模仿者、跟随者。 

        不仅是大模型发布时间晚于国外的OpenAI、微软、谷歌、Meta,以及国内的百度、华为、商汤,就连阿里云智能首席技术官(CTO)周靖人在峰会上提出的“云智一体”战略——这一阿里云智能集团强调的战略方向,其实百度早在2020年就已正式发布“云智一体”战略,阿里云相比晚了整整三年。 

        阿里云为何此时才提出“云智一体”战略?是“抄作业”还是“产业共识”?对于大模型竞技场,以及云市场格局而言,又会带来哪些影响?


01 | 云智一体 —— 阿里云“抄概念”?

        “智能化时代,大家都站在同一条起跑线上。”面对几千人摩肩接踵的会场,张勇表示,除了阿里所有产品都值得用大模型“改造”外,阿里云将开放通义千问能力,接入B端企业打造专属大模型。 

        通过张勇等阿里云高管的演讲,可以一窥阿里云的勃勃野心:通过对大模型的“All in”,去押注阿里云,甚至阿里集团的未来。 

        众所周知,早年占据先发优势的阿里,依靠电商大爆发站在中国互联网巅峰。其进取心、方法论、组织能力、政委体系、使命愿景、价值观等,影响着无数企业家和创业者。 

        这也包括2015年,张勇成为阿里集团CEO后,设立的“大中台、小前台”战略,其目的是提升阿里集团整体效率,最大限度减少重复造车轮行为,复用已有能力——尽管“大中台”并非阿里首创,而是来自马云去芬兰参观一家游戏公司后的取经,但“大中台”因阿里而火爆,依然被诸多企业学习和模仿。 

        近年来,阿里却创新乏力,不太跟得上市场、大环境的“进化迭代”,在各种战场频繁失利,市值距高峰期缩水近7成。 

        比如电商领域,京东、拼多多、抖音电商严重动摇其基本盘;支付市场,支付宝份额早被微信支付抛下;本地生活领域,从饿了么到飞猪,无力阻挡美团进攻;云计算领域,阿里云增速下滑、高管动荡,腾讯云、百度智能云、华为云带来的压力重重;大文娱上,发展更是惨淡,收购失败案例比比皆是。

        种种困境下,今年3月28日,阿里迎来史上最大公司组织架构调整。对每年都会进行组织架构调整的阿里来说,调整为“1+6+N”容易,最难的是如何寻找到新的发展路径。 

        当被认为是下一代互联网基石,以ChatGPT为代表的AI大模型,被全球所有科技巨头角逐时,阿里自然也不会错过,如同张勇在峰会现场做出的预判:当下技术领域,正是对未来10年、20年形成重大历史契机的关头。 

        但如果与OpenAI、微软、谷歌推出的大模型产品,甚至是百度相比,“通义千问”在外界,被不少人视为一次是“大跃进式”的面世。 

        按通义千问自己介绍,该项产品由阿里旗下达摩院开发,诞生于2022年11月。今年2月,阿里一名资深技术专家对外爆料,达摩院正在研发阿里版聊天机器人ChatGPT,阿里随后确认称正在内测。4月7日,阿里云突然官宣大模型通义千问邀请测试,此后该内容显示已被发布者删除。4月11日,通义千问在张勇阿里云首秀中高规格问世。

        严格来看,“通义千问”技术路线、产品形态并不存在太多创新。技术路线上,目前已推出产品的有类ChatGPT模式、多模态混合模式,通义千问类似百度在3月份发布的文心一言(题外话:古代知名文学理论著作就有文心雕龙、白虎通义),是一款类似ChatGPT的大型预训练语言模型,具有广泛的知识储备和普适性,在训练过程中学习大量文本数据,从而具备跨领域知识和语言理解能力,适用于不同场景下的需求。 

        即便张勇提出,要做帮企业打造专属GPT的通用平台,但事实上,类似“开源”也有云企业走在前面。今年3月底,百度智能云正式推出“文心千帆”大模型平台,面向客户提供企业级大语言模型服务。

        值得注意的是,阿里云也首次明确提出,“云智一体”是其未来战略。包括阿里云智能首席技术官周靖人以《云智一体,让智能创新触手可及》进行演讲,以及阿里云智能首席商业官蔡英华也表示,只有云智一体,才能让全面产业智能化。

        “云智一体”概念最早由百度提出。2020年5月,百度智能云宣布由CTO王海峰统领实现云与AI及基础技术体系的统一,明确提出“云智一体”战略。此后两年间,以一年一级频率,百度智能云完成云智一体架构从1.0到3.0的进化。

        “云+AI”的融合,其实在国内外云计算公司中已不鲜见。除了百度“云智一体”,微软提出“office+Teams+Azure”,亚马逊2022年提出“云、数、智三位一体”,腾讯云去年提出“云智融合”,京东叫“数智供应链”,阿里云此前也有“云钉一体”——哪怕大家技术路线、概念含义都差不多,都会避讳采用相同的概念。 

        过去三年,各种场合与财报中,百度都与“云智一体”进行了强绑定。这也让业界有所不解,阿里云为何还要在三年后,重新提出“云智一体”概念,是“抄作业”,还是“产业共识”?


02 | 逻辑还需自洽 —— 实测与宣传差距有点大‍

        无论如何,在业内人士看来,阿里云的跟进,意味着“云智一体”的打通和融合,已经成为产业共识,也预示着云智一体大产业机会的到来。 

        阿里云高管并未具体阐述云智一体具体含义。按照百度此前说法,“云”指的是以云计算为基础,使企业在云上像使用“水电煤”一样方便快捷地接入AI能力;“智”指的是人工智能,通过飞浆、视觉、语言和知识等全栈技术能力,满足企业在复杂多变场景下对AI技术的需求。 

        简单而言,就是“适合跑AI的云”叠加“懂场景的AI”,共同打造智能时代基础设施。 

        “云智一体”概念中,核心是智。多年布局发展后,云已经变成各行各业基础设施。而能否提供、输送全面、便捷高效、稳定可靠的AI智能化服务,成为各大科技企业比拼关键。

        营收增速下滑,在政企、个人云市场逐渐摸到天花板的阿里云,或许看到的也是同样机会:凭借“云智一体”差异化打法,百度形成“芯片-框架-大模型-行业应用”智能化闭环路径,帮助百度找到面向未来十年的第二增长曲线。可以说,“云智一体”在重塑百度过程中,相当重要。

        另外,随着中国经济社会数字化转型加速,万物互联时代到来,“深入产业、推动产业智能化升级”明确成为各家云计算战略重要部分。 

        这就更离不开通过“云智一体”,去承载大模型算力、解锁AI生产力——事实上,无论是AI大模型,还是其他云、AI产品矩阵,概念虽然不同,实际上均是基于“云智一体”底座推出。文心一言、通义千问、360智脑、商汤科技如此,更多其他类ChatGPT产品都是如此。 

        从“极点商业”实测来看,通义千问给出的回答,整体并不算理想。

        通义千问目前只提供文本生成功能,暂无法生成图片、音频及视频内容。​​​​​​​自然语言处理、中英文对话等方面,通义千问表现尚可,但在基本事实、时间、计算、推理等需要思考认知和逻辑理解对话上,和其他大模型对比当前差距不小。 

        “鱼香肉丝怎么做”这种千篇一律,在各种模型被广泛提及的问题,通义千问确实回答得不错。但是,“极点商业”以虎扑热门话题“三国演义为什么只注重刻画前期混乱时代,而对最后统一过程轻描淡写?”提问时,通义千问回答是“很抱歉,目前没有掌握回答技巧”。

        相比之下,文心一言则指出,称“小说主要情节是描写三国时期的群雄争霸,最后统一过程只是其中一个小小情节。这种处理方式使得小说更加注重于描写前期混乱时代的历史背景和人物性格,从而更好地呈现三国时期的历史和人物。”

        “如何看待《生成式人工智能服务管理办法(征求意见稿)》,拟法ChatGPT提供者应对数据来源的合法性负责”问题上,另一AI大模型给予肯定,指出是加强人工智能监管方面的重要举措。而通义千问依然是“没有学会如何回答”。

        涉及基本事实、时间线梳理问题上,通义千问可能还没明白如何回答。比如,“阿里巴巴过去几年,经历了哪些负面事件”提问中,通义千问回答不仅是错误百出,甚至出现多处杜撰阿里公司事实、时间情况。

        “和文心一言相比,通义千问有哪些优势与劣势”对话中,通义千问又犯了一个事实性的低级错误:称通义千问和文心一言都是阿里巴巴推出的AI预训练模型。

        如此多的低级错误,不仅与阿里云率先在国内布局云计算、市场地位不符,更难以承担阿里所有产品接入重做,为B端企业打造专属大模型的野心——毕竟,理解基本逻辑、遵循事实是第一位,如果实测结果不理想,不但会对B端企业的数字化布局造成影响,还会带给钉钉、天猫精灵等用户不好的体验。

        按照阿里云的布局,智能客服是其重点应用场景——可以帮助阿里突破传统电商“人找货”局限,迭代升级为“货找人”。并且,在酒旅、本地生活等方面,AI大模型也可以精准营销,满足更多消费者真实需求。‍‍‍‍‍‍‍‍

        但是从实测来看,通义千问在智能客服、智能推荐等方面的表现,距离商业化还相当于遥远。比如“从北京来,去重庆南天湖五一旅游三天”以及“预算6000元,买什么抽油烟机和燃气灶比较好”问题,通义千问给出的回答,对消费者来说实际参考意义非常小。‍‍‍‍‍‍‍‍ 

        值得一提的是,这些问题是“极点商业”随便提出,并非刻意为之。此前发布会上,张勇称通义千问是“世界首个突破10万亿参数的AI大模型”。另外,有消息称阿里还牵头搭建了国内最大的AI模型服务社区“魔搭”。那么,通义千问生成式AI的逻辑能力,实际上为何如此孱弱?


03 | 跟风者不容易 —— 阿里云还差些什么

        这涉及“云智一体”的本质——云必须与智真正的更好融合,才能给用户更好体验,让产业全面迈向智能。 

        答案或许很简单,即便阿里云有强大的云计算和AI能力沉淀,但是两者并未做到很好的融合。另外,数据参数、预训练数据的规模和质量、数据清洗等方面的差距,也直接关系不同大模型的回答结果,这方面阿里云并不具备优势。‍ 

        有业内人士表示,过去在一些云厂商内部,AI与云普遍处于两个不同体系。售卖计算、存储等资源型产品成为主要商业模式,导致AI在产业数字化转型、智能化升级过程中无法发挥出最大价值。 

        很长一段时间以来,阿里的人工智能、云计算处于两个独立体系——在阿里内部,研究人工智能的部门一度由阿里人工智能实验室(AI Labs)和达摩院负责,与阿里云是平行部门。

        AI Labs是阿里体系内实验室,研究语音、语言、机器视觉,后改为天猫精灵事业部,发力智能硬件。直到2021年,AI Labs团队在架构变动中,才整体并入阿里云智能。 

        研发通义千问的达摩院,更是设于阿里庞大商业体系之外的一个独立研究机构,研究范围包括数据智能、人机自然交互等前沿技术。2021年组织架构升级中,前阿里云总裁张建峰负责的“云与科技板块”中,包含阿里云、达摩院、钉钉、智能互联(天猫精灵)、平头哥五条线。彼时,虽然达摩院AI技术通过阿里云输出,但依然是平行的“兄弟部门”。 

        部门平行外,对阿里云来说影响更大的是连续数年高管震荡。去年5月,达摩院与阿里云出现一系列高管变动,华先胜(达摩院城市大脑实验室负责人)、金榕(城市大脑高级研究员)、张磊(达摩院AI中心副主任)离职,肖利华(阿里云研究院院长)出走创业。一夜间,从王坚时期开始耕耘多年的明星项目——达摩院城市大脑实验室,核心人员几乎全部流失。 

        这让阿里云、达摩院“元气大伤”,并且加速两者“分割”。根据“雷锋网”此前报道,阿里云和达摩院2021底进行了人员分割,一些达摩院孵化的产品技术被划出,而达摩院以更为独立形式运营,承担起10位数的营收数字挑战——具体方式是,达摩院通过阿里云业务线对外进行销售产品,两者实行双算模式。 

        今年1月初,阿里云高层再次人事大变动。张勇亲自下场接替张建峰,掌舵阿里云智能总裁,周靖人担任阿里云智能CTO。但是,随着“大中台”的失效,云与AI未来是否得到更好融合,成为疑问。 

        3月28日“史上最大”组织架构变化后,达摩院、阿里云都被归到张勇掌舵的云智能集团旗下,但依然分属不同业务板块,在业务上有一定的独立性。同时,高管依旧流失,阿里AI大牛贾扬清、阿里M6大模型前带头人杨红霞也已离开。 

        跟大模型或AI相关核心负责人持续两年动荡,带来的结果就是,阿里大模型推出迟到,产品能力实际表现更像”赶鸭子上架”。

        有人工智能从业人士透露,一个稳定的管理团队,是产品、技术路线延续关键。该人士举了一个例子,在百度智能云,百度CTO王海峰+百度技术委员会主席吴华+百度集团副总裁吴甜带队的组合,自2019年推出文心大模型ERNIE 1.0系列第一天起,就保持稳定,才有了文心系列的持续迭代。 

        遗憾的是,对阿里的云和AI业务而言,频频组织架构调整、人员持续动荡中,不曾拥有过百度的稳定优势。 

        这在大模型上也有体现。阿里在模型迭代上比百度、华为慢了不止两年。2019年,当百度、华为推出大模型时,阿里才开始研发。2021年,其他企业开始对大模型持续迭代,阿里才发布了语言、多模态大模型,并在去年9月合并为阿里通义大模型。 

        导致的结果,就是大模型数据质量、规模上的差异。“阿里大模型与业界或国内领先水平,存在的数据参数、预训练数据质量和数据清洗等方面,差距明显。”ICT产业服务平台“集微网”报道称。 

        阿里云CTO周靖人此前也承认,大模型研发动辄要超千亿参数,其难度远远超出了单一算法或GPU芯片的简单堆砌。 

        其实这种差距在业界预料中。百度拥有海量C端搜索数据,腾讯也有十多亿用户微信生态数据沉淀,但阿里拥有最多的是垂直领域的TOB商家客户数据。从通用大模型训练角度来看,过于商业化的TOB商家数据,并不太适合大量加入。 

        通义千问发布前,一位阿里云研究院高级专家坦承,在参数方面,通义千问基于PLUG的模型,参数在200亿-300亿,而GPT-3参数是1750亿,同时其主要偏向文本,没有涉及图像和视频;预训练语料数据集方面,在质量和规模上都比不上OpenAI和百度。 

        这可能是阿里云“抄作业”,植入“云智一体”概念的一个原因。毕竟,如同周靖人所表示,当下的AI大模型竞争,本质上就是算力竞争。其比拼的,是一个囊括底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要的是AI云计算的全栈技术能力。 

        无论如何,伴随AI大模型潘多拉魔盒打开,云市场GameChanger已经到来。行业格局大洗牌难以避免,对阿里云这个昔日老大哥而言,从“领先者”变为“跟风者”,还有多少机会,去重塑行业规则? 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/432192.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《ChatGPT实用指南》(精编版)重磅发布,全网免费分享,快上车,别掉队

文 / 高扬(微信公众号:量子论) 据上次3月18号发布的V1.8版,已经过去十天,这期间AI领域发生了很多重大变化。 因此,我们对《ChatGPT实用指南》进行了重大改版,增加了大量实用的操作和详细的讲解&…

【开懂C++】引用与关键字auto

目录 一.引用1.引用的概念2.引用的使用和问题3.引用与指针的比较二.关键字auto 一.引用 1.引用的概念 引用就是给一个已经存在的变量取一个别名&#xff0c;与变量共用一段内存空间。注意引用的类型必须和变量类型相同&#xff0c;来演示下引用如何使用。 #include <iost…

2.1.2事件驱动reactor的原理与实现

先来了解一下epoll select(maxfd, rfds, wfds, efds, timeout);poll(pfds, length, timeout);#include <sys/epoll.h> int epoll_create(int size); int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); int epoll_wait(int epfd, struct epoll_event…

记录一次mysql死锁日志分析

记录一次mysql死锁-CSDN博客 MySQL死锁日志的查看和分析_mysql死锁日志解读_lkforce的博客-CSDN博客 此文承接以上两篇文章&#xff0c;文章1原创记录&#xff0c;文章2转载分析 一&#xff0c;死锁sql update tt_task SET navigation_distance ?, plan_arri…

决策树相关知识点

为什么id3和c4.5采用多叉树而cart采用二叉树&#xff1f; ID3 和 C4.5 采用的多叉树虽然在对训练样本集的学习中可以尽可能多地挖掘信息&#xff0c;但是其生成的决策树分支、规模都比较大&#xff0c;训练特别慢&#xff0c;CART 算法的二分法可以简化决策树的规模&#xff0…

Mybatis框架源码笔记(十一)之Spring整合mybatis演示与整合原理解析

1 Spring框架整合Mybatis示例 1.1 创建演示项目 1.2 项目目录结构 1.3 依赖配置pom.xml文件 <?xml version"1.0" encoding"UTF-8"?><project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XML…

d2l机器翻译数据集

着重讲解一下机器翻译数据集的文件处理&#xff0c;以及最终返回了什么 目录 1.载入文件 2.文本预处理 3.词表 4.集成封装 5.总结返回值 1.载入文件 #save d2l.DATA_HUB[fra-eng] (d2l.DATA_URL fra-eng.zip,94646ad1522d915e7b0f9296181140edcf86a4f5) #save def read…

AJAX-0基础第一天入门

AJAX-第一天入门 学习目标 掌握 axios 相关参数&#xff0c;从服务器获取并解析展示数据掌握接口文档的查看和使用掌握在浏览器的 network 面板中查看请求和响应的内容了解请求和响应报文的组成部分 01.AJAX 概念和 axios 使用 目标 了解 AJAX 概念并掌握 axios 库基本使用…

生信刷题之ROSALIND——Part 2

目录 1、Counting Point MutationsProblemSample DatasetSample OutputCodeOutput 2、Mendels First LawProblemSample DatasetSample OutputCodeOutput 3、Translating RNA into ProteinProblemSample DatasetSample OutputCodeOutput 4、Finding a Motif in DNAProblemSample…

C/C++每日一练(20230415)

目录 1. 交错字符串 &#x1f31f;&#x1f31f; 2. 最短回文串 &#x1f31f;&#x1f31f; 3. 分段函数计算 ※ &#x1f31f; 每日一练刷题专栏 &#x1f31f; Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 1. 交错字符串 给定…

【数据库】MySQL的增删改查

目录 1.CRUD 2.新增数据 2.1单行数据全列插入 2.2多行数据指定列插入 3.查询数据 3.1全列查询 3.2指定列查询 3.3查询字段为表达式 3.4别名 3.5去重DISTINCT 3.6排序ORDER BY 3.7 条件查询&#xff1a;WHERE 3.8 分页查询&#xff1a;LIMIT 4.修改数据 5.删除数…

Flutter开发中的线程与事件队列,如何实现高效优化?

Flutter 中线程简要介绍&#xff1a; 主 UI 线程&#xff1a; Flutter 的主 UI 线程通常称为 “UI Isolate”&#xff0c;它是单线程的&#xff0c;负责处理用户界面的渲染和响应用户输入。在主 UI 线程中运行的代码主要包括 Flutter 应用的 UI 组件构建、布局、绘制等操作&a…

基于DSP+FPGA的机载雷达伺服控制系统(二)电源仿真

板级电源分配网络的分析与仿真在硬件电路设计中&#xff0c;电源系统的设计是关键步骤之一&#xff0c;良好的电源系统为电路板 上各种信号的传输提供了保障。本章将研究电源完整性的相关问题&#xff0c;并提出一系列改 进电源质量的措施。 3.1 电源完整性 电源完整性&#xf…

7.思维题(0x3f:从周赛中学算法 2022下)

来自0x3f【从周赛中学算法 - 2022 年周赛题目总结&#xff08;下篇&#xff09;】&#xff1a;https://leetcode.cn/circle/discuss/WR1MJP/ 包含贪心、脑筋急转弯等&#xff0c;挑选一些比较有趣的题目。 注&#xff1a;常见于周赛第二题&#xff08;约占 21%&#xff09;、第…

【Linux】进程间通信 -- System V共享内存

前言 本篇博客介绍第二种进程间通信的方式 – System V System V 有三种方式&#xff1a; 共享内存 消息队列 信号量 本篇博客对于系统调用的函数&#xff0c;会进行一定的封装 文章目录 前言一. System V 共享内存二. 共享内存的原理三. 共享内存的创建四. 共享内存的查看和删…

MinGW MinGW-W64介绍

Table of content 0 Preface/Foreword 1 MinGW-w64 1.1 使用MinGW-w64的原因 1.2 MinGW-w64使用场景 1.3 官网 2 GCC & LLVM 2.1 编译器构成 2.2 GCC 2.3 LLVM 2.3.1 Clang 0 Preface/Foreword MInGW全称为&#xff1a;Minimalist GNU on Windows.将经典的开源C…

Unity VFX -- (4)创建burst粒子效果

如果用户成功达成某个目标&#xff0c;我们可以使用一个爆裂的礼花来激励用户。如果角色挥舞刀剑&#xff0c;我们可以做出剑气来增加气势。如果角色落到地面上&#xff0c;我们可以在脚部做出飞舞的灰尘来增加表现力。这些都可以视为burst粒子效果。 下面是一些burst粒子效果&…

JVM学习(六):类加载子系统

目录 〇、前言 一、类加载子系统 1.1 内存结构概述 1.2 类加载器及类加载过程概述 1.2.1 类加载器 1.2.2 类加载过程 1.3 类加载过程一&#xff1a;Loading 1.3.1 加载过程 1.3.2 加载类的方式 1.4 类加载过程二&#xff1a;Linking 1.4.1 验证(Verify) 1.4.…

贯穿设计模式第八话--设计原则总结篇

&#x1f973;&#x1f973;&#x1f973; 茫茫人海千千万万&#xff0c;感谢这一刻你看到了我的文章&#xff0c;感谢观赏&#xff0c;大家好呀&#xff0c;我是最爱吃鱼罐头&#xff0c;大家可以叫鱼罐头呦~&#x1f973;&#x1f973;&#x1f973; 从今天开始&#xff0c;将…

在uos上编译opencv

作者&#xff1a;朱金灿 来源&#xff1a;clever101的专栏 为什么大多数人学不会人工智能编程&#xff1f;>>> 下载源码并创建build文件夹 系统环境为操作系统为&#xff1a;UnionTech OS Server 20 Enterprise&#xff0c;处理器为: 华为鲲鹏处理器&#xff08;ar…