大模型“云上经济”之权力游戏

文丨谭婧

光阴者百代之过客。

世人皆过客，软件亦如此。

人工智能已有新旧之分。

网友戏称，新人工智能是ChatGPT，旧人工智能是“之前那些”。

历史在重演。

云计算在美国问世的时候，否定论调居多。

一个常见的否定论调是「做生意不用上云」。

接着，事态变化，

否定论调则调整为「大企业永远不会上云」。

接着，否定之声定调为「国家级机关单位永远不会上云」。

美国五角大楼没有配合，一个著名的上云项目叫JEDI（联合企业国防基建）。

网友吟诗曰：云深不知处。

历史在重演。

深度学习问世，否定论调居多。

传统算法末日黄昏，深度学习颠覆革命。

一开始，人们还不太相信，深度学习也许只能在语音上做好。

很快发现，在计算机视觉分类问题上也可行。

再后来，基本上起初认为做不了的事情，后来都能够做了。

GPT-4也有否定者，也需要否定者。

网友戏称，我已经等不及要看AI失控那一天了。

历史在重演。

强大的AI大模型，背后有微软云提供的澎湃算力，阿里版GPT通义千问的背后是国内最大云厂商阿里云。连百度都把摊在地上的百度云扶起来，称之为新型AI云。

AI和云的关系变得既感性又性感，让我不得不思考：

ChatGPT会让云发生什么？

下文中AI大模型，简称大模型。

第一，赢者通吃。

假如全球只有一款傲人的大模型，那么一切想用大模型技术的企业均会成为附属在产业上的附属物。

传统算法步入末法时代，云计算不可能独善其身。

大模型手接权杖，嘶吼咆哮：赢家通吃。

在权力游戏中，你不当赢家就只有死路一条，没有中间地带。

第二，若云厂商大模型缺位，其他类型的大模型技术拥有者会带动生态迁移。

“好用跟我走”是一种技术咒语，咒语已经施与大模型。

传统掌权者依然存在，彻底衰败需要时间。

他日，谁掌握了大模型的高地，谁就可以定义未来指令集。

大模型的新生态如果不在云上，必然会削弱云厂商原有生态。

云厂商制胜大模型，则强者更强。

平台即服务（PaaS）尽管也很需要，也赚钱，可惜不能带动生态迁移。

谁掌握了大模型，谁就可以定义未来科技生态。

第三，大模型尚在早期，生态从出生到成熟，将会是一个漫长旅程。

“窗口期”是对技术先行者的馈赠。大模型效果好到令人兴奋，但我们处在ChatGPT生态早期，又或者，更早期。

即使是处于早期，作为科技巨头，你敢坐视不理，消极布局吗？

ChatGPT生态将会是一个漫长旅程。这意味着，参与者会是种子阶段的选手。

这也意味着，大部分参与者面目模糊，终会消失。

看到ChatGPT确实把人工智能往前带动了一大步，就鼓吹ChatGPT万能万用可耻。

云计算是庞大产业，大模型未来也会是庞大产业。但仍然不要忘了，我们正处在早期。已经有企业级客户跃跃欲试生成式大模型了，但需要更多的企业级客户用起来。

当下，过度吹捧会导致市场失望和资本撤离。

做好当下，更要想以后。

第四，即使云上有了大模型，国内云厂商仍然会遭遇多形态的竞争对手。

当“好用跟我走”的软件出现，硬件厂商会作何反应？对，在中国，这里提到的硬件厂商最典型的就是华为，尽管华为也有云业务。

这次我们不讲通讯产业，讲AI产业。

AI产业里，比华为云上的AI业务更出名的是华为昇腾系列AI芯片。

假如我是华为，当我拥有一款傲人的大模型，我会把这款软件预装在数据中心级别的计算设备里一起售卖。反正都要用，预装抢市场。

这就好比预装在手机里的APP，优势占了一大截。

云厂商形势颇为严峻。

假如没有大模型，阿里巴巴在中国会遇到不少于以下三种严峻而又强势的挑战。

一、狙击。

独立大模型开发商拿走云上AI计算业务的利润。这是结果，但过程绝不会简单，短时间也完成不了。

二、截胡。

国内数据中心，尤其是智算中心。当智算中心拥有大模型后，可以直接输出AI大模型能力，背后就是算力的输出。

三、连锅端。

独立大模型开发者和国内智算中心合力，联合围剿国内云厂商。

阿里巴巴会坐以待毙吗？

答案显然是否定的，尽管阿里大模型出发的时候对标的是谷歌。

谷歌有TPU，阿里有平头哥。

平头哥虽然不是天下第一，但是它能让阿里云成本降低，且不论全部替代，想想那些不能降成本的竞争对手。

谷歌的AI生态建设得非常完整和领先，包括AI芯片TPU，端到端开源深度学习框架TensorFlow。

与传统的CPU+GPU组合相比，TPU这类专业芯片在搜索、翻译、语音助手、图像识别等AI任务上有数量级的性能提升。

百度也想全套对标，还比不上谷歌。

结果，晴天里一个大霹雳，谷歌大模型输给了微软（和OpenAI）战队，尽管Bert模型对谷歌搜索引擎上的每一个基于英文的查询提供支持，效率提升10%以上。

别人家大模型赢了，谷歌吃尾气了，还让大家都看到了。虽遭重击，但谷歌比别人更有翻盘的机会。

以前都无法想象谁会超越谷歌的AI。

我们聊回阿里巴巴。

说阿里巴巴在NLP（自然语言处理）等前沿科研领域布局多年，这话没人反驳吧？

阿里达摩院在2018年底启动研发，在超大模型、语言及多模态能力和训练、平台化服务、落地应用等多个方面，为中文大模型的发展做了一些前沿性、引领性的工作。

- 2019年

发布大规模预训练语言模型structBERT并登顶全球NLP权威榜单GLUE；

- 2021年

先后发布国内首个超百亿参数的多模态大模型M6及语言大模型PLUG；

- 2021年8月

阿里大模型在全球机器视觉问答榜单VQA上首超人类得分；

- 2021年10月

阿里探索较低能耗训练全球首个10万亿参数大模型M6；

- 2022年2月

M6可同时完成10余项单模态及多模态任务。

这些非技术背景的读者看上去意义不大的事情，如今都成了大模型的“史料”。

阿里大模型的品牌统一在“通义”之内，那些曾经被我来回理解的大模型都有了一个共同的名字。

近日，阿里“通义千问”语言大模型邀请测试，阿里成为全球较早研发并开放GPT-like大模型的科技公司之一。

谭老师我的大模型技术启蒙是阿里巴巴给的。

跟着阿里学习大模型这些年，我获得一个测试邀请码不过分吧？

所以，通义千问测（翻）试（车），我们放在文章最后。

整体来看，阿里在大模型领域与引领者OpenAI尚有差距。但总体来说，阿里处于全球领先的大模型研发梯队，具备语言大模型、多模态大模型、大模型底层训练平台的完整布局。

应当承认，OpenAI已是全球大模型的引领者，ChatGPT是非常优秀的模式，GPT-4在推理、数学等方面有了非常不错的表现，是当前通义千问尚不能及的。

通义千问目前在效果上与ChatGPT还存在一定差距，仍在学习和成长。当然，通义千问也有自己较为擅长的领域，比如在文本对话、阅读理解等方面。

好消息是，阿里应该比谭老师我更理解为何重视大模型。

就算全中国只有三个公司出手大模型，其中一个必须是阿里巴巴。

再来谈谈大模型走向ToB市场的抓手，即OpenAI公司的Plugin插件。

Plugin既是产品，也是方法，切不可小瞧。

Plugin插件可以成为大模型的“眼睛和耳朵”，使它们能够接受“再训练”，而不仅仅依靠原有训练中的信息。

Plugin插件对于企业拿“再训练”用好大模型这件事情起到重要作用。

有Plugin，才会有专属模型未来的方向。

相信未来也不会只是Plugin插件的形式，大模型制造者会摸索出更好的方法。

企业通过Plugin接入GPT后，生产力会有新的提升。

比如在金融、能源或药品企业里，再英明神武的企业领导也需要充分的信息才能做决策，企业级大模型应用肯定要结合企业业务数据。

大模型是能力，在大模型能力技术上，企业用数据再次训练更为重要。

不仅如此，想象大胆一些，加上机器腿和机器手，做控制和执行。

聊到机器人了。

首批热心极客开发者已将ChatGPT接入机器人。

机器人除了听从指挥做指定动作，还能提醒你：“你的妻子永远都是对的。”

没办法，语言能力强。用强化学习根据人的反馈数据又训练过几轮的效果就是好，机器人的智商情商显得很不一样。

批量使用工业机器人的企业通过Plugin接入GPT后，生产力会有新的提升。

我们正处于一个非常漫长的旅程的起步阶段，企业级的大模型应用还如星星之火。

Plugin模式一定会被国内大模型竞争者复现。但请回到第一步，你得有个好用的大模型。

动辄超千亿参数的大模型研发，不是单一的算法问题，也不是靠堆积GPU实现，这是系统性工程，包括底层算力、网络、存储、大数据、AI框架、AI模型等。

AI+云计算的全栈技术能力是云厂商制胜大模型的底气。

再看阿里，全球少数在全栈技术能力都有深度布局、长久积累的科技公司之一，也是为数不多拥有超万亿参数大模型研发经验的企业。

前几天看到国内大模型竞争者们已被划分出了派别，也不乏有人从零起步。

独立大模型创业公司估值在2500万美金之后，要靠业务评估估值，价格都这么贵了，投资人也很审慎。

大模型“云上经济”的权力游戏般的奇幻史诗揭幕，等待更强的人工智能降临。

别忘了，比夺取权杖更重要的是人类命运永续。

（完）

One More Thing

百度的测试结果在这里，可点击阅读：

看百度文心一言实力，再聊ChatGPT触类旁通的学习能力如何而来？

通义千问的测试结果来了：

问：一头熊一天吃14罐蜂蜜，请问它一年吃多少罐蜂蜜？

问：一头熊一天吃14罐蜂蜜，请问它闰年吃多少罐蜂蜜？

做错了。

问：这头熊要去出差了，它要屯一点蜂蜜，请问蜂蜜怎么保存最好？

答对了，认得清保存蜂蜜的常识。

问：一只熊抱着一罐蜂蜜从一个点出发，向南走一公里，再向东走一公里，再向北走一公里，正好又回到了起点，请问：这只熊是什么颜色的？

这道题有点像脑筋急转弯。ChatGPT说，这个问题和熊的颜色没有关系，这只熊处于北极，则这只熊是北极熊，通常是白色的。

问：如果我在野外，背包里有一罐蜂蜜，被熊闻到了，我可以把蜂蜜给熊来求生吗？

这道题答得好。

问：请画一张小熊吃蜂蜜的 ASCII 图片？

通义千问看懂了ASCII这个词，可能画出来有点费劲，就乱来了。

皆是匆匆客，笑笑了因缘，翻（搞）车（笑）的来了。

我问通义千问：42号混凝土拌意大利面”，好吃吗？

通义千问答案如图：

图片内（笑）容（话）是：

作为一个人工智能模型，我没有口感或味觉，所以我无法判断42号混凝土拌意大利面的味道如何。

不过，我可以告诉你，42号混凝土是一种由工业废料制成的材料，因其独特的颜色和强度而被用于制作混凝土。

由于其强度高、色彩鲜艳，因此在某些领域被用作建筑材料，但其味道和质量与普通混凝土拌和的意大利面可能会有所不同。

嗯，42号混凝土拌意大利面，我反正不想吃。谁想试一试？

我问通义千问：砸钉子的时候一瞬间产生大量的高能蛋白，这句话对不对？

图片内（笑）容（话）是：

砸钉子会产生大量的高能蛋白，这句话是不正确的。

钉子是由金属元素构成的，其中含有大量的铁、碳、氧等元素，而蛋白质是由氨基酸构成的，钉子中不含有任何蛋白质成分。因此，砸钉子不会产生大量的高能蛋白。

此外，钉子的砸击力度不同，产生的高能蛋白的数量和种类也会不同，因此不能一概而论。

完蛋，本来说对了，后面车轱辘话砸场子了。

更难的来了。

我问通义千问：根据勾股定理，人工饲养的东条英机是否可以捕获野生的三角函数?

根据勾股定理，人工饲养的东条英机无法捕获野生的三角函数。

勾股定理是指直角三角形斜边的平方等于另一条直角边的平方，因此只适用于平面图形。

而对干野生的三角函数，其形状和位置可能会因地理位置，环境条件等因素而发生变化。

因此无法使用勾股定理来计算其位置。因此，人工饲养的东条英机无法捕获野生的三角函数。

“野生三角函数”“人工饲养的东条英机”这么大的信息量，把通义千问也给整迷糊了。

好了，本次“野生”测试结束，千问万问，问翻车。

更多阅读

AI框架系列：

1.搞深度学习框架的那帮人，不是疯子，就是骗子（一）

2.搞AI框架那帮人丨燎原火，贾扬清（二）

3.搞 AI 框架那帮人（三）：狂热的 AlphaFold 和沉默的中国科学家

4.搞 AI 框架那帮人（四）：AI 框架前传，大数据系统往事

注：（三）和（四）现在并未公开发表，将会以图书出版的形式与各位见面。

漫画系列

1. 解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟，AI运维不是兄弟吗？

3. 大数据的社交牛逼症是怎么得的？

4. AI for Science这事，到底“科学不科学”？

5. 想帮数学家，AI算老几？

6. 给王心凌打Call的，原来是神奇的智能湖仓

7. 原来，知识图谱是“找关系”的摇钱树？

8. 为什么图计算能正面硬刚黑色产业薅羊毛？

9. AutoML：攒钱买个“调参侠机器人”？

10. AutoML：你爱吃的火锅底料，是机器人自动进货

11. 强化学习：人工智能下象棋，走一步，能看几步？

12. 时序数据库：好险，差一点没挤进工业制造的高端局

13. 主动学习：人工智能居然被PUA了？

14. 云计算Serverless：一支穿云箭，千军万马来相见

15. 数据中心网络：数据还有5纳秒抵达战场

16. 数据中心网络“卷”AI：迟到不可怕，可怕的是别人都没迟到

AI大模型与ChatGPT系列：

17. ChatGPT大火，如何成立一家AIGC公司，然后搞钱？

18. ChatGPT：绝不欺负文科生

19. ChatGPT触类旁通的学习能力如何而来？

20. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利，回看ChatGPT大模型时代“底层武器”演进

21. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将

22. ChatGPT大模型用于刑侦破案只能是虚构故事吗？

23. “重塑商汤研发体系”“动员整个公司”，我和商汤首席科学家王晓刚聊AI大模型

DPU芯片系列：

1. 造DPU芯片，如梦幻泡影？丨虚构短篇小说

2. 永远不要投资DPU？

3. DPU加持下的阿里云如何做加密计算？

4. 哎呦CPU，您可别累着，兄弟CIPU在云上帮把手

长文系列：

1. 我怀疑京东神秘部门Y，悟出智能供应链真相了

2. 超级计算机与人工智能：大国超算，无人领航

最后，再介绍一下主编自己吧，

我是谭婧，科技和科普题材作者。

为了在时代中发现故事，

我围追科技大神，堵截科技公司。

偶尔写小说，画漫画。

生命短暂，不走捷径。

原创不易，多谢转发

还想看我的文章，就关注“亲爱的数据”。

大模型“云上经济”之权力游戏

相关文章

vite+vue3使用UEditorPlus ，后端PHP

回调函数含义查询云记debug调试

力扣：两数之和（哈希表）

如何利用超级电容设计简单的不间断电源

【Android平板编程】远程Ubuntu服务器code-server编程写代码

Python pandas和numpy用法参考（转）

为什么你这么累，销量还不如那些轻松工作的同行？

xqueue：基于C语言实现的循环队列缓冲区

第13章_泛型(Generic)

【Pytorch】神经网络的基本骨架

postman进行post、get参数传递及中文乱码和各类型参数传递和json格式传参和日期型参数传递和响应数据传回

JUC源码系列-AQS独占锁获取

JUC源码系列-AQS的Condition的接口实现

es6和commonJs的区别

【C语言】详解数组（数组的创建和初始化、数组越界以及作为函数参数）

Java构造器与this关键字

离线安装rancher2.4管理K8S集群并部署服务

UDP的多点通信

对 FLAG_ACTIVITY_NEW_TASK | FLAG_ACTIVITY_CLEAR_TOP 的实践

什么是开源？