大模型混合云,到了系统性创新突围的关键时刻

news2025/1/11 5:59:10

文 | 智能相对论

作者 | 陈泊丞

亚马逊与Anthropic、微软与OpenAI以及华为云提出的大模型混合云概念等等种种信号都在表明,云计算与大模型深度融合发展的趋势已是业内共识。

目前,以生成式AI为导向,越来越多的公司开始加速大模型技术在云计算平台上的部署和应用,而又反向推动云计算产业的迭代与升级。

从底层的基础设施到中间层的平台服务再到顶层的场景应用,云计算正经历着显著变革。以亚马逊云科技为例,作为全球云计算巨头,他家的云产品正全面为大模型的部署与应用做好技术层面的铺垫。

一、在底层,打造以GPU和自研芯片为代表的基础设施,用于基础模型的训练以及在生产环境中运行推理。

二、在中间层,推出Amazon Bedrock,基于完全托管的服务,允许用户轻松接入经过严格筛选的第三方品牌大模型,如AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI等,以及亚马逊自有品牌的大模型Amazon Titan。

三、在顶层,通过基础模型构建开箱即用的生成式AI应用程序如Amazon Q等,让用户无需任何专业知识即可快速上手生成式AI。

由此来看,生成式AI的发展正在改变云计算本身的产业格局,整个市场的竞争也到了前所未有的变革阶段。

生成式AI,重构了云

秉持着亚马逊云科技类似观点和行动的,还有本土的云厂商们。

百度集团副总裁侯震宇此前便提出,大模型将驱动云计算的创新,并重塑云计算的产业格局,在驱动了底层IT基础设施的重构,也带来了上层应用开发模式的变革。

而华为云发布的国内业界首个大模型混合云——华为云Stack 8.3,则是把混合云与大模型相结合,更具体地反馈出了云服务发展的新方向——通过提供算力平台、云服务、开发套件和专业服务等完整的AI生产链,打通了从基础设施到应用开发的技术路径,帮助政企客户一站式建立专属大模型能力,成了云服务的进阶能力。

这种能力的进阶,基于大模型混合云的技术发展而言,其本质是一种应用场景的特化。

比如,云边协同技术在大模型混合云上的延续应用与创新,其目的是为了解决AI大模型逐步应用到煤矿生产、电力巡检、工业质检等工业场景中所暴露出来的边缘实时推理需求。

一方面,工业场景对AI应用的需求比其他场景更多,且效率要求也更高,低延时、高敏捷、广泛部署都需要做好边缘管理和应用工作。另一方面,当AI大模型走向工业场景应用,其版本迭代、功能升级就不可避免地进入边用边学、边升级边应用的阶段。

由此,云边协同成为关键,需平衡计算资源、优化数据流动、提升处理效率和增强服务质量,支撑了多样化、高要求的AI应用场景。

华为混合云提出的云边协同方案基于混合云的ModelArts AI开发平台和盘古大模型,形成了一站式的场景化模型训练工作流。再通过采集原始生产样本数据和模型运行中产生的存疑样本数据,使用工作流高效训练模型,并统一管理模型版本,有效实现了AI模型边用边学、快速迭代、持续升级、能适应新的工况和数据变化。

再说数据问题,其中数据存储就困扰着AI大模型训练效率。随着AI大模型参数量的增加,训练集群规模也不断扩大,而传统存储从架构上就已经难以应对超大规模AI集群数据快读、Checkpoint快存、故障快速恢复的需求。

面对这样的特定需求,华为云不得不在存储架构上来寻求突破,基于于OBS数据湖、SFS Turbo高性能并行文件系统和AI Turbo加速的创新三层架构,从而系统地应对大模型训练场景的挑战。

总的来说,只是为了应对AI大模型的各类场景问题,云服务就需要从底层基础设施到顶层应用来全面创新,提出对应的解决方案以进一步推动AI大模型的发展。那么,摆在大模型混合云面前的技术难点并不会太少,近年来华为云一直在通过系统性的创新解决大模型应用的关键堵点,其发布的大模型混合云十大创新技术就包括了除云边协同、数据存储之外还有增强AI网络、算子加速、统一数据编码、多样性算力调度等等。

事实上,抛开华为云提出的大模型混合云这样系统的概念不谈,业内对于云与大模型的结合已经达成共识,并致力于提供各类技术方案,来解决大模型在云上的各种训练、推理、应用等需求。

像京东云推出了一套大模型的完整工具,包括支撑大模型应用的基础设施——言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品,对应的就是在云的基础上推动大模型的产业化发展。

大模型混合云的系统性突围

亚马逊云科技、华为云、京东云、百度智能云等诸多厂商面向今天爆发的大模型时代,无一不在致力于打造完整的技术解决方案,把底层、中间层、顶层等一系列的流程和服务包办,从而让大模型能在云上持续部署和应用,释放价值。

大模型混合云这一概念的提出,更是把云厂商的这种综合解决方案带向了更加系统的阶段。而这种系统性的形成,不仅要求云厂商要在技术上聚力,还要面向场景进行广泛探索。

“对政府来说,他们关心的可能并不是简单解决内部节约一个客服人员、运维人员的问题,而是更多站在产业布局角度,通过大模型带动整个产业的发展。”众数信科创始人兼CEO吴炳坤在接受媒体采访时说道。

基于云服务行业的发展趋势,这种产业的系统性发展实际上就需要借助云技术的系统性升级来实现——这是一种大格局的体现。对此,从传统的多云策略来看,大模型混合云的提出更能展现出未来云服务的大格局。

多云策略侧重于使用多个云服务提供商的服务,以避免供应商锁定,同时优化成本或利用各服务商的优势。而大模型混合云虽然也可能涉及多个云环境,但其核心在于构建一个高度整合、优化的大规模数据处理和AI模型运行环境,不单纯为了分散服务来源,而是为了实现特定的技术和业务目标。

比如,华为云Stack的多云协同架构,就允许行业大模型在公有云上进行训练,同时还能结合企业本地数据在混合云中微调,然后在边缘云进行推理,从而满足不同场景下的计算需求。

这样做的本质不是为了分散“云”,而是基于原生混合云能力,让用户可以将大模型从本地延伸到边缘和公有云,实现全场景跨云部署,达到应用效率、安全性能等结果的最优化。

因此,总结来说,大模型混合云是针对特定领域(特别是需要处理大规模数据和复杂AI模型的场景)优化的混合云架构,它集成了公有云的弹性与私有云的安全控制,以及可能的多云服务,以满足高性能计算和AI应用的特殊需求。

这种集成实现的技术系统性将在接下来的时间内成就产业的系统性发展,也就是“不是简单解决内部节约一个客服人员、运维人员的问题,而是更多站在产业布局角度,通过大模型带动整个产业的发展。”

因此,基于这样的系统性发展,接下来大模型+混合云的发展将形成了较为显著的几大趋势。

一、在算力调度上,大模型的训练和推理通常需要大量的计算资源。随着模型规模的增长,对算力的需求也在增加。混合云环境下的算力调度和优化技术会持续发展,以支持更高效的大模型训练和推理。

二、在云边协同上,随着物联网(IoT)设备的普及,边缘计算变得越来越重要。混合云架构将支持更紧密的云边协同,使大模型能够在边缘进行实时推理,减少延迟并提高响应速度。

三、在基础设施上,AI-Native存储和网络技术将继续演进,以支持更高效的模型训练和推理过程。例如,高性能存储支持多级缓存机制,实现Checkpoint秒级存取,以及训练故障分钟级恢复。

四、在模型应用上,企业可以通过混合云环境中的本地数据对预训练的大模型进行微调,以适应特定业务场景的需求,同时保持数据的私密性。

五、在业务部署上,不同行业(如金融、医疗、制造等)将利用混合云上的大模型来解决特定的业务挑战,促进业务创新和流程自动化。同时,大模型在混合云环境中更容易实现规模化部署,特别是在那些分布广泛的企业和行业中,如能源、交通、制造等领域。

六、在生态建设上,大模型和混合云的结合将促进更多生态合作伙伴的加入,共同开发解决方案和服务,扩大整个生态系统。同时,随着大模型混合云应用的增多,相关标准和协议也将逐步制定和完善,以提高不同系统间的互操作性和兼容性。

写在最后

现如今,大模型拥有了数亿乃至数十亿的参数量,这为生成式AI的发展提供了前所未有的计算规模和复杂度。更多的参数意味着模型可以学习到更深层次、更精细的数据特征,从而在文本生成、图像合成、音频创作等多个领域生成更高质量和多样性的内容,很好地推动了生成式AI的高质量发展。

而这样的能力对于产业而言,正是未来产业转型升级的一大关键。云计算同样作为产业升级的底层技术,与生成式AI的协同将以更全面、完整的形态来实现这一目标。但是,在这个过程中,云如何与生成式AI背后的大模型进行结合,将是关键性问题。

生成式AI这趟“顺风车”,亚马逊云科技、华为云、京东云、百度智能云等云厂商都想搭,但是搭起来却是得费些心思咯。

*本文图片均来源于网络 

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2045675.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

够豪横,310万不要了,后续损失恐上千万

近日,深圳一套法拍房引起了整个圈子的轰动! 20年前花费382万购入的豪宅,现在竟能拍到8389万,翻了22倍! 就在大家都感慨深圳顶豪的购买力惊人时,事情却迎来了更大的反转! 该豪宅竟重现法拍市场…

【HarmonyOS】鸿蒙应用实现调用系统地图导航或路径规划

【HarmonyOS】鸿蒙应用实现调用系统地图导航或路径规划 前言 在涉及地图业务中,调用地图导航和路径规划是三方应用中较为常见的功能。 若只是子业务需要地图导航效果,整个APP内部集成地图去实现导航或者路径规划,会造成SDK集成冗余。毕竟很…

校园外卖服务系统设计与实现

TOC springboot292校园外卖服务系统设计与实现 第一章 课题背景及研究内容 1.1 课题背景 信息数据从传统到当代,是一直在变革当中,突如其来的互联网让传统的信息管理看到了革命性的曙光,因为传统信息管理从时效性,还是安全性&…

若依 Ruoyi4.7.9 创建页面并显示

自行从https://gitee.com/y_project/RuoYi下载源代码,这个不再赘述。 // 下载后会发现现在的Ruoyi环境,分成了6个模块: 模块主要的介绍大家可以看文档。 官网地址:https://doc.ruoyi.vip/ruoyi/ 我下载的这个是基于mvc框架&…

CTFHUB-技能树-Web题-RCE(远程代码执行)-远程包含-命令注入-过滤空格

CTFHUB-技能树-Web题-RCE&#xff08;远程代码执行&#xff09;-远程包含-命令注入-过滤空格 就是过滤掉了空格 找能代替空格的代替就行了 使用IFS$9、%09、<、>、<>、{,}、%20、${IFS}、${IFS}来代替空格 127.0.0.1;cat${IFS}xxxx.php先来查看一下目录 127.0.0…

python可视化数据练习(地形图)

一、数据展示&#xff08;可通过目录直接跳转到代码部分&#xff09; {"lastUpdateTime":"2021-08-18 10:53:30","chinaTotal":{"confirm":122482,"heal":112984,"dead":5669,"nowConfirm":3829,"…

基于Spring boot的名城小区物业管理系统

TOC springboot240基于Spring boot的名城小区物业管理系统 绪论 1.1研究背景与意义 1.1.1研究背景 近年来&#xff0c;第三产业发展非常迅速&#xff0c;诸如计算机服务、旅游、娱乐、体育等服务行业&#xff0c;对整个社会的经济建设起到了极大地促进作用&#xff0c;这一…

Xilinx(AMD)的怪异行为——ila的radix没有real格式

使用vivado 2021.1的过程中发现&#xff0c;仿真时&#xff0c;可以选择把数据的radix按照定点或浮点格式显示&#xff1a; 显示效果如下&#xff1a; 仿真完后&#xff0c;在ila中观察&#xff0c;发现定点和浮点显示的菜单少了几项&#xff1a; xilinx为什么会把这么有用的…

剑指offer--面试题58.翻转字符串

题目描述 输入一个英文句子&#xff0c;翻转句子中单词的顺序&#xff0c;但单词内字符的顺序不变。为简单起见&#xff0c;标点符号和普通字母一样处理。例如输入字符串”I am a student.“,则输出”student. a am I“。 算法分析 完整代码 #include <string.h> //把起…

html+css+js网页设计 作业歌帝梵官网首页1个页面6个js效果

htmlcssjs网页设计 作业歌帝梵官网首页1个页面6个js效果 网页作品代码简单&#xff0c;可使用任意HTML编辑软件&#xff08;如&#xff1a;Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等操作&#xff09;。 获…

安卓主板_MTK联发科主板定制开发|PCBA定制开发

MTK联发科安卓主板&#xff0c;采用MT6762八核平台方案&#xff0c;支持谷歌Android 11.0系统&#xff0c;MT6762采用ARM八核A53内核芯片、主频高达2.0GHz&#xff0c;GPU采用ARM PowerVR GE8329650MHZ&#xff0c;支持主流19201080分辨率&#xff0c;支持硬解H.264&#xff0c…

Typora使用教程-修改配置文件-免费使用

Typora特点 简洁美观&#xff1a;Typora的界面非常简洁&#xff0c;没有繁琐的菜单和工具栏&#xff0c;只有一个干净的编辑窗口。它使用 Markdown语法&#xff0c;将文本转化为漂亮的排版&#xff0c;无需关注样式和格式的细节。所见即所得&#xff1a;Typora实时显示Markdow…

希尔排序,详细解析(附图解)

1.希尔排序思路 希尔排序是一种基于插入排序的算法&#xff0c;通过将原始数据分成若干个子序列&#xff0c;然后对子序列进行插入排序&#xff0c;逐渐减小子序列的间隔&#xff0c;最后对整个序列进行一次插入排序。 1.分组直接插入排序&#xff0c;目标接近有序--------…

「Unity3D」属性面板(Inspector)上增删操作,序列化的Dictionary对象的k-v数值

Unity无法序列化Dictionary对象&#xff0c;可以通过实现ISerializationCallbackReceiver接口&#xff0c;来自定义实现&#xff0c;即&#xff1a;搞一个key list和一个value list分别存储dict的k-v&#xff0c;于是属性面板上就会显示&#xff0c;k-v的两个列表。 但这会有一…

【鸿蒙基础系列】鸿蒙基础组件

&#x1f41f;作者简介&#xff1a;一名大三在校生&#xff0c;喜欢编程&#x1fab4; &#x1f421;&#x1f419;个人主页&#x1f947;&#xff1a;Aic山鱼 &#x1f420;WeChat&#xff1a;z7010cyy &#x1f988;系列专栏&#xff1a;&#x1f3de;️ 前端-JS基础专栏✨前…

stm32智能颜色送餐小车(红外光管避障)

大家好啊&#xff0c;我是情谊&#xff0c;今天我们来介绍一下我最近设计的stm32产品&#xff0c;我们在今年七月份的时候参加了光电设计大赛&#xff0c;我们小队使用的就是stm32的智能送餐小车&#xff0c;虽然止步于省赛&#xff0c;但是还是一次成长的经验吧&#xff0c;那…

Sql与Rce注入相关漏洞复现

目录 sqli-labs注入第38&#xff0c;48关 第38关&#xff08;单引号闭合&#xff09; ​编辑 第48关 (GET请求-基于错误-盲注-数字型-order by 排序 ​编辑 贷齐乐系统多处Sql注入漏洞 环境搭建 将贷齐乐源码放入phpstudy中的www目录下 在phpstudy上创建网站&#xff1…

DevEcoStudio对Gitee进行变基与合并

当尝试将本地分支的更改推送到远程仓库&#xff0c;但是远程仓库中的该分支已经有了您本地分支中没有的提交时&#xff0c;会出现这个提示。 具体来说&#xff0c;这个提示意味着&#xff1a; 推送被拒绝&#xff1a;不能直接将更改推送到远程仓库&#xff0c;因为远程仓库中…

WeNet模型学习笔记

WeNet是一个端到端语音识别模型&#xff0c;由于其优越的特性&#xff0c;成为近几年语音识别领域的热门模型。WeNet模型是一种CTC和attention结构的混合体&#xff0c;以Conformer或Transformer作为encoder&#xff0c;并使用attention decoder对CTC的输出进行重新打分(rescor…

微信小程序用 pinia数据化存储信息

import { defineStore } from pinia import { ref } from vue import type {LoginResult} from /types/member //定义 Store export const useMemberStore defineStore( member, () > { // 会员信息 const profile ref<LoginResult>() //保存会员信息&#xff0c…