一朵华为云,如何做好百模千态?

news2024/11/25 16:30:29

点击关注

文丨刘雨琦、郝鑫

2005年华为提出网络时代的“All IP”,2011年提出数字化时代的“All Cloud”,2023年提出智能时代的“All Intelligence”。

截至目前,华为的战略升级经历了三个阶段。

步入智能化,需要迎接的困难依然不少。在大模型能力涌现、多模态融合、MOE等趋势下,模型参数很快将从现在的5400亿超过数万亿,对海量的稳定算力、大规模并行训练、以及整体的架构设计都提出了更高要求。同时,数据集规模的快速增长,数据高效存储、清洗和标注的难度,以及海量Token的训练等充满挑战。

“可以说,大模型及相关应用是迄今为止最复杂的软硬件系统工程”, 华为云CTO张宇昕判断道。

在上篇 《全面智能化,华为的“硬功夫”》 中,我们总结在硬件层面,华为的策略是从底层建基开始做起, 以硬件为切入,打通感知层和连接层,凭借特色化行业军团打入各行各业,出具智能化解决方案。 也正是因为华为本身软硬一体化的特殊性,催生了其既要做好“硬件层”与“软件层”的连接,也要做好软件层与千行百业连接的需求。

近期的华为全联接大会2023,华为云公布了一系列实践,进一步印证了软硬结合的深层次逻辑:

面向底层算力,宣布华为云昇腾AI云服务正式上线,提供算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts,构建AI云底座;

面向客户、开发者开发训练,上线“昇腾AI云服务百模千态专区”,同时整合了应用开发需要的开发生产线、低码/无码平台、AI应用框架及全新的AI应用工程套件,降低开发门槛;

面向大模型落地,发布华为云Stack 8.3,提供13类100+云服务,重点增强盘古大模型、工业互联网、数据要素流通、软件开发生产线四大核心能力。

通过梳理本次大会内容,光锥智能发现,华为云服务总体分为两个大板块: 一是面向计算,以硬件交付为主、提供算力的业务;二是直接面向客户,以软件交付为主、提供服务的业务。

如果将华为提出的全面智能化战略形象化,算力就好比是引擎,计算就是发动机。华为云平台在其中承担连接器的角色,向下调用算力平台,向上兼容千行百业。对外,也给千行百业的智能化描绘工程图纸和提供工具。

01 昇腾AI云服务:算力的“输血泵”

随着大模型厂商的不断推进,让“大模型落地各行各业”正在一步步变成现实,这同时也激发了大规模底层算力调用的需求。

作为底层的算力,以前大多数情况下通过本地部署方式完成,而现在明显的变化是, 大模型开始推动算力基础设施不断“向上”,服务于千行百业的客户。

但要把算力直接部署在企业端,本身是件门槛极其高的事情,正如华为云代理厂商告诉光锥智能, “预算要千万级起步,其次还要配备技术研发团队”。这就导致,从计算平台到客户之间便产生了一道鸿沟。

谁来填补这道裂缝?华为给出的答案是“昇腾AI云服务”。据华为云透露,截至目前,其在贵安、乌兰察布、芜湖建设了3大AI算力中心。算力中心没办法直接提供服务,但通过云计算就可以把像水电一般的算力转化为“即开即用”的服务一起出售给用户。

就像一块块搭积木,昇腾AI云服务将算力平台和云计算平台的能力组合在了一起,硬件发挥传输信号、计算等能力,软件发挥数据传输、存储、加密等能力,软硬件一体化来实现效率的最大化。据了解, 目前基于华为昇腾AI云服务,同时通过软硬协同实现算子融合与混合精度的优化,让训练效率提升45%。

具体来看, 华为昇腾AI产业生态由云边端的硬件、异构计算架构、AI框架、应用使能和行业应用层构成,这几部分揭示了华为AI能力如何落地行业场景的全过程。

我们可以把上面这张图理解为一间正在投入生产的工厂。异构计算架构层好比一台万能的生产机器,它具有极强的兼容性,既支持CPU的引擎,也支持GPU、TPU的引擎,有了算力整个工厂才得以运作起来。

AI框架就好比是工人手中的图纸,只有对照着图纸,才能知道每一步的生产步骤。有了机器、图纸还不够,工厂还给每位工人配备了一些封装好的扳手、锤子等工具,这也就是“应用使能层”的作用。待工人将图纸的样式组装为现实的产品,会立即被分类投入到不同的产业线进行打包处理,这也等同于AI进入到了各个行业当中。

华为从最底层打造了一个最全的生产工厂,也提供了各类服务。如在异构计算架构层不仅支持不同类型的处理器,还提供了四种算力供给模式, 一种是直接卖服务器的裸算力模式;第二种是租服务器的租算力模式;第三种是通过服务器打造一个云服务空间,提供算力支持;最后一种是以MaaS服务的方式提供算力。

纵观全世界,谷歌、亚马逊等云厂商多以云算力模式、MaaS模式的方式提供算力,英伟达等硬件芯片厂商多以裸算力、多租户模式提供算力,很长一段时间内两者之间泾渭分明。

不过,多算力供给模式正在逐渐成为趋势。据外媒报道,英伟达已经开始通过与一些云厂商签订GPU合同,“逼迫”他们租用英伟达的服务器,以此来打通云算力和MaaS模式。

02 华为云:AI云基座和生产线

算力层的优势是一个新引擎,华为云才是带领华为智能化走向千行百业的那辆马车。

全联接大会中,除了发布昇腾AI云服务,华为云还升级了Stack 8.3版本,为企业提供一站式建设专属大模型的工具和服务。据了解,全新的Stack8.3版本,提供了完整的AI生产链,包括AI算力、计算结构、框架、开发平台、开发套件、基础大模型以及专业服务,降低大模型的建设门槛。

“大模型不是少数企业的专利”,华为云Stack总裁尚海峰说道:“华为希望让每个企业都拥有自己的大模型。”

但从企业内部来看,数据的实时采集受制于非数字化终端,数据的实时上传受制于低速网络,数据的实时分析受制于数据孤岛,行业数据难采、难传、难用,诸多因素都阻碍了智能化的进程。

带着这个思路再看Stack 8.3目前的产品布局,颇有种针对企业痛点逐个狙击的感觉。

比如在8.3版本中,重点对数据要素流通能力进行了增强,而这正是企业面临智能化的第一道难关。在数据实时采集方面,华为打造了感知层硬件进行支撑;为了解决上传速度的问题,华为QingTian架构基于高速新型网络协议,打破了算力、存储和网络的边界,完成对多算力的对等互联,以解决此前低速网络带来的数据传输时间过长、数据丢失等问题。

另一方面,数据需要在流通中才能充分体现价值,但当前业界仍然缺乏可信的数据流通机制,这样的挑战在大模型时代尤为突出。

数据是行业用户的核心资产和竞争优势的源泉,行业用户部分关键敏感数据难以实现共享或者“出厂”, 例如政务行业中涉及到城市发展、公共安全和个人隐私等方面的数据;金融行业中责权、债务关系相关的数据;制造业的资产明细、生产数据以及明确要求不可以出园区的数据等等,此时基础大模型难以适应行业智能化需求。

为此,每个云厂商都在着重建立保障数据要素流通过程中的安全可信机制。区块链和隐私计算成为其中最核心的能力,这原本是金融交易中的核心技术,如今也逐渐成为了基础能力。

在数据流通环节,区块链技术可以进行数据确权、防篡改,隐私计算技术确保数据在应用中“可用不可见、可算不可识”。华为Stack 8.3将上述多种技术进行数智融合,让企业可以实现算法、模型和数据集等高质量数据产品的开发,满足数据的使用标准;并通过EDS交换数据空间让数据可信流通与授权运营,确保数据不出域。

其他厂商也在数据层积极布局,蚂蚁专门推出了针对数据流通安全的平台“摩斯”,独立对外提供服务,产品化页面操作包含分布式和集中式计算模式提供安全匹配、匿名查询、安全模型、安全统计等各类产品。

保障数据安全和流通之后,面对智能化的应用开发,很多企业都是“丈二的和尚,摸不着头脑”。Stack 8.3版本是一站式开发平台,提供从编码规范、分布式构建、漏洞检查到协同开发等30多种核心能力,建立了流程、工具到经验一体的软件开发生产线CodeArts。

对比上文所提到的ModleArts的逻辑是一样的,几乎开发者在软件开发中的所有流程和工具、服务,都能够在CodeArts中找到答案。中国船舶集团旗下的海舟技术公司,专门负责船舶系统的软件业务和开发,基于CodeArts的结构化流程和契约化研发确保交付零偏差,实现千人高效协作,打造大型工业领域原创技术“策源地”。

无论是被动的一体化,还是主动的一站式,可以看出目前华为云的整体思路不仅要做深更要做广,为智能化时代,打造一个AI云基座。

03 5+N+X,解耦大模型解决方案

毫无疑问,大模型虽然不是智能化的全部,但却已经成为了企业智能化的灵魂。

在技术发展的早期,有时候建立标准比发展技术本身更加重要。 这也是华为云的思路。比如自动驾驶技术在发展的早期也曾经历混乱和迷茫,直到业内将自动驾驶技术分为L0-L5,框架清晰之后,才迎来了具体的技术突破和落地。

华为云认为对于大模型的思考也应该如此。基于思考,华为云将大模型分为了L0、L1、L2三个层次,形成了5+N+X的三层解耦架构。

其中5指的是5种基础大模型,包括自然语言(LLM)、视觉(CV)、多模态、预测决策(推理)、科学计算5种不同方向的大模型;N是基于通用大模型打造的行业大模型,利用特定的行业数据,基于无监督自主学习行业知识,形成的行业的大模型,也是目前大模型在产业应用落地的主要形式;而X则是L1结合场景数据形成场景大模型,以适应行业的需要。

从 L0、L1 到 L2,遵从由“通”到“专”的分层级模式,通用大模型用来定性、行业大模型定量,而场景大模型则代表了无限可能。在这样层级分明的架构中,可以完成从 L0 通用模型到 L1 行业模型再到 L2 专用模型的快速开发流程。

据光锥智能了解到,首先,盘古大模型采用完全的分层解耦设计, 可以灵活适配、满足行业多变的需求,企业既可以为自己的大模型加载独立的数据集,也可以独立升级模型。

但同时,大模型的三级模型之间可以交互优化。 L0 模型可以为 L1 模型提供初始化加速收敛,L1 可以通过模型抽取蒸馏产生更强的 L2 模型,L2 也能够在实际问题中通过积累难例数据或者行业经验反哺 L1。

或许这也正是华为云能够快速同时推出9大行业大模型的原因。全联接大会中,华为云一口气“上新”了9大行业模型,矿山大模型、气象大模型、医药大模型等,针对具体行业具体业务,提供实际的解决方案。

与其他云厂商提供的行业大模型不同的是,华为的行业大模型已经在实际业务中“跑过一轮”,带着实战经验就能起到关键作用。

比如在近几年极端天气与日俱增之际,对气象预测的精准度有了进一步要求,盘古气象大模型与中国国家气象局合作,使得中长期气象预报精度首次超过传统数值方法,速度提升10000倍以上。具体而言,该模型使用全球39年的天气数据进行训练,仅用1.4秒就完成了全球24小时的天气预测,同时对台风路径预报等极端天梯,提高了精准度。

同样,煤炭行业面临着开采地质条件复杂、灾害多发(如煤尘、水、火、瓦斯和顶板等自然灾害)、生产效率较低、作业环境恶劣、人员短缺等挑战,为应对这些挑战,大模型在尽量增安、少人。仅以瓦斯隐患预测一个场景举例,借助大模型对井下采煤、设备、矿压、通风、安全监测、地质、瓦斯抽取等系统数据进行智能融合分析,对井下关键位置瓦斯浓度进行预测,实现瓦斯隐患的超前预警。

当然,这得益于华为在智能感知层的纵深布局,在具体的应用场景中再次发挥作用和价值。

未来,百模千态将面临一个个越来越艰深的行业和越来越具体的场景,无论是华为云还是其他云厂商,都需要不断思考着陆点,深入无数毛细血管,才能迎来质的改变。

欢迎关注光锥智能,获取更多科技前沿知识!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1048521.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

异地寄件云打印教程

对于部分企业来说,出于各种原因,员工不得不进行“异地办公”,在这种情况下,因公寄件就是一件麻烦事儿,为什么这么说呢? 比方说一些电商企业,由于成本把控的问题,仓库会建在离货源地更…

降本提效促成交,抖音电商商品卡实时免佣这么做就对了!

抖音电商深耕全域生意,于今年3月推出商品卡免佣政策助力商家开辟生意新阵地,运行半年多,已有超百万商家收获可观免佣收益。9月1日起,商品卡免佣政策升级为实时免佣,佣金实时返还、金额清楚,再次激发商家经营…

混淆技术研究-混淆技术-源码分析(2)

简介 OLLVM(Obfuscator-LLVM)是基于LLVM(Low Level Virtual Machine)框架的一种代码混淆器。它主要用于对C/C++和汇编语言程序进行混淆,以增加代码的复杂性,提高代码的安全性和抵抗逆向工程的能力。 IR(Intermediate Representation)是指中间表示,是编译器在将源代码…

FastestDet---原理介绍

1.测试指标 2.算法定位 FastestDet是设计用来接替yolo-fastest系列算法,相比于业界已有的轻量级目标检测算法如yolov5n, yolox-nano, nanoDet, pp-yolo-tiny, FastestDet和这些算法根本不是一个量级,FastestDet无论在速度还是参数量上,都是要小好几个数量级的,但是精度自然…

为什么埃隆·马斯克说Rust是AGI的语言?

为什么埃隆马斯克说Rust是AGI的语言? 大喵点评:本文作者的观点不代表我的观点,另有人视频里指出Mojo比Python快 35000倍的测评有失偏颇。请见👇视频。 但,本篇的价值在于 以及为什么WasmEdge是AGI采用Rust的关键路径…

HALCON支持GPU加速的算子有哪些?

参考例程get_operator_info。 get_opencl_operators这里可以查看到所有支持gpu加速的算子。 支持的算子列表: crop_rectangle1,deviation_image,mean_image,points_harris,gray_opening_shape, gray_dilat…

加速企业AI实施:成功策略和效率方法

文章目录 写在前面面临的挑战MlOps简介好书推荐 写作末尾 写在前面 作为计算机科学领域的一个关键分支,机器学习在当今人工智能领域中占据着至关重要的地位,广受瞩目。机器学习通过深入分析大规模数据并总结其中的规律,为我们提供了解决许多…

LeetCode算法题---第3天

注:大佬解答来自LeetCode官方题解 121.买卖股票的最佳时期 1.题目 2.个人解答 function maxProfit(prices) {//更新最低价格和最大利润let minPrice prices[0];let maxProfit 0;for (let i 1; i < prices.length; i) {// 如果当前价格比最低价格还低&#xff0c;更新最…

基于SpringBoot的校园资料分享平台

目录 前言 一、技术栈 二、系统功能介绍 学生信息管理 学生统计管理 资料分享管理 公告资讯管理 首页资料分享 资料分享评论 我的收藏 三、核心代码 1、登录模块 2、文件上传模块 3、代码封装 前言 随着信息互联网购物的飞速发展&#xff0c;国内放开了自媒体的政策…

图像处理与计算机视觉--第五章-图像分割-霍夫变换

文章目录 1.霍夫变换(Hough Transform)原理介绍2.霍夫变换(Hough Transform)算法流程3.霍夫变换(Hough Transform)算法代码4.霍夫变换(Hough Transform)算法效果 1.霍夫变换(Hough Transform)原理介绍 Hough Transform是一种常用的计算机视觉图形检验方法&#xff0c;霍夫变换一…

【再识C进阶3(下)】详细地认识字符分类函数,字符转换函数和内存函数

前言 &#x1f493;作者简介&#xff1a; 加油&#xff0c;旭杏&#xff0c;目前大二&#xff0c;正在学习C&#xff0c;数据结构等&#x1f440; &#x1f493;作者主页&#xff1a;加油&#xff0c;旭杏的主页&#x1f440; ⏩本文收录在&#xff1a;再识C进阶的专栏&#x1…

明年亮相香港与新加坡!Polkadot 区块链学院欢迎 Web3 革新者报名

熊市是建设的绝佳时机。继剑桥大学、布宜诺斯艾利斯大学、加州大学伯克利分校之后&#xff0c;Polkadot 区块链学院&#xff08;PBA&#xff09;宣布明年将在亚洲开设两站课程&#xff01;你是否准备好全身心投入到 Web3 的世界&#xff0c;突破边界束缚&#xff0c;开拓创新&a…

Python如何优雅地可视化目标检测框

读入图像 img_name ./pikachu.jpg img cv2.imread(img_name) box [ 140, 16,468,390, "pikachu"] box_color (255,0,255) cv2.rectangle(img, (box[0], box[1]), (box[2], box[3]), colorbox_color, thickness2)标签美化 接下来我们来给矩形框添加标签,我们…

Win10电脑任务栏没有蓝牙图标的简单解决方法

Win10电脑任务栏没有蓝牙图标怎么办&#xff1f;在Win10电脑中&#xff0c;用户有时候会发现任务栏上没有蓝牙图标了&#xff0c;这样就无法通过蓝牙图标快速打开蓝牙服务了。下面小编给大家介绍最简单的解决方法&#xff0c;帮助大家找回任务栏上面的蓝牙图标吧。 问题原因 反…

一致性 Hash 算法

是什么&#xff1a; 一致性 hash&#xff0c;是一种比较特殊的 hash 算法&#xff0c;它的核心思想是解决在分布式环境下&#xff0c; hash 表中可能存在的动态扩容和缩容的问题。 为什么会出现一致性Hash 一般情况下&#xff0c;我们会使用 hash 表的方式以 key-value 的方式来…

一个月软考高项(信息系统项目管理师)冲刺攻略

2023下半年软考信息系统项目管理师&#xff08;高项&#xff09;&#xff0c;离11月4号的考试&#xff0c;只有1个多月了&#xff0c;啃书是来不及了&#xff0c;要抓重点看了 信息系统项目管理师考试介绍&#xff1a; 考试时间&#xff1a;一年考两次&#xff0c;上半年的5月…

pytorch的pixel_shuffle转tflite文件

torch.pixel_shuffle()是pytorch里面上采样比较常用的方法&#xff0c;但是和tensoflow的depth_to_space不是完全一样的&#xff0c;虽然看起来功能很像&#xff0c;但是细微是有差异的 def tf_pixelshuffle(input, upscale_factor):temp []depth upscale_factor *upscale_f…

基于SpringBoot的微服务在线教育系统设计与实现

目录 前言 一、技术栈 二、系统功能介绍 用户管理 课程信息管理 学科管理 职业规划管理 我的笔记管理 三、核心代码 1、登录模块 2、文件上传模块 3、代码封装 前言 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本…

张量-类型转换函数

代码示例如下: import tensorflow.compat.v1 as tf tf.disable_v2_behavior()a tf.constant(6) b tf.constant([1,2,3]) a1 tf.to_float(a,nameToFloat) b1 tf.cast(b,dtype tf.float32)with tf.Session() as session:print(session.run(a1))print(session.run(b1))

【LeetCode75】第六十五题买卖股票的最佳时机含手续费

目录 题目&#xff1a; 示例&#xff1a; 分析&#xff1a; 代码&#xff1a; 题目&#xff1a; 示例&#xff1a; 分析&#xff1a; 这是力扣里动态规划类题目里的一道系列题目&#xff0c;买卖股票&#xff0c;直接在题库里搜就能搜到这一系列。 我建议各位可以先去做一…