AI算力池化技术助力运营商打造智算生态

news2024/11/8 15:40:45

数字经济时代,算力已成为国民经济发展的重要基础设施。随着数字化转型的不断深入和人工智能技术的广泛应用,构建以新型智算中心为核心的智能算力生态体系正驱动着数字经济快速发展,成为人工智能赋能千行百业的重中之重。

2022年2月,国家正式启动“东数西算”工程,作为数字信息基础设施建设的国家队和主力军,三大运营商纷纷加快布局新型智算中心建设;与此同时,作为基础设施供应商,如何将智能算力资源转化为“一点接入、即取即用”的社会级服务成为运营商在算力建设过程中关注的重点。

智算中心建设需求及挑战

1. 提升集约化建设水平,降低算力建设成本

当前智能算力芯片成本已占到数据中心服务器总体成本80%,然而智能算力芯片作为新型硬件形态,其虚拟化能力存在局限性,算力资源只能以独占方式进行分配,导致底层资源无法被充分利用——据统计,智算中心异构算力硬件总体利用率普遍低于30%,导致算力建设总体成本居高不下。

2. 提升算力使用效率,降低算力服务成本

智算中心作为面向社会的服务基础设施,一方面要及时响应上层应用对底层异构算力资源的需求,另一方面也要面对不同业务场景及不同时段下、应用对资源波峰波谷的需求特征。因此,智算中心内应用在部署时不应受到底层服务器硬件配置的局限,同时底层资源应可根据上层业务需求弹性伸缩,高效流转。

3. 加强云边协同能力,实现泛在算力统一编排

人工智能、大数据、AR/VR等新兴应用的涌现推动了异构计算的迅猛发展,需求的多样化使得异构多样算力资源呈现分布广泛、种类繁多的特征。如何实现遍布在云、边、端的异构算力资源有效协同、统一调度是运营商需要面临的挑战。

4. 构建多元生态,保障算力供应安全

当前芯片生态已呈现一超多雄的产业格局,随着国际形势的变化,智算中心对异构算力芯片的供应应考虑尽可能拓宽和加固多元化渠道,以避免“单点故障”的发生。为避免算力硬件供应多元化带来的底层资源建设烟囱化问题,运营商应具备不同算力硬件统一纳管、统一运维能力,避免因资源多元化造成运维成本的增加。

智算中心建设实践

趋动科技OrionX猎户座AI算力资源池化解决方案为运营商客户带来创新的异构算力资源管理和分配方案,引入软件定义算力的概念,将OrionX软件部署在多台不同类型的异构算力服务器上,通过网络互联,构建了一个统一的异构算力资源池化层,实现了异构算力资源的统一调度、灵活分配、弹性伸缩等云化能力,为上层应用提供异构算力资源。

OrionX通过软件定义AI算力,颠覆了原有的AI应用直接调用物理异构加速硬件的架构,将AI应用与物理异构加速卡解耦。AI应用调用OrionX vDevice,由OrionX将OrionX vDevice匹配到异构算力资源池中的物理硬件,这样,能够达到AI应用透明的共享异构算力资源池内的所有硬件资源的目的。OrionX将一块物理硬件细粒度切分成多个vDevice,然后分配给多个虚拟机或者容器。每一块vDevice的显存和算力都能被独立设置和限制。通过这个功能,运行在全栈云上的AI推理应用可以高效地共享异构算力资源,提高物理硬件利用率,降低成本,实现了“有卡可用、按需分配、高效管理”。

OrionX在中移咪咕成功应用

算力网络对数据中心的发展产生深远影响。2022年12月,面临标准统一、技术突破、生态聚合三大迫切需求,中国移动依托算力网络子链,联合趋动科技在内的十家合作伙伴共建新型智算开放实验室,打造“芯合”算力原生平台,攻关算力原生技术,融通AI生态,实现应用一次开发、跨架构部署和迁移。

为引入业界优秀AI关键技术、AI基础软硬件、AI集成能力,中国移动专门在人工智能领域设立了产业合作计划——“九天揽月” 计划,旨在联合产学研用各界,共同构建加速人工智能产业规模化创新发展的合作新生态。在中国移动集团高同庆副总经理和中国移动研究院黄宇红院长的共同见证下,包括趋动科技在内的九家企业正式成为“九天揽月”计划的新成员。

智能算力作为全社会数智化转型的基石,有力支撑着数字经济高质量发展。趋动科技正以领先的算力池化能力,与运营商携手面对智算生态竖井问题,共同推进相关领域的人工智能技术和服务应用水平,加速自主可控的国产化AI技术落地,为行业的数智化转型添砖加瓦!

· 相关阅读

  • 趋动科技在中国移动全球合作伙伴大会上连获两合作
  • 中国移动研究院与趋动科技等合作伙伴联合发布《面向智算的算力原生白皮书》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2129902.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vulnhub-RickdiculouslyEasy靶场(9个flag)

flag1 端口9090有一个flag flag2 13337端口 flag3 使用dirb进行扫描网站的80端口,发现一些敏感文件 访问80端口,没有发现有效信息 访问passwords目录 访问FLAG.txt 再返回访问passwords.html文件 查看页面源代码发现一个密码 flag4 之前扫描到了robo…

书接上文,介绍下Quartz Java体系结构

体系结构总结 JobDetail 我们创建一个实现 Job 接口的类,使用 JobBuilder 包装成 JobDetail,它可以携带 KV 的数据。 Trigger 定义任务的触发规律,Trigger,使用 TriggerBuilder 来构建。JobDetail 跟 Trigger 是 1:N 的关系。思…

智慧物流系统小程序的设计

管理员账户功能包括:系统首页,个人中心,车辆管理,商品管理,物流信息管理,论坛管理,公告信息管理 微信端账号功能包括:系统首页,商品,论坛,我的 …

磁盘无法访问:深度解析与高效数据恢复策略

在数字化时代,磁盘作为数据存储的核心载体,其稳定性和可访问性直接关系到用户数据的安全与完整性。然而,当遇到“磁盘无法访问”的突发状况时,用户往往会陷入焦虑与无助之中。本文将深入探讨磁盘无法访问的原因,并详细…

最全面IO流介绍

1.字符集介绍 标准ASCII字符集:使用1个字节存储一个字符,首尾是0,总可以表示128个字符。是美国信息交换标准代码,包含英文、符号等等。 GBK汉字编码字符集,包含2万多个汉字等字符,GBK中一个中文字符编码成…

(Java企业 / 公司项目)点赞业务系统设计-批量查询点赞状态(二)

接着上一篇文章来搞,批量查询点赞状态。这个接口提供给其他的微服务调用所以这里会用到FeignClient 直接上接口 1. 接口信息 这里是查询多个业务的点赞状态,因此请求参数自然是业务id的集合。由于是查询当前用戶的点赞状态,因此无需传递用戶信息。当前用户指的是登录用户 …

小琳AI课堂:LLaMA 3.1 开源大模型的全新里程碑

引言 大家好,这里是小琳AI课堂!今天我们要聊的是Meta最新发布的开源大模型LLaMA 3.1。这个版本在AI界掀起了不小的波澜,不仅在参数规模上有显著提升,还在多项性能上实现了突破。让我们一起来看看LLaMA 3.1带来的新变化和意义吧&a…

UEFI基础概念2——Handle和Protocol

一、Handle Handle Database是由Handle和Protocol组成。Handle(句柄)是一个或多个协议的集合,Protocol(协议)是由GUID命名的数据结构。 在平台初始化过程中,系统固件、UEFI兼容驱动程序和UEFI应用程序创建…

香港科技大学工学2025/2026年度硕士研究生(MSc)项目招生宣讲会

🔔香港科技大学工学院2025/2026年度硕士研究生(MSc)项目招生宣讲会 🕙时间:2024年9月25日(星期三)19:00 🏠地点:华南理工大学五山校区33号楼403室 🎆2024Ti…

重修设计模式-结构型-桥接模式

重修设计模式-结构型-桥接模式 将抽象和实现解耦,让它们可以独立变化 桥接模式(Bridge Pattern)的主要目的是解耦,创建一个抽象层来隔离接口与实现,让它们之间的依赖关系可以通过对象的组合来替代继承,从而…

运维学习————运维日志分析系统es——Elasticsearch

目录 一、简介 1、全文检索 1、数据分类 2、非结构化数据搜索方法 2、什么是 Elasticsearch 3、用途 4、基本概念 二、下载配置,搭建集群 集群规划 解压 配置环境变量 es配置 由于es启动不能直接使用root用户 启动 三、常用集群命令 一、简介 …

可提示 3D 分割研究里程碑!SAM2Point:SAM2加持泛化任意3D场景、任意提示!

郑重声明:本解读已获得论文作者的原创解读授权 文章链接:https://arxiv.org/pdf/2408.16768 在线demo: https://huggingface.co/spaces/ZiyuG/SAM2Point code链接:https://github.com/ZiyuGuo99/SAM2Point 亮点直击 无投影 3D 分割&#xff1…

DAY14信息打点-JS 架构框架识别泄漏提取API 接口枚举FUZZ 爬虫插件项目

本课意义: 1.如何从表现中的JS提取价值信息 2.如何从地址中FUZZ提取未知的JS文件 3.如何从JS开放框架WebPack进行测试 一、JS 前端架构-识别&分析 在JS中寻找更多的URL地址,在JS代码逻辑(加密算法、APIKey配置、验证逻辑)中进…

C语言——静态链表和动态链表

一、静态链表 创建链表中的一个节点,用struct来创建,其中包含两个部分:数据域和指针域。 创建三个结点,node1、node2、node3,分别赋值,初始化为NULL。接着就是将这些节点进行连接,组成链表。连…

干货分享|分享一款完全免费的PDF工具箱 PDF24

PDF 24介绍: PDF 24是一个全面的PDF工具包,旨在简化和优化PDF文件的处理和管理。它提供了广泛的功能和工具,包括创建、编辑、转换、合并、拆分、加密、解密、压缩、优化、签名、水印等。 主要特点:完全免费,轻量便捷,…

现货黄金避险属性是怎么来的?

众所周知,黄金是一种可以规避风险的品种,当地缘局势冲突、经济下行,甚至是出现军事摩擦等等情况,黄金都会受到避险情绪支撑而上涨。典型的例子,我们可以看俄乌冲突,还有中东的地缘局势等,这些事…

TS 常用类型

我们经常说TypeScript是JavaScript的一个超级 TypeScript 常用类型 TypeScript 是 JS 的超集,TS 提供了 JS 的所有功能,并且额外的增加了:类型系统 所有的 JS 代码都是 TS 代码 JS 有类型(比如,number/string 等&…

OPENAIGC开发者大赛企业组AI黑马奖 | 包你面-AI面试助手

在第二届拯救者杯OPENAIGC开发者大赛中,涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到,我们特意开设了优秀作品报道专栏,旨在展示其独特之处和开发者的精彩故事。 无论您是技术专家还是爱好者,希望能带给您…

Linux基础知识之用户和组

Linux基础知识之用户和组 01 1.什么是用户 用户账户为不同人员和运行的程序之间提供安全边界 用户使用 username 进行标识,操作系统为其分配唯一标识号(UID),用户可能含有密码 系统中的每个程序都以一个特定用户运行&#xff…

上/下三角矩阵的压缩存储

1.给自己出题:自己动手创造,画一个5行5列的下三角矩阵 2.画图:按“行优先”压缩存储上述矩阵,画出一维数组的样子 3.简答:写出元素 i,j 与 数组下标之间的对应关系 4.画图:按“列优先”压缩存储上述矩阵…