算力不竭如江海,天翼云“息壤”如何助力千行百业算力智能调度?

news2024/10/5 21:15:36

科技云报道原创。

数字时代下,算力已成为新型生产力,并朝着多元泛在、安全可靠、绿色低碳的方向演进。以算力为核心的数字信息基础设施,是国家战略性布局的关键组成部分,也成为数字经济时代的“大国重器”。

在这里插入图片描述

作为云服务国家队,天翼云在科技创新道路上,不断加强关键核心技术自主研发,在算力技术方面不断取得突破,将最新研发成果惠及千行百业,“息壤”就是其中代表。

在第六届数字中国建设峰会上,天翼云算力分发网络平台“息壤”荣获“十大硬核科技”奖项。同时,在第三届国有企业数字化转型论坛上,“息壤”还入选国务院国资委发布的“十项国有企业数字技术成果”。

算力网络建设并非一朝一夕之功,其中涉及多个技术领域,在现有技术和商业模式上都面临全新挑战。

针对这些问题,在第六届数字中国建设峰会天翼云举办的《大咖面对面》栏目中,中国信通院云大所云计算部副主任苏越、天翼云智能边缘事业部副总经理鄢智勇接受科技云报到的采访,分享了各自观点。

科技云报道:如何像用电一样使用算力?

“东数西算”开启 中国算力时代

算力作为数字经济时代新的生产力,已深度融入经济社会的方方面面,各类算力应用的新模式、新业态正加速涌现。2021年5月,“东数西算”国家战略正式启动,成为我国的“算力经济”时代开启的标志。

“东数西算”的本质是改变了数据在本地的存储、备份、加工、处理、分析等行为,这也对算力平台在连接、调度、运行等方面提出了新的挑战。

首先,需要清楚如何管理和统筹算力设施原有节点与新增节点衔接联动的关系。除了“东数西算”目前要建设的节点集群外,原来各个地方已经有大量的数据中心、超算中心和智算中心,如何统筹接入?以及新节点建设后,如何管理和统筹新旧节点之间联动关系?

其次,未来“东数西算”必然要面临很多类型的数据处理需求,以及多样化的业务需求,所以如何保证东数和西算形成有效的供需匹配成为一个重要难题。

第三,“东数西算”的算力网络统筹调度和运行机制问题。“东数西算”的传输网络首先要满足低时延、高可靠、大带宽等要求,还得面临算力跨区域、跨层级连接的挑战。

虽然我国算力规模增长飞快,但算力供给与调度的统筹能力较为薄弱。如何灵活地优化算力网络的云网边需求,最终实现全国范围内的全网实时调度,是“东数西算”进程中最为关键的问题之一。

对于如何更好构建高效的算力网络,苏越认为,既要建设全国“一盘棋”的大算力网络,还要聚集到涵盖核心技术的小算力网络。

大算力网络涉及跨城市、跨地域、跨集群的算力资源互联互通,比如全国一体化大数据中心、“东数西算”工程等,是算力网络顶层设计中的“基石”部分。

小算力网络包括算力并网、编排、注册、调度、交易等在内的全链条,其中涉及到从基础层到应用层的创新技术,比如底层的CPU、GPU、DPU技术,上层的交易、度量、计量计费等技术,都是整个算力网络传输过程中需要的核心技术。

“算”为核“网”为根 助力中国算力跑出“加速度”

“东数西算”背景下,广泛连接的算力网络将成为数字经济的新型基础设施。经过一年的快速发展,“以网强算,以算促网”的产业共识深入人心,如今提及的“算力网络”不再是狭义上的计算能力,而是集“算力、存力、运力”于一体的新型生产力。

鄢智勇认为,未来算力网络会像今天的电力网一样,用户可以随时随地访问任意的算力资源。鄢智勇形象地将算力网络与电力网络进行了对比,在电力网络中,电力调度是重要模块之一,它能够将来自火电、水电、风电、核电等不同来源、不同电压的电力,调度成为人们日常使用的通用电力。

而算力网络同样可以将边缘、超算、智算等不同算力进行统一调度,最终能够让人们自由地使用这些算力。

这对于已经在云网融合领域耕耘七年的中国电信而言,无疑是一次绝佳的机会。

从技术架构上看,“东数西算”天然是云网融合的,算力的智慧化调度在某种程度上,比算力资源的建设更加重要,而对于天翼云来说,这种能力是一种天然的基因。

在算力发展的十年中,天翼云从1.0演进到4.0,探索出一条核心技术自主创新之路。

2012年,中国电信宣布成立云计算分公司,正式进军云计算领域,成为国内首家涉足云计算服务的运营商。

2017年,中国电信首次明确“2+31+X”云网融合战略布局,天翼云成为唯一一家在全国31省实现一省一池部署的云服务商,真正将云服务变成像水电一样的基础资源。

2020年,中国电信发布“云改数转”战略,通过内蒙古、贵州两个服务全球的航母级数据中心,京津冀、长三角、粤港澳、陕川渝四个重点区域节点,31个省份均有布局的数据中心,再加上广泛分布的X个边缘节点,形成了2+4+31+X的全国算力布局 。

2021年,天翼云发布4.0分布式云,实现了一云多态、一云多芯、一张云网、一致架构、统一调度、统一运维,完成了产品与技术的双升级,算力、存储、网络均提升。

同时,天翼云在“2+4+31+X”资源布局基础上全面推进“千城万池”战略,加快算力全国部署。

在云网融合已成为数字信息基础设施核心特征的当下,天翼云打造了越来越强大的云网融合基础设施能力底座。

“息壤”加速算力筑基 释放数字生产力

当然,算力服务提供的不仅仅是单台设备的计算能力,还包括集群的整体有效协同能力。因此,网络化算力需要与之匹配的中枢调度决策系统,为新型信息基础设施对外一体化服务提供能力支撑。

凭借强大的云网能力,天翼云编织起一张数字时代的“算力网”,700多个数据中心、48.7万架互联网数据中心机架,通过将“计算+连接”的深度融合,打造出一条算力调度的“高速路网”。

按照超广覆盖、超高可靠、超低时延、超大速率、云网一体的标准要求,天翼云早在2022年5月17日就推出了自研的算力分发网络平台——“息壤”,以“随愿算网”的方式,对边缘云、中心云、第三方资源等全网算力进行统一管理和调度。

在上古神话中,息壤是可以自己生长、永不减耗的土壤。《海内经》有曰:“息壤者,言土自长息无限,故可以塞洪水也。”

天翼云将算力分发网络平台取名“息壤”,寓意无论业务对算力有多少需求,息壤都可以规划出满足需求的算力资源,并且通过智能调度,实现业务性能和成本的最优。

从定位上看,“息壤”好比是一个算力调度的枢纽,能够在全国范围内实现每分钟数万次、每天上千万次的算力统筹和调度。

鄢智勇表示,要实现算力调度首先要有算力,目前中国电信整体算力规模已达到3.8Eflops(每秒380亿亿次浮点运算)。其次,算力调度需要有高速传输网络,中国电信已经构建起连接东西部的高速光纤网络,现在还在试点400G、800G等高速传输,这些都是“东数西算”的物理基础。

据鄢智勇介绍,天翼云于去年推出“息壤”算力分发网络平台后,在2022年度央企“十大超级工程”评选中,“息壤”与“中国空间站全面建造完成”“西气东输四线工程全面开工”等重点项目并列其中,其极大降低开发运营运维成本,给用户带来更好的体验。

具体而言,“息壤”实现对全网资源的统一管理和使用,包括中心云、边缘云、第三方云、自建IDC、客户现场节点等,通过资源管理平台实现算力感知、算力注册、算力映射、算力建模等能力。

通过算力调度引擎灵活的自定义调度策略能力,满足不同业务需求,如云渲染、跨云调度、性能压测、混合云AI计算等多种应用场景,通过算力调度可视化能力,实现资源量、使用率、数据流调度过程可视化。

同时,“息壤”能够提供多样化、差异化的算力产品形态,满足从中心到边缘的多样化算力场景,产品形态包括算力调度引擎CPSE、边缘容器集群ECK、Serverless边缘容器ESK、批量计算BE、算力网络交易平台等,以及结合自研的算力调度引擎,实现对算力资源的统一管理、统一编排、智能调度和全局算力资源优化。

在国家大力推动“东数西算”的背景下,“息壤”能够把东部需要进行的机器学习、数据推理、智能计算等AI训练和大数据推理的工作放到西部,自动配置和调度相应算力;把东部对时延不敏感的、不活跃的、需存档的海量数据,放在西部存储等等。

通过“息壤”,“东数西训”“东数西备”“东数西渲”等构想正在成为现实。

对于“息壤”的实际表现,苏越表示,“息壤”经过中国信通院70多个测试项的严格评审,以满分顺利通过“面向资源的算力调度技术能力要求”评估,天翼云也成为业内首批通过该项评估的云服务商。

对于未来算力网络将是怎样的形态,苏越从行业角度希望激活泛在的所有资源,通过重塑产业发展模式,变革IT服务的交付方式方法。鄢智勇则站在用户层面,更希望使用算力就像使用电力一样方便,即插即用,要从可用、能用,走向易用、好用、实用。

结语

从“云网融合”向“算力网络”迈进,对电信运营商来说,不亚于一次新的长征。以天翼云为代表的云服务商,在关键技术、产业链完整性、能力模块、商业模式、产业生态等方面,实现整体突破和升级,为我国数字经济高质量发展提供更坚实的“算力底座”,全面激发数字中国的创新活力与增长韧性。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/612478.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

报表生成器FastReport .Net教程:“Text“对象、文本编辑

FastReport .Net是一款全功能的Windows Forms、ASP.NET和MVC报表分析解决方案,使用FastReport .NET可以创建独立于应用程序的.NET报表,同时FastReport .Net支持中文、英语等14种语言,可以让你的产品保证真正的国际性。 FastReport.NET官方版…

es elasticsearch 十四 各种机制 评分机制 正序索引 解决跳跃结果问题 解决耗时过长问题 解决相同属性值都到一个地方

目录 评分机制 机制 查看评分实现如何算出来的explaintrue 分析能否被搜索到 Doc value 正排序索引 Query phase Fetch phase Preference 问题 解决跳跃结果问题 Timeout 到达时间直接返回,解决耗时过长问题 Routing 数据准确分配到某地,解决相…

这才叫软件测试工程师,你那最多是混口饭吃罢了....

前些天和大学室友小聚了一下,喝酒喝大发了,谈天谈地谈人生理想,也谈到了我们各自的发展,感触颇多。曾经找工作我迷茫过、徘徊不,毕业那会我屡屡面试失败,处处碰壁;工作两年后我一度想要升职加薪…

006+limou+C语言“堆的实现”与“树的相关概念”

0.前言 这里是limou3434的一篇个人博文,感兴趣可以看看我的其他内容。本次我给您带来的是树的相关只是,并且把堆这一数据结构做了实现,后面还有大量的oj题目。但是树重点也就在这十多道oj题目中,您可以尝试着自己做一下&#xff…

我的创作纪念日|写在CSDN创作第512天

机缘 今天无意中发现CSDN后台给我发送私信,才发觉原来我的第一篇博客更新已经过去512天了,512天一晃而过居然还有点恍然。 作为一名网络专业的在校大学生,最初开始查找相关的资料其实更习惯于从外站进行查找,却总是在不经意中进入…

人事管理项目-前端实现

人事管理项目-前端实现 引入Element和Axios开发Login页面配置路由配置请求转发启动前端项目 引入Element和Axios 前端UI使用Element,网络请求则使用Axios,因此首先安装Element和Axios依赖,代码如下: 依赖添加成功后,接…

N-propargyloxycarbonyl-L-lysine,1215204-46-8,是一种基于赖氨酸的非天然氨基酸 (UAA)

产品描述: N-ε-propargyloxycarbonyl-L-lysine (H-L-Lys(Poc)-OH) 是一种基于赖氨酸的非天然氨基酸 (UAA)。 广泛用于多种生物体中荧光探针的生物偶联。 N- ε- Propargyloxycarbonyl-L-lysine (H-L-Lys (Poc) - OH) is a non natural amino acid (UAA) based on …

Kotlin Channel系列(一)之读懂Channel每一行源码

文章目录 有话说概述初识ChannelChannel种类Channel五大金刚SendReceiveClosedQueueBuffer Channel的行为Channel源码分析发送数据大动脉接收数据大动脉父类默认实现方式(RendezvousChannel)发送流程send()函数onSend()函数 接收流程receiveCatching()函数onReceiveCatching()函…

基于图像处理的圆检测与深度学习

基于图像处理的圆检测与深度学习 摘 要一、 绪论二 、图像预处理2.1 滤波算法2.2 边缘检测 三 、圆识别与定位算法3.2 定位算法3.2.1 迭代算法 4.1 数据处理 五、深度学习介绍:参考文献 摘 要 本文主要论述在图像处理的的基础上,为了克服图像背景中的亮…

SpringBootWeb案例-2(下)

3. 修改员工 需求:修改员工信息 在进行修改员工信息的时候,我们首先先要根据员工的ID查询员工的信息用于页面回显展示,然后用户修改员工数据之后,点击保存按钮,就可以将修改的数据提交到服务端,保存到数据…

面试专题:java虚拟机(2)

8.垃圾收集有哪些算法,各自的特点? 标记清除 直接将要回收的对象标记,发送gc的时候直接回收:特点回收特别快,但是回收以后会造成 很多不连续的内存空间,因此适合在老年代进行回收,CMS(current…

Linux--ServerProgramming--(4)详解 I/O复用

1. I/O 复用功能 I/O 复用能同时监听多个文件描述符。 I/O 复用本身是阻塞的。 当有多个文件描述符同时就绪时:若不采取额外措施,程序就只能按顺序一次处理其中的每一个文件描述符,这使得服务器程序看起来是串行工作的。若要实现并发&#…

ChatGPT市场营销指南震撼出炉,你错过了?!

ChatGPT是一种基于AI技术的语言模型,它可以与用户进行对话和交互。它被广泛应用于各个领域,包括市场营销。作为一名市场营销人员,您可以使用ChatGPT来获得创意、解决问题和生成内容。 下面是190个ChatGPT提示,可帮助营销人员更好…

oracle自定义函数 for in loop示例

1、新建type,就是返回结果集有什么,这里就写什么(相当于表的字段) CREATE OR REPLACE TYPE "TYPE_NQ_FORM_STATISTICS" as object (recordid varchar2(500),form_name varchar2(200),sortone varchar2(100),sorttwo …

华为od机试题目回顾

今天去做了华为机试&#xff0c;两道一星题&#xff0c;一道二星题。 一星题 1&#xff1a; 题目主要大意&#xff1a; 输入一串字符串&#xff0c;里面可能包含有(x,y)的坐标。 0<x<1000&#xff0c;0<y<1000&#xff0c;类似(01,1)、(1,01)、(0,100)的都是非法坐…

Java开发手册中为什么不建议在for循环中使用“+“进行字符串操作

场景 java开发手册中对于循环体中进行字符串的拼接要求如下&#xff1a; 【推荐】循环体内&#xff0c;字符串的连接方式&#xff0c;使用 StringBuilder 的 append 方法进行扩展。 说明&#xff1a;下例中&#xff0c;反编译出的字节码文件显示每次循环都会 new 出一个 Str…

【Linux】-自动化构建工具(make/makefile)

作者&#xff1a;小树苗渴望变成参天大树 作者宣言&#xff1a;认真写好每一篇博客 作者gitee:gitee 如 果 你 喜 欢 作 者 的 文 章 &#xff0c;就 给 作 者 点 点 关 注 吧&#xff01; 文章目录 前言 前言 今天我们来讲讲再Linux中开发必备的一项技能&#xff0c;没有这个…

【OpenMMLab AI实战营第二期】深度学习预训练与MMPretrain

深度学习预训练与MMPretrain MMPreTrain 算法库介绍 MMPretrain 是一个全新升级的预训练开源算法框架&#xff0c;旨在提供各种强大的预训练主干网络&#xff0c; 并支持了不同的预训练策略。MMPretrain 源自著名的开源项目 MMClassification 和 MMSelfSup&#xff0c;并开发…

项目干系人管理实用方法,让你的项目顺风顺水

项目管理中的干系人是每个项目的一个重要方面&#xff0c;因为项目的结果取决于他们。然而&#xff0c;管理各种各样的干系人的艺术很有挑战性。在项目管理中根本没有出错的余地&#xff0c;本文将带你了解项目干系人以及如何管理他们以促进项目的全面成功。 谁是项目管理的干…

第3章:SpringMVC获取请求参数

一、SpringMVC获取请求参数 1.通过servletAPI获取 将HttpServletRequest作为控制器方法的形参&#xff0c;此时HttpServletRequest类型的参数表示封装了当前请求的请求报文的对象 <a th:href"{/testServletAPI(usernameadmin,password123456)}">测试API<…