拆解“算力偏科”难题,智算中心下一步向何处去?

news2024/7/6 19:53:37

9a0ecb6552671e4d96f6d0b2c83957c9.jpeg

十年前,英国《经济学人》曾用工业用电量为主的指标来评估中国GDP,而现在算力已经成为新的指标。似乎每个企业、每个城市都在努力增加算力。

一位读者不无困惑地留言,大家都说自己算力有多少FLOPS,能支撑这个大模型、那个大数据,是不是数字越大就算力越强呢?

还真不是。

衡量算力水平,除了运算次数,还要看算力精度,也就是能够支持的数据精度和运算复杂度有多高。

9692e8583b5ee2e79b015d99aac721dc.png

如果说运算次数(FLPOS)代表的是内力值,那么算力精度就像是“身法”,决定了能否用对内力、用好内力。武林对决,有人拿屠龙刀一通乱砍,令狐冲靠独孤九剑剑法一击必中,你觉得谁水平高?

不同计算任务,对算力需求不尽相同,需要恰当的“身法”,来发挥算力的价值。

具体来说,根据数据类型的不同,适配的算力精度也有所区别:

比如科学计算,天气预报、运算化学、分子模型、天体物理模拟等,数据精度要求高,需要双精度算力(64位,FP64),是由超级计算机提供的一种通用算力。

797ebf3a05bfc2197d3f514937cfcca0.png

AI模型训练,自动驾驶、智慧城市、AIGC等业务,需要学习大量数据,训练出一个复杂的深度学习模型,而处理大规模浮点型数据,更适合用单精度算力(32位,FP32)、半精度算力(16位,FP16)。近年来,预训练大模型爆发,涌现出了DALLE、ChatGPT、紫东太初等一波波大模型,参数动辄达到千亿万亿,大模型的高效训练需要用到大量的单精度算力。

训练好并部署的模型,实际应用时只需要根据输入的数据,推理出各种结论,比如人脸识别、车牌识别、语音识别等,这个AI推理的过程,处理的是整数型数据,更适用于整型算力(INT8)。

53b202ac8617116731b9f226f735ab41.png

那么问题来了,一般来说,某一个区域内,既有高精尖科研、智慧城市、自动驾驶这类高性能计算,带来了通用算力的需求;又要有AI模型训练、AI应用推理等来支撑产业数转智改,对专用算力的需求也很高。

如果区域内算力配置不够多样化,少了某一种算力,相当于等用户上了战场对敌时,才发现无招可用或事倍功半,必然会限制当地数字化的发展。

因此,各地在进行智算中心建设时,从长远来看,就必须考虑算力的多样化、普适性。

但现实情况是,很多地方的智算中心,处于“先批快建”、各自为战的阶段,由于AI产业/科学计算/产业数字化等迅猛发展,迫切需要补足某种专用算力,应对算力焦渴,缺乏通用算力的统筹规划。

随着东数西算工程、数字中国等一系列措施的推进,进入“十四五”发展新时期,专用算力的通用化难题,就成为掣肘地方数字经济发展的当务之急。

502010898e4beeb022c697f3251d6e27.png

前不久发布的《智能计算中心2.0时代展望报告》中也强调,当前个别地区选择的算力配置出现一定“偏科”现象,只能满足一部分细分场景的需求,不能兼顾多产业、多领域对融合算力的需求。需要推动通用算力、专用算力融合,驱动应用走向纵深。

对于高校、科研机构、企业、政府等各类算力用户来说,算力融合究竟能带来哪些利好?

破解“算力偏科”,

算力融合价值几何?

87a1fe375cdaae48e4e1a01f21131b34.png

一言以蔽之,算力融合,意味着用户可以对不同算力资源随取随用,无论是办公数字化需要的通用算力,还是AI应用需要的专用算力,抑或是气象预报、生物预测等需要的高性能算力,都可以融会贯通、博采众长,支撑自身业务的发展,成为一个算力“通才”。

从这个角度看,通用算力、专用算力的融合,会带来三重明显的价值:

一是数字经济的可持续。数字经济已经成为各个区域发展的主调,其中包含的算力应用场景是非常广泛的,根据应用场景来进行算力部署,更快地建立优势。比如某省会城市希望打造人工智能高地,同时高校牵头建立遥感产业集群,专用算力、通用算力相融合,能支撑更加丰富的应用场景,为当地数字经济的长期可持续发展提供算力保障。

b602da4a982528d4f01e893af5ff30dc.png

二是综合成本的下降。算力基础设施的建设成本极高,在前期规划时做好多种算力的配置,能使基础设施的利用率提升,既保证算力充足,同时精益地满足各类任务所需,从而提高算力的综合效益,降低算力的使用成本,让区域内的算力更加普惠、更多用户受益。

三是多元供应的可靠性。算力融合意味着需要不同计算单元、多种架构并存、多种软硬件兼容,新型算力基础设施走向开放、多元、兼容,相当于“不把鸡蛋放在一个篮子里”,能够降低供应链的不确定风险,长期来看能够让算力更加安全可靠。

算力融合,相当于一个武林高手,无论华山剑法、少林功夫、武当太极,各种“身法”都能信手拈来,那么面对任一种计算任务的挑战,自然可以游刃有余。

f82b5ca39e45e5fbbbdfcb1e0866598b.png

纵横2.0阶段:数字江湖儿女

需要怎样的算力底座

即将到来的数字经济浪潮中,每个人都要化身江湖儿女、弄潮时代,这时候,一个通用性的算力底座,就如同通晓全门派武功身法的“神助攻”,可以提供全精度多元算力,让用户更从容地应对业务变化和挑战。

3336f2f63e64b219b5d8e5e7e8f493ac.png

国家工业信息安全发展研究中心在《报告》中提出,智算中心在2017-2021年高速扩张的1.0阶段,主要提供的是专用性的算力。从2022年开始进入2.0阶段,需要利用CPU与GPU等加速芯片的异构重合,来实现高精度通用算力和低精度专用算力的融合供应。

由此可见,智算中心的下一步重点,就是向通用算力底座发展。而建设这样一个通用算力底座,有“一横一纵“两个基本要求:

一横:多元算力需要多元架构,智算中心必须“横向”兼容。

智算中心1.0阶段,采用的是垂直一体的烟囱式的方案,针对性地满足高性能计算、人工智能、大数据计算等不同的应用负载,通用性和兼容性比较低。多样化的通用算力底座,要实现不同架构的芯片平台、不同场上的算法模型以及数据集的横向兼容,让用户可以根据业务场景和计算任务选择最适合的算力方案。

b9bd8df9a04ee5f56767b5a1bb4dec68.png

一纵:通用算力需要软硬协同,智算中心必须“纵向”耦合。

不同技术路线的芯片、算法、模型、应用等要素,需要产业链上下游的打通,解决软硬件兼容性的问题,芯片制造厂、中端厂商和软件开发商,通过软件优化、架构整合和软硬件协同,来提升计算的整体性能。

打破垂直一体模式,走向“横向”兼容“纵向”耦合,成为智算中心2.0时代的关键,从而支撑千行百业在数字时代纵横驰骋。

见招拆招:

智算中心的未来挑战

1ce28ae06a0e4e58e23e9e752828e35c.png

智算中心1.0阶段快速扩张,统计数据显示,目前中国已经有超过30个城市在建设或提出建设智算中心。未来数字经济中80%的场景和算力资源要由智算中心进行承载。这是一个巨大的机遇,但机会越大,所应该承担的责任也就越大。

如前所说,智算中心在2.0阶段必须走向“横向”兼容“纵向”耦合的目标,饭要一口口吃,算力融合也要一步步走,把每一个环节做好,见招拆招。

具体来说,智算中心的算力融合,要从四个核心环节来做功,分别是:算力生产、算力聚合、算力调度、算力释放。

3bfb3d72b03cdcea9b7fd07307bf9124.png

算力生产方面,要具备多样化算力的供给能力。为了实现不同架构芯片的多元化融合,智算中心的体系结构,已经从同构计算走向异构计算,国内外的科技企业如谷歌、英特尔、阿里、百度,都在进行异构计算的研发。《智能计算中心2.0时代展望报告》中,曙光5A级智算中心也凭借全算力精度覆盖、多样化算力供应,成为产业内示范样例。

算力聚合方面,要推动通用算力和专用算力的融合。目前来看,业界各个厂家的智算中心建设理念是比较类似,都在强调融合发展。

算力调度方面,融合的算力如何灵活、精益地为各行各业所取用呢?这就需要对多样算力进行统一的调度和运营。宏观来看,在东数西算工程的推动下,全国算力一体化网络体系已经初步形成,为智算中心的算力调度建立了基础。微观来看,智算中心的建设者/参与者也开始建设算力运营平台,用精细化、智能化的手段来提高算力运营调度水平,比如曙光智算运营的全国一体化算力服务平台等。

算力释放方面,算力融合的本质目的是让千行百业用好算力、用对算力,所以多样化算力如何更灵活的释放到数字产业当中去,提供算力服务的应用,是智算中心在2.0阶段的重中之重。

3b33e20a3ef540f7b3ff922e2b619698.png

从产到用、见招拆招,智算中心2.0将是真正意义上的公共算力基础设施,把澎湃的内力与适配的身法,交给千行百业。

一个全新的数字视界,已经向各行各业的侠士们广发英雄帖。广阔的产业机会,等待着大家去争取,去赢得自己在这个时代的勋章。

化多元化算力为己用,打开多元化的未来,智算中心2.0阶段,一定会有更多传奇的人和事。

c7a2aac6d0761264da1b36889fc84f9d.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/170142.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

九龙证券|北上资金连续10日“跑步入场”,1月净流入已逼近2022全年

1月以来,北上资金净流入规划已接近2022全年。 半导体概念股集体大涨 1月17日,沪指缩量小幅调整,收跌0.1%;深成指涨0.13%,创业板指收涨0.24%,科创50涨逾1%。 板块方面,半导体及元件板块继续走强…

基于.NetCore+React单点登录系统

更多开源项目请查看: 一个专注推荐.Net开源项目的榜单 对于有多个应用系统的企业来说,每一个应用系统都有自己的用户体系,这就造成用户在切换不同应用系统时,就要多次输入账号密码,导致体验非常不好,也造成…

【vue系列-07】vue脚手架的基本使用

深入理解脚手架的使用一,vue脚手架的基本使用1,vue-cli安装2,vue项目中的文件组成3,render配置项4,ref属性5,props属性6,mixin属性7,scope属性一,vue脚手架的基本使用 在…

vsftpd使用指北

vsftpd使用指北 文章目录vsftpd使用指北1.安装vsftpd2.登录3.切换本地路径下载命令:get用于下载单个文件:mget用于批量下载:上传命令:FilezillaReferencevsftpd 是“very secure FTP daemon”的缩写,是一个完全免费的、…

Vue组件化

1、Vue组件化开发思想 1.1、认识组件化开发 组件化也是类似的思想: 如果我们将一个页面中所有的处理逻辑全部放在一起,处理起来就会变得非常复杂,而且不利于后续的管理以及扩展;但如果,我们讲一个页面拆分成一个个小…

【算法竞赛学习】csoj:寒假第一场

文章目录前言新年礼物灯笼展摩天楼神抽新年大礼前言 由于本人菜鸡,所以大多都是使用出题人的代码和思路 如有侵权,麻烦联系up删帖,本贴仅作为笔记记录 本篇大多是在吹水,技术方面可以直接看代码注释,思路在水文中&am…

Linux下的进程通信之管道通信

目录 进程间通信的背景 为什么要进行进程间通信? 管道 什么是管道? 匿名管道 匿名管道原理 如何创建匿名管道? 命名管道 进程间通信的背景 进程间通信就是在不同的进程之间进行的数据的交换,进程间通信又称为Interproces…

Python SciPy 空间数据

SciPy 空间数据空间数据又称几何数据,它用来表示物体的位置、形态、大小分布等各方面的信息,比如坐标上的点。SciPy 通过 scipy.spatial 模块处理空间数据,比如判断一个点是否在边界内、计算给定点周围距离最近点以及给定距离内的所有点。三角…

【学Vue就跟玩一样】组件的自定义事件和全局事件总线

一,自定义事件1.自定义事件是什么自定义事件一种组件间通信的方式,适用于 子组件 ——> 父组件传输数据等2.要在什么地方使用若App是父组件,School是子组件,School想给App传数据,那么就要在App中给School绑定自定义…

使用k8s实现灰度发布,金丝雀,蓝绿发布

介绍#Ingress-Nginx 是一个K8S ingress工具,支持配置 Ingress Annotations 来实现不同场景下的灰度发布和测试。 Nginx Annotations 支持以下 4 种 Canary 规则:nginx.ingress.kubernetes.io/canary-by-header:基于 Request Header 的流量切分…

ThreadLocal底层原理

ThreadLocal底层原理一:什么是ThreadLocal二:理解ThreadLocal中的内存泄漏问题三:ThreadLocalMap中的Hash冲突处理四:可以被继承的ThreadLocal——InheritableThreadLocal一:什么是ThreadLocal ThreadLocal是一个创建…

【电脑故障】PIN无效,显示无用户配置文件

【电脑故障】PIN无效。显示无用户配置文件1. 电脑情况:2. 解决方法(个人):2.1 解决登录问题2.2 解决PIN可用设置1. 电脑情况: 电脑品牌:联想小新pro13操作系统:win10 2. 解决方法(…

C++初阶--stack和queue

目录 stack介绍 stack的使用 stack的模拟实现 queue的介绍 queue的使用 queue的模拟实现 deque priority_queue priority_queue的使用 仿函数 priority_queue的模拟实现 stack介绍: stack是一种容器适配器,专门用在具有后进先出操作的上下文环…

Nginx使用(三)配置实例

一、反向代理示例一效果:打开浏览器,在浏览器地址栏输入地址www.123.com,跳转到linux系统tomcat主页面中具体实现:(1) 准备:安装nginx在linux系统安装tomcat,使用默认端口8080解压之后进入到tom…

一篇文章读懂mybatis-plus原理和CRUD接口

Myabtis-Plus配置 MybatisPlus官网 官方文档上有详细的spring boot配置mybatis-plus的教程&#xff0c;此处就不在详细赘述。 mybatis-plus是基于spring完成的只能再spring相关应用上实现。 引入父工程 注意mybatis-plus和spring boot的版本匹配不然会出现 推荐版本 <pa…

自媒体神器 Previs Shot 使用指南

Previs Shot 是一款影视创作的项目管理工具&#xff0c;更高效的方式开始您的影视创作历程。分镜表分镜表可高效绘制画面、编写景别、运镜、内容、台词等&#xff0c;甚至可以填写摄影器材、灯光等信息。分镜结构场景&#xff1a;电影里比如过生日、开party都是不同的场景&…

【程序员陪你过大年】html+css+js 实现动态新年烟花特效及服务器部署

前言 不知不觉又到了年底&#xff0c;这一年是值得庆贺的一年&#xff0c;疫情过去&#xff0c;经济好转。我们急需在春节这个特殊的日志释放下自己的情绪。但是大部分地区都不让放炮&#xff0c;于是乎我为大家带来一套十分炫酷应景的春节烟花动画代码实现。效果如下图所示 :…

【如何在Linux下使用Git命令在Gitee上创建项目】

目录 1 创建仓库 2 Git提交三板斧 2.1 add 2.2 commit 2.3 push 1 创建仓库 首先我们可以使用命令&#xff1a;git --version 来查看是否下在了git,没有下载的可以使用下面的命令安装&#xff1a; sudo yum install -y git 成功后就可以查看了&#xff1a; [grmVM-8-12-…

深度学习目标检测_YOLOV3超详细解读

文章目录YOLO V3概述网络结构backbone&#xff1a;darknet-53特征细化&#xff08;多scale&#xff09;残差连接残差网络的发家史先验框softmax改进YOLO V3概述 yolo v3论文地址&#xff1a;https://pjreddie.com/media/files/papers/YOLOv3.pdf 先说说yolo v3的效果&#xff…

字节青训营Go语言学习第二天-Go语言进阶与依赖管理

文章目录并行VS并发GoroutineCSPChannel并发安全LockWithGroupGo依赖管理GoPathGo VendorGo Module依赖分发-回源并行VS并发 并发指的是多线程在一个CPU上运行&#xff0c;而并行是直利用多核来实现多线程。 内核是系统里比较昂贵的系统资源&#xff0c;它的创建、切换停止都是…