IO500榜单最新出炉,HPC性能天花板提升15倍

news2024/11/17 21:20:25

近日,存储圈又有炸裂新消息。

高性能计算(HPC)领域最具影响力的IO500最新一期榜单公布,以华为OceanStor Pacific分布式存储为核心底座的Cheeloo-1系统表现一骑绝尘,在最重要的10节点榜单中以创纪录的13万总得分位列第一,性能是上届冠军的15倍之多。

无疑,这份超高的存储性能成绩具有里程碑意义:不仅体现出华为OceanStor Pacific分布式存储强大的产品力,更标志着分布式存储在高性能计算领域的重要性愈发突出,甚至加速拉开了高性能计算向HPDA(High Performance Data Analytics,高性能数据分析)演进的序幕。

 

HPDA是HPC新的制高点

数据正在深刻影响高性能计算领域。

众所周知,随着数字经济高速发展,数据已是最重要的生产要素之一,其对于各行各业的影响日渐凸显,高性能计算领域也不例外。过去,能源勘探、基因测序、气象预测、类脑研究、灾害模拟等是典型的HPC场景,侧重数值计算,计算是绝对主角;如今,HPC场景则走向HPC+AI+大数据融合,“数据要素”扮演的角色愈发引人瞩目,成为科学研究、自动驾驶等诸多HPC场景的新型驱动力。

例如,华西医院的精准医疗研究,其一台基因测序仪一年产生的原始数据和膨胀数据高达8.5PB,研究人员在海量基因数据中进行多组学数据分析,首次将人类全基因组分析推进到了分钟级时代,对精准医疗发展意义重大;在气象预测方面,预测模型加入更多维度的海量数据,意味着气象预测可以更加快速和精准,对于防灾、生产等有着明显指导作用;在如火如荼的自动驾驶场景,模拟和验证阶段的数据量高达数百PB,汽车厂商们利用海量数据来训练更高级的自动驾驶方案……

人们依靠数据密集型应用,进行海量数据实时分析,并寻找相关性,从而获得新发现。HPDA的发展对于国民经济有着重要的价值与意义,同时也给时代提出了更为严苛的诉求,数据密集型应用具有不可重复性、高度不确定性、高维、计算高度复杂等特性,且众多HPC系统与应用从“数值计算型”向“数据密集型”演进,这对互联带宽和存储IO响应有着极高的要求。

对于HPC而言,应用类型的转变标志着过去重计算、轻存储的“偏科生”建设模式,其瓶颈日益突出,加速向HPDA(High Performance Data Analytics,高性能数据分析)平台演进是必然趋势。这也意味着,注重数据存储建设、关注数据价值释放将成为HPC的长期任务。

毫无疑问,业界早已意识到数据存储对于HPC发展的重要性。去年,CCF高性能计算专家委员会、信通院等单位联合推出的《高性能计算系统性能评价白皮书》首次提出的综合评价体系中,就将数据存储多个指标纳入其中,提倡算力、存力平衡设计与建设的模式。

此外,从2017年11月开始,全球顶级高性能计算会议都会发布IO500榜单,与TOP500榜单并列,将数据存储与计算并列为HPC重要的评估指标。事实上,从近年来IO500榜单的变化,我们明显感受到HPDA对于分布式存储带来的变革性影响。

从IO500读懂分布式存储趋势

毫无疑问,高性能计算是分布式存储的高价值应用场景。在传统HPC向HPDA演进的过程中,分布式存储扮演着关键角色,支撑起海量数据高性能并行访问与计算的高吞吐、高IOPS、混合负载等需求。

如何评价分布式存储的性能优劣?IO500榜单在2017年11月横空出世,凭借其全面、严格和科学的标准化性能测试套件,以及贴近用户实际环境和使用状况的测试配置与方法,IO500已经成为HPC领域针对存储性能的国际权威排行榜,更是分布式存储发展趋势的风向标。

IO500每半年发布一次,包括 “总榜单”和“10节点榜单”两类,其中“10节点榜单”非常贴近用户真实的使用情况,其测试结果也非常便于用户做横向对比,对用户的参考价值极高。

 

经过将近6年的持续发展与完善,IO500更像是分布式存储产品先进技术的“试验场”和产品力的“比武擂台”。在HPC场景下,对于架构、性能、带宽、容量、延迟等持续增加的需求,各大用户和厂商们不断摸索、构建出新的分布式存储产品方案,在你追我赶中提升了分布式存储的特性,切实推动了分布式存储的发展。

例如,HPC从侧重数值计算向HPC+AI+大数据融合,带来的是应用负载类型的多样化和复杂化,直接推动着分布式存储多协议和混合负载特性的发展。像自动驾驶场景,数据处理流程复杂,从数据导入、预处理到训练、仿真、结果分析,不同的数据处理环节,使用到的协议类型不尽相同,如果每个环节都采用一套存储,则会大幅提升数据存储成本和数据管理的复杂度,而支持多协议互通的分布式存储,无疑成为了解决这一难题的关键。

再如,在IO500榜单中,用户与数据存储厂商携手打造的分布式存储方案,在稳定性、可靠性等方面比开源方案更胜一筹,逐渐成为了HPC的主流建设模式。众所周知,随着应用类型的转变,HPC应用的长期稳定运行极为关键,对于可靠性和可用性也愈发重视。比如,气象预测和灾难模拟等典型场景,对数据的时效性和业务连续性要求极高,一旦发生中断,将带来一系列连锁反应,而分布式存储日渐发展出的高稳定和高可靠的特点,则满足了这些典型场景的需求。

综合来看,HPC已经成为推动分布式存储技术、产品和方案发展的重要抓手,像分布式存储的支持混合负载、多协议互通、数据高可用、全闪化等特性,均在HPC场景中得到实践和应用。

事实上,华为OceanStor Pacific分布式存储在HPC领域的成功就是最好的例子。作为常年霸榜IO500的分布式存储产品,华为OceanStor Pacific凭借多年的深耕细作,在HPC场景中不断积累与创新,取得多项关键技术的突破,实现产品与用户的双赢。

华为分布式存储:五边形战士一骑绝尘

在本次IO500榜单中,以华为OceanStor Pacific分布式存储为核心底座的Cheeloo-1系统,搭载了全新研制的OceanFS2新一代并行文件系统,真正打破了HPC在存储层的关键性能瓶颈,在总体得分、带宽性能、元数据性能等五个维度上的得分均遥遥领先,堪称全能型的五边形战士。

在满足HPC各项存储需求的基础上,华为OceanStor Pacific分布式存储如何做到在综合性能上比其他厂商快得多?这得益于华为在分布式存储领域始终如一的研发创新,逐步在应用、算法、网存和架构四个层面,形成综合优势。

 

出处:IO500官网

首先,在应用层面,华为OceanStor Pacific分布式存储打造了应用感知的DataTurbo数据加速引擎,利用融合数据格式、近数据处理和特征处理算子卸载加速等创新技术,实现了对各种HPDA 应用的性能加强。

比如,针对HPDA中愈发密集、愈发不可或缺的大数据环节,数据处理流程的各类ETL严重影响了数据处理效率,而OceanStor Pacific分布式存储灵活对接各种大数据引擎的“基操”,实现了数据湖和数仓之间的数据共享,大幅减少了ETL的需求。

再例如,DataTurbo数据加速引擎在存储侧为计算引擎开启缓存能力,通过自动缓存热点数据进行预处理,并在多个计算集群之间共享缓存数据,以削除计算侧加载时的资源消耗和时延,实现效率60倍提升,让数百PB数据查询缩减至10秒。

其次,在算法层面,华为OceanStor Pacific分布式存储采用业内独创的SmartBalance全均衡设计,实现数据类型和I/O流的智能感知,解决CPU算力不足或调用堆栈深度等软件问题引起的IOPS瓶颈、HPC多流程跨系统的数据迁移、数据膨胀等难题。

比如,华为OceanStor Pacific的大小IO分流处理技术,实现了在一套存储中带宽、IOPS和OPS性能全优,单节点性能达到了20GB/s的带宽和20万IOPS,是业界的最高水准。

此外,独创的融合非结构化元数据索引,实现文件、对象和大数据等原生多协议无损互通,一份数据多端调用。并且,针对数字化病理、卫星遥感、基因测序等,华为采用智能感知语义格式、多模态聚合、智能分区编码等技术,进行场景化二次压缩算法,将压缩比例提高了30~80%。

华为的算法创新在真实HPC场景中有何价值?以其独创的融合非结构化元数据索引为例,在科学计算等典型的HPC场景中,创建数据集一直都是老大难的问题,动辄又数十TB的数据集,过去如果需要创建多个数据集,以满足不同研发团队的需求,往往需要通过数据复制的方式,效率极其低下;如今,利用融合非结构化元数据索引,则不需要通过数据复制的方式,一份数据集能够轻松被多端灵活调用。

第三,在网存层面,华为OceanStor Pacific通过自研的网络芯片支持RoCE,以及RDMA和IP的访问能力。在同时支持带宽、IOPS等不同类型的业务时,可以智能调整网络的相关参数,提供更好的拥塞控制,从而大幅降低不同存储节点间的数据交换时延。

最后,在架构层面,华为OceanStor Pacific采用全对称架构,实现了智能IO路径与磁盘管理,以及极高的数据可靠性保护,大幅领先开源方案。众所周知,Lustre等开源分布式存储在HPC领域被多年应用,但Lustre的非对称架构、IO路径漫长、磁盘碎片化严重、无冗余保护等劣势,在如今的HPC场景中逐渐凸显,越来越多用户开始转向以华为OceanStor Pacific为代表的商用方案,从而在架构、性能和可靠性方面获得更好的保障。

写在最后

根据Gartner 2022年存储和数据保护技术成熟度曲线(Hype Cycle for Storage and Data Protection Technologies, 2022),分布式文件系统、对象存储、容器原生存储等分布式存储热门技术,在未来2-5年里将进入高优先级。这也预示着,分布式存储会存储市场中呈现势不可挡的爆发。

 

凭借多年来在分布式存储领域的关键技术积累与突破,华为分布式存储已成为该领域的翘楚,在市场份额、行业覆盖、产品竞争力等多方面遥遥领先。

以市场为例,华为分布式存储作为连续多年冲入Gartner文件与对象存储魔力象限的唯一中国厂商,在全球份额上也令人惊喜。

国内市场上,华为分布式存储连续六年高居市场第一,早已执掌半壁江山。放眼全球,2022年全球二级存储收入排名第二,达到总份额的25%,以18%的增速远超其他对手。

在行业覆盖方面,华为分布式存储在欧洲、中东、拉美和亚太等地区的关键业务场景,均实现了大规模突破,除了高性能计算之外,还包括教育科研、金融、医疗保健、媒体娱乐、交通安平、大数据分析等行业。

据IDC预测,到2025年,中国的数据量将增长到48.6ZB,成为全球最大的数据圈,其中80%是非结构化数据,这无疑对擅长存储和处理非结构化数据的分布式存储有着长期需求。随着中国数字经济持续高速增长,数据要素、东数西算、产业数字化等战略的出台,存储成为了最重要的数字底座,而华为分布式存储凭借过硬的产品力、强大的方案以及联合创新的模式,能够为数字底座筑造最为牢固的数字基石。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/636503.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于jsp+mysql+mybatis+Spring boot简单学生成绩信息管理系统

基于jspmysqlmybatisSpring boot简单学生成绩信息管理系统 博主介绍:5年java开发经验,专注Java开发、定制、远程、指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java项目精品实战案例《500套》 欢迎点赞 收藏 ⭐留言 文末获取源码联系方…

容器(第五篇)docker-compose

docker-compose用来单机上编排容器(定义和运行多个容器,使容器能互通),Eg:前端和后端部署在一台机器上,现在直接通过编写docker-compose文件对多个服务(可定义依赖,按顺序启动服务&a…

Burpsuite+Proxifier抓取exe数据包

本文转载与: https://mp.weixin.qq.com/s?__bizMzg4NTUwMzM1Ng&mid2247504341&idx1&sndb06bdc7434a34dd69930e3a7e3d8114&chksmcfa575c6f8d2fcd0830a7bb5d5c11b6e8a1465688d8f59cb2fd7b04685210ac2beae3bec18c2&mpshare1&scene23&srci…

vscode Delete `␍⏎·····`

在公司电脑首次拉取代码的时候,好多代码报错,在网上查了博客,确定是换行导致,但是参考网上的解决办法,没有解决,不管是设置 auto 还是命令行执行什么什么的,都不管用 下面介绍我的办法 首先&a…

葡萄目标检测相关论文和数据集

文章目录 2018Computer Vision and Machine Learning for Viticulture Technology 2020Grape detection, segmentation, and tracking using deep neural networks and three-dimensional association(Computers and Electronics in Agriculture) 2021Gr…

Vue中如何进行图片裁剪与上传?

Vue中如何进行图片裁剪与上传? 在Web开发中,经常需要使用图片,有时候需要对图片进行裁剪和上传,Vue作为一种流行的前端框架,提供了很多方便的工具和插件来帮助开发者实现这些功能。 图片裁剪 Vue中提供了很多图片裁剪…

采用SSM框架实现登录拦截,分页,批量删除的功能

本案列采用的技术有后端spring/springmvc/mybatis/jquery等技术&#xff0c;前端采用bootstrapjsp 项目结构如下图 依赖pom.xml文件 <dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>4.11</version>…

怎样的低代码平台才算是一个好用的低代码平台?

随着数字化转型的加速&#xff0c;低代码平台已经成为了企业数字化转型的一个重要工具。低代码近几年是一个很热门的概念&#xff0c;市场对低代码的需求也不断增加&#xff0c;但到底什么样的低代码平台才算是一个好用的低代码平台&#xff1f; 一个好用的低代码平台应具备以…

Python源码:火柴棒摆数字有6根火柴棒,列出所有能摆出的自然数

题&#xff1a;用自定义函数&#xff0c;火柴棒摆数字有6根火柴棒&#xff0c;列出所有能摆出的自然数&#xff0c; 要求火柴棒正好摆完 解析&#xff1a; 1、0-9这十个数字&#xff0c;每个数字分别需要的火柴根数如下 2、用6根火柴摆出的最小数字是&#xff1a;0 用6根火柴…

深入理解CSS字符转义行为

深入理解CSS字符转义行为 深入理解CSS字符转义行为 前言为什么要转义&#xff1f;CSS 转义什么是合法css的表达式 左半部分右半部分 练习参考链接 前言 在日常的开发中&#xff0c;我们经常写css。比如常见的按钮: <button class"btn"></button>&am…

YOLO输出大中小目标的AP值

在进行实验的过程中&#xff0c;博主一直使用的是COCO数据集&#xff0c;其评价指标如下所示&#xff0c;包含大中小目标的AP值与AR值。博主选用了yolov5与yolov7进行实验&#xff0c;其中yolov5成功&#xff0c;yolov7却出现了问题。 随后博主在进行对比实验时使用了YOLO模型&…

烟草仓库监控有多重要?给你支一招

随着全球烟草行业的发展&#xff0c;烟草仓库监控变得越来越重要。烟草作为一种易燃、易损和有害物质&#xff0c;需要特殊的保管和监控措施&#xff0c;以确保烟草的质量、安全和合规性。 烟草仓库监控的目的是实时监测和管理烟草仓库内的环境参数&#xff0c;如温度、湿度、气…

一些有趣的兼容性测试事实和技巧

兼容性测试是一种重要的测试方法&#xff0c;可以确定软件或应用程序是否能够在不同的操作系统、浏览器、设备上正常运行。以下是一些有趣的兼容性测试事实和技巧。 事实1&#xff1a;同样的代码在不同的浏览器中会产生不同的结果。 由于不同的浏览器对相同代码的解释不同&…

【微信公众平台对接】有关【创建发票卡券模板】调用示例

1、微信开放平台接口说明&#xff1a; 2、代码示例 /*** 创建发票卡券模板** param token* return*/PostMapping("createCard")public String createCard(String token) {return wechatOpenService.createCard(token);}String resp null;try {String url String.fo…

电路板电镀中4种特殊的电镀方法

本文主要介绍的是电路板焊接中的4中特殊电镀方法。 第一种&#xff0c;指排式电镀 常常需要将稀有金属镀在板边连接器、板边突出接点或金手指上以提供较低的接触电阻和较高的耐磨性&#xff0c;该技术称为指排式电镀或突出部分电镀。常将金镀在内层镀层为镍的板边连接器突出触…

武职301班-day01

实现永和小票页面 效果图 问题分析 把一个大的开发任务&#xff0c;先进行任务分析&#xff0c;把完成这个任务需要的技术点和开发步骤写出来。 开发分析 特点&#xff1a; htmlcss实现 1&#xff09;小票有宽度限制 2&#xff09;字体大小不一样&#xff0c;大部分字体大小…

FTSE-250 CMC Markets投资StrikeX Technologies,巩固战略伙伴关系,革新数字资产行业

StrikeX非常高兴地宣布与屡获殊荣的FTSE 250金融服务提供商CMC Markets成功完成投资和战略合作伙伴关系。CMC Markets已经收购了StrikeX Technologies 33%的股份&#xff0c;并将其两位高级执行官纳入StrikeX董事会&#xff0c;为公司带来了丰富的专业知识和经验。这对于两家公…

Linux第一章之环境搭建

目录 一、什么是Linux 1.1前端VS后端 1.2企业为何选择使用Linux作为后台服务器 1.3国内企业后台和用户使用Linux现状 1.4就个人找工作/能力提升来说&#xff0c;该如何看待Linux 1.5求职相关 ​1.6Linux好玩的指令 1.7Linux基本代码编写 1.8内存/CPU/硬盘/外设等硬件&…

pm2原理与使用

目录 pm2是什么以及好处 原理 Node Cluster pm2工作流程 常用命令 安装 启动进程 查看进程 重启/删除 日志 pm2是什么以及好处 pm2是一个内建了负载均衡器的node进程管理工具&#xff0c;可以利用它来简化很多node应用管理的繁琐任务&#xff0c;如自动监控进程状态…

Spring Boot - 自定义 banner

自定义 banner 在Spring Boot中&#xff0c;你可以通过定制Banner来个性化你的应用程序启动时的输出。Banner是一个在应用程序启动时显示的ASCII艺术字形式的标志&#xff0c;用于增加应用程序的识别度和个性化。 以下是一些定制Banner的方法&#xff1a; 创建自定义Banner文…