高性能数据分析时代,HPDA平台需要什么样的数据存储?

news2024/11/20 14:19:47

在海量基因数据中进行全基因数据分析,了解各种疾病与DNA之间的隐秘联系;对海洋气候进行预测,利用强大的数据分析性能,实现分钟级的数据刷新、精准预测海洋气候;利用高速相机模拟人脑上亿个神经元之间联接与工作,对产生的海量数据进行实时分析,探索人脑工作机制……

如今,数据正在迅速改变科研领域,推动传统科研模式加速向基于“数据密集型科学”的科研新范式转变。随着数据成为生产要素,数据采集、数据存储等相关技术与方案不断创新,越来越多科研人员感受到科研新范式所带来的巨大价值。

因此,近年来,无论是政府超算,还是科研高校均在加速构建面向多元算力和海量数据的新型HPDA(High Performance Data Analytics,高性能数据分析)平台,为不同学科提供面向HPDA应用负载的数据基础设施成为当务之急。

在今年第十八届全国高性能计算学术年会(CCF HPC China 2022)上,面向HPDA场景的数据存储相关话题再次引燃会场。其中,华为DataRobot HPDA存储集群解决方案更是获得广泛关注。华为DataRobot HPDA存储集群解决方案不仅获得官方最佳解决方案奖,更凭借应用加速、数据跨域管理和全栈敏捷等方面的出色创新为HPDA场景下的数据存储解决方案打开了新思路与新局面。

HPDA与HPC大不同

在传统HPC时代,基于计算科学的科研范式往往是先提出可行理论,再搜集数据,之后通过计算仿真进行验证,大多以数值计算为主;而如今基于“数据密集型科学”的科研新范式,则更多与大数据知识挖掘及AI训练推理技术结合,通过计算与分析获得新知识和新发现。科研领域正式进入到HPDA高性能数据分析时代。

科研范式的转变,意味着对于底层数据基础设施的需求将发生根本性改变。数据密集型的科研应用负载,其数据往往具有不可重复性、高度不确定性、高维、计算高度复杂等特征。加上当前科研领域对于数据流动的需求愈发强烈,使得科研领域的HPDA面临着诸多挑战:

其一、混合计算需要更加牢固且强大的、支持HPDA场景的可靠存储底座。众所周知,无论是高校科研机构的智算中心,还是辐射区域的政府超算中心,均需要同时跑不同类型的科研应用负载。这些工作负载对于数据存储的容量、性能、带宽、管理、访问协议方面的要求各不相同,因此就需要强大的HPDA数据存储同时支撑起这些混合工作负载,并减少数据量膨胀以及数据迁移;

其二、很多HPDA工作负载对于数据实时处理性能要求很高,例如在高能物理分析、天气预测、药物研究以及电信欺诈等场景中,往往会面对大规模网络并发数据处理需求,需要短时间内对海量数据进行快速分析与处理,这对于HPDA场景下存储系统的全栈协同、高效处理能力提出了极高要求;

其三、数据流动与共享是整个社会经济发展的大势所趋,在科研领域也不例外。尤其是在东数西算、东数西存等战略的大背景下,跨地域、跨集群的数据共享与流动势在必行,为了面对海量数据处理、数据分散、数据多元化、安全可信等难题,企业急需全新的HPDA数据存储解决方案来支撑。

因此,业界普遍意识到,需要打造支持混合负载、多协议互通且具备超高密设计、面向HPDA场景的存储集群解决方案,来应对HPDA工作负载愈发严苛的挑战。其中,华为率先推出了业界首个数据加速引擎加持的HPDA全栈方案—华为DataRobot HPDA存储集群解决方案,真正为HPDA存储打开了全新的创新思路和应用阶段。

华为DataRobot存储集群解决方案带来了什么

事实上,HPDA工作负载改变的,不仅仅是存储系统本身,更是对于数据存储的设计、使用模式和创新能力的一次重塑。

与其他传统存储方案不同,华为DataRobot HPDA存储集群解决方案是业界首个数据加速引擎加持的HPDA全栈方案,其真正在数据应用加速、数据跨域管理、绿色节能和全栈敏捷设计四大方面开创了先河,引领HPDA存储创新。

首先是出色的数据应用加速:华为的DataTurbo应用加速引擎,真正让华为DataRobot HPDA存储集群解决方案满足各种科研工作负载的极致性能需求。

具体来看,DataTurbo是华为DataRobot HPDA存储集群解决方案中联接应用与存储的数据加速引擎组件,由应用加速引擎和全局数据管理组件组成。

 其中,应用加速引擎内置了自研网卡芯片和HPC、大数据加速套件,具备I/O聚合算法、统一元数据网关、芯片I/O卸载等黑科技,可实现应用处理效率数倍提升,同时结合OceanStor存储的全局共享存储能力,在面向E级超算场景下,可实现万级计算客户端并发访问,且单集群达到50TB/s带宽,10亿IOPS能力,性能领先业界30%。

除了应用加速引擎之外,DataTurbo的全局数据管理组件则让HPDA的跨域数据管理更加简单与高效,真正有效推动了数据的流动与共享,为科研领域的数据分析与价值实现带来了更多可能。

全局数据管理组件可以基于统一元数据,构建全局命名空间,实现跨数据统一访问;支持智能的全文检索,打破地域限制,让数据看得见;并可通过智能调度策略,根据数据温热冷分级,可实现3倍数据调度效率提升。

其次,科研机构的超算中心/智算中心通常规模庞大、设备众多、能耗成本高昂,随着国家碳达峰/中和战略目标的推出,超算中心/智算中心走向绿色节能的发展之路是大势所趋。

为此,华为DataRobot HPDA存储集群解决方案在存储系统设计上,通过热温冷数据智能分级设计,实现三个层级的数据自动流动:本地集群内实现SSD、HDD主存储、蓝光存储间的数据分级;跨集群数据远程自动分级到其他数据中心;本地数据中心到公有云的数据分级流动。通过将数据放置在最合适的位置,实现跨数据中心层面的整体节能。

值得一提的是,基于华为DataRobot HPDA存储集群的自研多模型数据合并压缩技术,可以将数据在本地压缩后再传输,极大的节省传输带宽和存储空间,最终实现十年整体TCO降低70%。

面对传统风冷机房的能耗问题与高密度支持问题,华为采用的风液冷机柜,创新的硬件设计让整柜功率密度达到20KW+,PUE≤1.25,功率密度提升1.5倍。DataRobot HPDA存储集群所提供系列高密分布式存储配置中,OceanStor高密大容量产品,在5U高的标准设备空间内可以容纳120块HDD,单位空间密度比其他同类产品高出20%。

第四,如今大数据、AI等技术的融入,使得很多科研机构的数据中心平台都面临着多元异构算力的环境,这对于HPDA存储产品的设计与交付提出了极大挑战。为此,华为DataRobot HPDA存储集群方案采取全栈敏捷设计,提供了包含基础柜、计算柜和存储柜在内的三类模块化硬件组合,基于最佳实践的典配机柜设计,用户可以根据不同规模业务场景可按需选择部署、灵活扩展。同时具备一站式交付能力,可帮助用户业务上线时间缩短50%。

此外,华为DataRobot HPDA存储集群解决方案还提供全栈统一运维平台,可以对多个数据中心的存储、计算、网络、容器等资源统一管理,包括从资源规划、端到端资源发放、设备运维、到资源优化全生命周期管理,同时提供AI智能运维,实现5倍的管理效率提升和分钟级问题定界,极大降低运维问题,让科研机构可以将更多精力投入到科学研究之中。

生态加持,华为DataRobot行稳致远

如今,基于“数据密集型科学”的科研新范式正在深刻影响着各大科研机构。在高性能数据分析时代,仅凭借数据基础设施的创新将不再满足要求,需要从底层数据存储、上层应用,到整体方案设计进行全方面的创新。

显然,华为数据存储率先意识到HPDA领域的这种需求变革,并且在确保产品优秀的基础上,大力推动生态的力量,联合科研领域的联科/赛乐/人和未来等多家合作伙伴,在DataRobot HPDA存储集群解决方案中进行应用调优和预集成,真正让客户开箱即用。

总体来看,基于“数据密集型科学”的科研新范式已是大势所趋。随着大数据、人工智能等技术进一步融合到科学研究的日常工作之中, HPDA存储集群解决方案必将被进一步普及。毫无疑问,华为DataRobot HPDA存储集群解决方案的出现,为市场树立了新标杆,有望持续帮助更多用户构建起领先的数据基础设施,推动科研新范式步入发展的快车道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/110463.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

善康医药冲刺科创板上市:计划募资13亿元,上半年亏损5000万元

近日,深圳善康医药科技股份有限公司(下称“善康医药”)在上海证券交易所递交招股书,准备在科创板上市。本次冲刺上市,善康医药计划募资13.27亿元,将用于新药研发项目、创新药高端制剂生产基地建设项目、营销…

redis学习第二天

Redis事务 Redis事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令插队。 Redis事务的主要作用就是串联多个命令防止别的命令插队。 Multi、Exec、discard 从输入Multi命令开始、…

【c++基础】第六章 STL标准模板库

第六章 STL标准模板库认识STLstring字符容器库vector容器迭代器与空间配置器deque容器容器适配置list容器set容器map容器观察者设计模型认识STL STL的概述 STL采用泛型思想,把C中所用到的所有的数据结构,按照一定的标准,全部封装成了一个个…

虚拟机docker网络问题处理

问题 我们有2台设备,ip 为 172.20.30.1 172.20.30.2 ,虚拟机上的服务需要连接这2台设备,网络已经做通了,可以正常连接虚拟机异常关闭,重新开启后。发现服务有些问题,就打算将docker服务重新部署&#xff0…

Vue后台项目的记录 (一)

一、下载模板 简洁版: https://github.com/PanJiaChen/vue-admin-template 下载下来的文件介绍 build ----index.js webpack配置文件【很少修改这个文件】 mock ----mock数据的文件夹【模拟一些假的数据mockjs实现的】,因为咱们实际开发的时候,利用的是…

STM32——FATFS文件系统

可裁剪意味着可以选择部分功能,减小占用的空间。 与Windows兼容意味着可以在电脑上直接读取文件。 ①底层接口,包括存储媒介读/写接口(disk I/O)和供给文件创建修改时间的实时时钟,需要我们根据平台和存储…

深度学习笔记(1)| 导数、偏导数、梯度和方向导数的理解

1. 梯度(Gradient)的理解 深度学习尝试在权重空间中找到一个方向,沿着该方向能降低损失函数的损失值。其实不需要随机寻找方向,因为可以直接计算出最好的方向,这就是从数学上计算出最陡峭的方向。这个方向就是损失函数…

单页扒手-基于Node的实现

做网站的朋友经常遇见别人的好看的页面,想保存到本地自己用,可是用以前的老办法网页另存为,发现很不好,规则不好处理,路径也不好处理,用这个网页克隆(单页模板扒手)就很好处理了&…

阿里「杀手锏」级语音识别模型来了!推理效率较传统模型提升10倍,已开源

阿里达摩院,又搞事儿了。 这两天,它们发布了一个全新的语音识别模型: Paraformer。 开发人员直言不讳:这是我们“杀手锏”级的作品。 ——不仅识别准确率“屠榜”几大权威数据集,一路SOTA,推理效率上相比…

Zookeeper 4 Zookeeper JavaAPI 操作 4.7 Curator API 常用操作【Watch 事件监听】

Zookeeper 【黑马程序员Zookeeper视频教程,快速入门zookeeper技术】 文章目录Zookeeper4 Zookeeper JavaAPI 操作4.7 Curator API 常用操作4.7.1 Watch 事件监听4 Zookeeper JavaAPI 操作 4.7 Curator API 常用操作 4.7.1 Watch 事件监听 【基本概念】 ZooKeep…

异常见闻录-Java.lang.UnsupportedClassVersionError涨知识啦

今天有学生说自己的Eclipse的Java代码只能在新建的项目中运行,运行导入项目中类就报错 异常信息 java.lang.UnsupportedClassVersionError: com/demo1/Demo1Application has been compiled by a more recent version of the Java Runtime (class file version 5…

CMake入门

1. CMake的介绍: 当多人开发同一个项目时,最终要输出一个可执行文件或者共享库(dll、so等),就可以使用cmake了 所有操作都是通过 CMakeLists.txt(严格区分大小写) 来完成的 ----> 简单 2. …

C51——超声波测距 函数封装和舵机代码结合

要注意舵机转动中 延时函数要放在哪里 #include "reg52.h" sbit D5 P3^7;// sbit D6 P3^6;// sbit Trig P1^5; sbit Echo P1^6; sbit sg90_con P1^1; int cnt; int jd; double time; void Delay10us() //11.0592MHz { unsigned ch…

操作系统管程-地址-重定位-内存管理与存储管理

管程的基本概念:为什么会出现管程?信号量机制的不足:程序编写困难、易出错解决:Brinch Hansen(1973)Boare(1974)方案:在程序设计语言中引入管程成分一种高级同步机制管程的定义:是一个特殊的模块有一个名字…

使用MAXScript脚本编写圣诞树建模插件教程

一、前言 2022年圣诞节到来啦,很高兴这次我们又能一起度过~ 今年的圣诞节为大家分享用MAXScript脚本编写圣诞树建模插件的技术创意,喜欢的同学别忘记在下面点个赞! 二、创意名 一键圣诞树插件 三、效果展示 四、实现步骤 1.制作圣诞树的设计稿…

智能巡检系统:企业安全生产管理的智能助手

智能巡检是一种高效代替传统人工巡检的新方式,其依靠物联感知技术,通过物联网采集获取信息,自动记录巡检信息,及时发现问题,实现巡检科学化。 工业4.0带来的技术革新加速了企业的转型升级进程,传统企业的运…

F5张振伦:让应用安全、快速、可靠地交付到需要的地方丨2022首届全球数字生态大会

科技云报道原创。 日前,由杭州市人民政府和浙江省商务厅主办的“2022首届全球数字生态大会”在杭州国际博览中心成功举办。 本次大会以“新技术、新业态、新模式”为主题,邀请到国内外20余位演讲嘉宾和超300位专业观众线下参会。 与此同时,…

IB成绩换成GPA,美国大学是如何算的?

IB课程体系是全球公认的难度大、结构强的课程体系。 IB课程可以通过IB文凭课程(也称为IBDP)进行系统研究。IB课程体系是国际公认的基础文凭,世界上几乎所有大学都认可IB课程体系。这是否意味着IB在申请美国大学时会有优势? 事实上…

【vue系列-02】vue的核心属性,数据代理,事件

vue的核心属性一,vue的核心属性1,模板语法1.1,插值语法1.2,指令语法2,数据绑定2.1,单向绑定2.2,双向绑定3.mvvm模型4,数据代理4.1,数据代理的基本使用4.2,数据…

pytorch实现好莱坞明星识别

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍦 参考文章地址: 365天深度学习训练营-第P6周:好莱坞明星识别🍖 作者:K同学啊一、前期准备 1.设置GPU import torch from torch import nn …