HPC 集群计算类型的注意事项

news2024/9/24 3:22:54

HPC 集群计算类型的注意事项

HPC 工作负载在 CPU ,内存,网络和存储资源需求方面有不同的要求。

您可以从以下内容开始:

  • 核心计数
  • 每个核心的内存
  • 网络带宽和等待时间
  • 处理器时钟速度

目标是选取返回最佳性价比的计算配置。 HPC 工作负载可以与单个核心作业一样简单,也可以与需要数百到数千个核心的作业一样复杂。 HPC 聚集了计算能力 (集群) ,可以提供更高的性能并解决大问题。

大多数 HPC 工作负载都低于 1000 个核心范围。 有些工作负载需要大量核心,直至 (包括) 10k-50k。 HPC 工作负载的执行时间可能很简单,仅持续几秒,也可能很复杂,需要几天时间。

例如, EDA (电子设计模拟) 工作负载具有组件级别的模拟作业,这些作业每天需要运行数百万个此类作业,但每个作业需要单个核心和大约 10 秒。 其他如光学近距离校正可能需要多个小时甚至几天,具体取决于芯片的大小和 HPC 集群的大小。

通常, HPC 集群包含一组虚拟机,并使用该集群来运行多个工作负载。 这一切都取决于工作负载资源需求和持续时间。

为了解决此范围的特征, IBM Cloud® 以不同方式提供各种 VPC 虚拟机 (VM) 配置:

  • 均衡配置,可提供每个核心的平均 4 GB 内存,并且在网络带宽中的范围为 4-64 Gbps
  • 计算密集型配置,可提供每个核心的 2 GB内存和 4-80 Gbps 网络
  • 内存密集型配置,可提供 8-每个核心 28 GB 内存和 2-80 Gbps 网络

对于所有配置,每个虚拟机的核心计数范围为 2-128。 有一种特殊的超高内存虚拟机类型,可能适用于每个核心需要更多内存的工作负载。 此类型最多可以达到 200 个核心,每个核心可高达 28 GB。

单个 NIC 上的网络带宽可以达到最大 16 Gbps。 如果需要更高的带宽,那么可能需要更多高达 80 Gbps 的 NIC 配置。 在这些情况下,需要为虚拟机配置 5 个 NIC。

缺省情况下,将在 IBM Cloud 虚拟机上启用超线程技术,因此每个物理核心都将获得 2 vCPUs 。 但这很容易被禁用。

请注意:大多数 HPC 应用程序的性能最佳,每个物理核心有一个进程或线程。

对于可以适合单个虚拟机上的通信密集型工作负载,最好选择最佳匹配项,最多可使用 128 个核心虚拟机实例,而不是在多个虚拟机实例之间拆分具有较小核心计数的工作负载。 这使进程能够利用通过单个虚拟机上的共享内存进行的更快通信,而不是通过以太网网络跨多个虚拟机进行的通信。

从角度来看,在同一虚拟机上运行的两个进程可能能够以微秒 (例如, 0.3 微秒) 的一小部分进行通信,而在两个虚拟机实例中,可能需要 30 微秒以上的时间。 通过单个虚拟机中的共享内存时,通信速度提高 100 倍。

非常经济有效的配置是 cx2-128x256,它允许每个核心 128 个核心和 2 GB 内存。 这可以涵盖广泛的 MPI 工作负载。

请注意:可以设置可扩展的 MPI 作业,这些作业需要配置为最多 80 Gbps 的多个虚拟机,但这需要多个 NIC ,并且可能不需要这些 NIC。 建议选择一个配置,通过单个 NIC 为每个核心提供最佳网络带宽。 bx2-16x64 可能是 MPI 基准测试的良好起点。

特定工作负载的基准评测

电子设计自动化 (EDA)

IBM Systems 和 IBM Research 在此行业领域开展工作,并已成功将 IBM Cloud 用于此类工作负载。 下图显示了最多 30 K 个核心的刻度测试。 为了展示如何将云区域用作单个数据中心,我们构建了一个大型 HPC 集群,用于聚集三个 IBM Cloud 位置的资源。 安装还将 IBM Spectrum Scale 用作基于临时的高性能文件系统以及 IBM Spectrum LSF 用于 HPC 集群配置。 我们已将 BX2-48x192 用于 IBM Spectrum LSF 工作程序节点,并将 MX2d-16x128 用于 IBM Spectrum Scale下的存储节点。

缩放

天气 (WRF 模型)

IBM Cloud 显示线性性能,性能良好,可扩展为数千个核心。 用于此基准的虚拟机配置为 bx2-16x64。 WRF 模型对网络等待时间不敏感,因为它将许多变量打包到每条消息中,从而产生相当大的消息,而没有多少小的消息。

在这里插入图片描述

红线表示具有 InfiniBand HDR 的 HPC 环境,提供最高带宽,最短等待时间,并且是此类工作负载的最佳配置。 绿色线条显示 IBM Cloud 以及用于基准测试的 Lon2 数据中心。 蓝线是 Summit 超级计算机。 总之,具有类似于 WRF 模型的特征的任何工作负载都应该使用 IBM Cloud进行扩展。 如您所见, IBM Cloud 显示了针对最先进的 HPC 系统的合理性能。

DoE (能源部) 基准评测

SNAP 和 Quicksilver 是 DoE 用于对特定商品技术系统进行基准测试和决策的两个应用程序。

下图显示了 IBM Cloud 如何与最先进的 HPC 系统进行比较的结果。

在 IBM Cloud上,基准程序使用了两种不同的配置:

  • bx2-8x32
  • bx2-16x64

如您所见, SNAP 结果显示 bx2-8x32 提供了更高的性能,因为每个核心的有效网络带宽比率更高; 其中 Quicksilver 与 bx2-16x64 表现良好,因为它具有中等的通信需求,并且大多是在全局域中跟踪粒子运动的近邻节点。

在这里插入图片描述
在这里插入图片描述

尽管缩放效果不如天气模型,但 IBM Cloud 可以使用线性曲线合理缩放多达数千个核心。

虚拟机用例

IBM Cloud 的虚拟机概要文件类型选项取决于有关核心,内存和网络需求的工作负载详细信息。

单节点虚拟机用例

这应该是第一次评估,因为它可以提供在 IBM Cloud上运行此类作业的最佳价格和性能。

您可以从以下一组虚拟机概要文件中进行选择:

  • CX2-16x32 到 CX2-128x256
  • BX2-16x64 到 BX2-128x512
  • MX2-16x128 到 MX2-128x1024

根据每个核心所需的内存,您可以选择 MX2 配置,该配置在 MX2-128x1024 概要文件上最多支持 1 TB。

如果每个核心所需的内存低于 2 GB ,那么相应的 CX2 概要文件可能会为您提供最佳的价格和性能。 如果工作负载可以在单个虚拟机上运行,那么与共享内存进行更快通信的优点有助于提高性能。

此类工作负载的一些示例:

  • 局部地区天气预报,分辨率不高,模型大但规模不大
  • OpenFOAM 计算流体动力学, 2 百万到 1000 万个网格单元之间问题的大小
  • 电子设计自动化 (EDA) 中的设计规则检查 (DRC) 作为芯片设计的一部分
  • EDA 单组件模拟和验证作业

使用多个虚拟机向外扩展用例

这是第二类工作负载,其中要求具有多个要执行的虚拟机。 甚至对于此类别,根据网络带宽和等待时间需求,大量 HPC 工作负载将在 IBM Cloud上扩展。

在某些情况下,可能需要对应用程序代码进行小型更新以将其调整好,以便在类似云的环境中运行,并且这些更改并非特定于 IBM Cloud ,而是希望向任何云提供者分类群发。

IBM 具有深厚的 HPC 专业知识,可提供特定建议,帮助您获得 HPC 云环境的最佳性价比。

IBM Cloud 已在以下示例中成功:

  • EDA 中的光学近似值校正 (OPC)
  • EDA 中的全芯片集成电路验证器 (ICV)
  • 任何 Hadoop 映射/减少或 Spark 工作负载
  • 无法在单个虚拟机上运行的 MPI 工作负载

此类工作负载的建议是从 BX2-16x64 开始,因为它在迄今为止的测试中提供了最佳性能。 根据您的结果,您可以深入了解可能更适合特定工作负载的替代选项。 某些工作负载可能具有网络等待时间敏感性,并且 IBM Cloud 配置可能没有前景; 但是,即使在这些情况下,请与产品所有者和销售团队进行互动,以便 HPC 专家可以评估您的特定需求并提供帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1237169.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

markdown常用命令说明,自己常用的,用到其他的再添加

对于要标红的字体 <font color"red">标签中的字会显示为红色</font> 之后的字不会再显示为红色注意: <font color"red">或者<font colorred>或者<font colorred>三种写法都可以

汽车智能座舱/智能驾驶SOC -1

看到华为&小康的 AITO问界M6、M7各种广告营销、宣传、测评、好评如潮水般席卷网络各APP平台。翻看了中信和海通对特斯拉M3和比亚迪元的拆解报告&#xff0c;也好奇华为的汽车芯片平台又能做出哪些新花样&#xff0c;下面是Mark开头&#xff0c;也学习下智能座舱和智能驾驶芯…

Vatee万腾的数字化掌舵:Vatee科技解决方案的全面引领

随着数字化时代的到来&#xff0c;Vatee万腾凭借其卓越的科技实力和全面的解决方案&#xff0c;成功地在数字化探索的航程中掌舵引领。 首先&#xff0c;Vatee万腾以其强大的数字化科技实力成为行业的引领者。vatee万腾不仅在人工智能、大数据分析、云计算等前沿领域取得了显著…

数据集笔记:Pems 自行下载数据+python处理

以下载District 4的各station每5分钟的车速为例 1 PEMS网站下载数据 点击红色的 选择需要的station和区域&#xff0c;点击search&#xff0c;就是对应的数据&#xff0c;点击数据即可下载 &#xff08;这个是station每5分钟的速度数据&#xff09; 2 pems 速度数据 2.1 每一…

DDD之六边形架构(Hexagonal Architecture)

领域驱动设计系列文章&#xff0c;点击上方合集↑ 六边形架构&#xff08;Hexagonal Architecture&#xff09;&#xff0c;也被称为端口和适配器架构&#xff08;Ports and Adapters Architecture&#xff09;&#xff0c;是一种软件架构模式&#xff0c;用于构建可测试、可维…

Ajax基础(应用场景|jquery实现Ajax|注意事项|Ajax发送json数据|Ajax携带文件数据)

文章目录 一、Ajax简介二、基于jquery实现Ajax三、使用Ajax注意的问题1.Ajax不要与form表单同时提交2.后端响应格式问题3、使用了Ajax作为请求后的注意事项 四、前后端数据传输的编码格式(content-Type)1.urlencoded2.formdata3.application/json 五、Ajax携带文件数据六、Ajax…

稳定性保障8个锦囊,建议收藏!

稳定性保障&#xff0c;是一切技术工作的出发点和落脚点&#xff0c;也是 IT 工作最核心的价值体现&#xff0c;当然也是技术人员最容易“翻车”的阴沟。8个稳定性保障锦囊&#xff0c;分享给各位技术人员择机使用。 #1 设定可量化的、业务可理解的可用性目标 没有度量就没有改…

快来瞧瞧这样制作出来的电子画册,还便于分享宣传呢!

说起电子画册制作&#xff0c;很多人都不知道从何入手。与传统纸质画册相比&#xff0c;电子画册最大的优点是便于传阅&#xff0c;通过微信、QQ等社交平台都能进行转发和分享。而且内容的排版基本上和纸质画册一致&#xff0c;不同的是&#xff0c;无论图片还是文字都可以赋予…

【数据结构算法(二)】链表总结

&#x1f308;键盘敲烂&#xff0c;年薪30万&#x1f308; 目录 普通单向链表 双向链表 带哨兵的链表 环形链表 ⭐双向带头带环链表的实现⭐ ⭐链表基础OJ⭐ 普通单向链表 结点结构&#xff1a;只有val 和 next指针 初始时&#xff1a;head null; 双向链表 指针&…

特征工程完整指南 - 第一部分

苏米特班迪帕迪亚 一、说明 特征工程是利用领域知识从原始数据中提取特征的过程。这些功能可用于提高机器学习算法的性能。本篇叙述在特征选择过程的若干数据处理。 一般来说&#xff0c;特征工程有以下子步骤&#xff1a; 特征转换特征构建特征选择特征提取 二、特征转换的缺…

12.文档中添加Appendix

要在 LaTeX 文档中添加附录&#xff0c;您可以使用 \appendix 命令&#xff0c;它会告诉 LaTeX 后续部分是附录。以下是添加附录的步骤&#xff1a; 在文档的导言部分&#xff08;在 \begin{document} 之前&#xff09;导入 appendix 宏包。您可以使用以下命令&#xff1a; \…

Centos8部署MySQL主从复制报错问题

问题1.在部署MySQL主从复制时&#xff0c;创建用户提示ERROR 1819&#xff1a;Your password does not satisfy the current policy requirements。即为当前配置的密码&#xff0c;不符合策略要求。 问题1解决方式&#xff1a; set global validate_password.policyLOW; \\…

「Verilog学习笔记」含有无关项的序列检测

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点&#xff0c;刷题网站用的是牛客网 timescale 1ns/1ns module sequence_detect(input clk,input rst_n,input a,output reg match);reg [8:0] a_tem ; always (posedge clk or negedge rst_n) begin if (~rs…

jvs-智能bi(自助式数据分析)11.21更新功能上线

jvs智能bi更新功能 新增: 1.字段设置节点新增自定义时间格式功能&#xff1b; 自定义功能允许用户根据需要自定义日期和时间字段的显示格式&#xff0c;为用户提供了更大的灵活性和便利性 2.图表时间搜索条件新增向下兼容模式&#xff1b; 时间搜索条件的向下兼容模式允许用…

万界星空科技QMS质量管理系统介绍

QMS&#xff08;Quality Management System&#xff09;质量管理系统是五大基础系统之一&#xff0c;在工业企业中被广泛的应用&#xff0c;在质量策划、生产过程质量监督、体系审核和文档管理等业务上发挥着不可替代的作用。 一般制造业工厂现状&#xff1a;质量成本高&#x…

运动耳机哪个牌子好?盘点最值得入手的五款运动耳机

现在&#xff0c;不入耳的运动耳机成了许多运动爱好者的首选&#xff0c;我也不例外&#xff0c;不得不说骨传导耳机跟运动真的很搭&#xff0c;不仅佩戴稳固不掉落&#xff0c;而且防水好&#xff0c;可以说是最值得入手的运动耳机&#xff0c;为了避免大家在选购运动耳机的时…

超级会员卡积分收银系统源码 会员卡+积分商城+收银功能+多门店系统 附带完整的搭建教程

线上线下的融合已经成为趋势。在这个过程中&#xff0c;会员卡积分收银系统成为了许多企业不可或缺的一部分。该系统以超级会员卡为基础&#xff0c;结合积分商城、收银功能以及多门店系统&#xff0c;为企业提供了一站式的解决方案&#xff0c;帮助企业实现线上线下会员一体化…

CAS方式实现单点登录SSO

1. CAS介绍 CAS&#xff08;Central Authentication Service&#xff09;中心认证服务 下面这张图来自官网&#xff0c;清晰简单的介绍了CAS的继续交互过程 2. CAS具体实现 首先需要分别搭建CAS-server和CAS-client服务&#xff0c; 这两个服务分别在2台机器上&#xff0c;…

2023年国自然植物科学相关面上项目信息公布(小麦、大麦、棉花、大豆、玉米)

2024年申报国自然项目基金撰写及技巧http://mp.weixin.qq.com/s?__bizMzA4NTAwMTY1NA&mid2247575761&idx1&sn32dbacd3393f3b76a1e0668e4b8b3c89&chksm9fdd7c08a8aaf51ec31d4790067bb57751a09947eeb7e728b8c008d26b89adba37e0cab32a62&scene21#wechat_redi…

梨花教育,精心的声音可提升罪案剧的吸引力和体验

在为罪案剧录制配音时&#xff0c;配音员应致力于营造剧集所需的紧绚和不确定性&#xff0c;同时准确地传达角色的心理活动和情绪纠葛。罪案剧往往围绕着刑侦探索、法律较量、道德抉择等主题展开&#xff0c;因此配音需要与这些情境相适应。以下是进行罪案剧配音时的几点建议&a…