IBM Spectrum LSF Data Manager

news2024/11/18 5:30:12

IBM Spectrum LSF Data Manager

当需要大量数据来完成计算时,您的应用程序最好不受阻碍地访问与应用程序执行环境相关的数据位置所要求的数据。 LSF Data Manager 通过将所需数据 登台 以尽可能接近应用程序站点来解决数据局部性问题。

许多应用在几个领域需要大量数据: 用于工业制造的流体动力学模型,用于石油和天然气勘探的地震感官数据,用于生命科学的基因序列等。 将这些大型数据集尽可能靠近应用程序运行时环境,对于保持计算资源的最佳利用率至关重要。

无论您是在单个集群中运行这些数据密集型应用程序,还是要在地理上分离的集群之间共享数据和计算资源, LSF Data Manager 都提供了以下关键功能。

  • 输入数据可以从外部源存储库登台到集群执行主机可访问的高速缓存。
  • 在作业完成后,将从高速缓存异步 (无依赖) 暂存输出数据。
  • 数据传输与作业分配分开运行,这意味着更多作业可以在等待大型数据传输时请求数据而无需消耗资源。
  • 远程执行集群选择和集群亲缘关系基于 IBM® Spectrum LSF 多集群功能 环境中的数据可用性。 LSF Data Manager 将所需数据传输到作业转发到的集群。

LSF Data Manager 的工作方式
每个共享登台区域的 LSF 集群也会与同一个 LSF 数据管理器实例进行通信。 集群会查询数据管理器以获取数据文件的可用性。

如果这些文件不在高速缓存中,那么 LSF 数据管理器会对它们进行登台,并在作业的请求数据就绪时通知集群。 对文件进行登台后,集群可以通过查阅 LSF 数据管理器存储在登台区域中的数据文件信息,从登台区域中检索这些文件。

工作方式1、单集群实现
LSF Data Manager的典型单集群实现。 由数据源, LSF 管理 主机,数据管理器主机, I/O 主机和执行主机组成。 每个组件协同工作以完成登台数据和提交具有数据需求的作业的任务。
在这里插入图片描述
1、用户使用带有数据文件需求的 bsub 命令来提交作业,包括数据源主机的名称和所需数据的完整路径。
2、bsub 命令读取有关数据源主机,文件路径,文件大小和上次修改时间 (如果可用) 的信息,并将该信息与作业提交数据一起发送到 LSF 管理 主机。
3、作业请求由 management 主机上的 mbatchd 守护程序接收,这将检测到作业具有输入登台需求。 将主用户作业置于挂起状态 (显示为PEND).
4、LSF 将数据需求信息发送到 LSF 数据管理器,并请求将数据文件复制到登台区域。
5、如果数据文件尚未登台,那么 LSF 数据管理器将请求所需文件的传输作业。 对于为作业创建的每个新文件记录,将向 LSF 提交一个传输作业。
6、LSF 调度和分派传输作业,并将传输作业成功或失败通知 LSF 数据管理器。
7、传输作业将文件数据从源存储库复制到登台区域。 如果数据文件已登台并且位于TRANSFERRED状态,不需要传输作业。
8、如果传输作业成功,那么 LSF 数据管理器会将文件的状态设置为TRANSFERRED。如果传输作业失败,那么 LSF 将终止需要传输作业正在传输的文件的作业。
9、LSF 数据管理器通知 LSF 作业的数据登台步骤已完成。
10、LSF 调度用户作业并将其分派到执行节点。
11、正在运行的用户作业将查找所需数据文件的登台位置,并启动作业执行。 LSF 数据管理器守护程序 (dmd) 确定登台文件在高速缓存中的位置。 用户作业中的 bstage in 命令确定文件在执行环境中的位置。

工作方式2、LSF 多集群功能实现
LSF Data Manager 的典型 LSF 多集群功能 实现具有不是仅远程队列的队列配置。 每个组件协同工作以完成登台数据和提交具有数据需求的作业的任务。
在这里插入图片描述
1、用户使用带有数据文件需求的 bsub 命令将作业提交到本地集群
2、bsub 命令读取有关数据源主机,文件路径,文件大小和上次修改时间 (如果可用) 的信息,并将该信息与作业提交数据一起发送到 LSF 管理 主机。
3、本地 mbatchd 将数据需求信息发送到本地 LSF 数据管理器,并请求将数据文件复制到本地登台区域。 数据需求信息包括作业有资格转发到的候选集群。
如果请求的文件不存在,并且本地集群是该作业的候选者,那么将提交传输作业并将所需文件登台到本地登台区域。

4、如果用户未在作业中指定集群首选项,那么数据管理器将查询候选集群列表中配置的所有远程数据管理器以获取请求的文件。 LSF 数据管理器为作业生成集群首选项。
5、数据管理器在其登台区域当前工作目录中创建一个包含该作业的数据文件信息的文件。
6、将数据登台到本地登台区域后,数据管理器会通知 LSF ,该作业的数据已在本地集群中就绪,因此可以调度该作业。 LSF 将集群首选项附加到作业并正常调度该作业。 如果不需要本地登台,那么将立即执行此步骤。
7、如果在本地调度作业,那么 bstage in 命令将获取所需的文件,并且作业将使用本地登台数据。
8、如果将该作业转发到远程集群,那么将在远程端接受该作业,并且会在远程登台区域上为该作业登台数据,就好像该作业是本地提交的作业一样。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/921273.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在Linux系统中配置代理服务器来加速软件包管理

作为一名专业程序员,我今天要和大家分享一个在Linux系统中配置代理服务器来加速软件包管理的解决方案。如果你经常在Linux上使用软件包管理器(如apt、yum等),但下载速度缓慢,那么本文将给你带来一些操作方法&#xff0…

《基础教育论坛》期刊简介及投稿要求

《基础教育论坛》杂志是经国家新闻出版总署批准、国内外公开发行的综合性教育学术期刊。作者可通过,中华人民共和国新闻出版总署的网站进行出版许可及刊号的查询。 2009年,《基础教育论坛(综合版)》杂志创刊。 2012年&#xff0…

电阻计算公式

我正在「拾陆楼」和朋友们讨论有趣的话题,你⼀起来吧? 拾陆楼知识星球入口

Powershell NTP Server Windows 7,8,10,11,2012,2016,2019,2022

NTP前言 NTP服务器是用来使计算机时间同步化的一种协议,它可以使计算机对其服务器或时钟源(如石英钟、GPS等)做同步化,提供高精准度的时间校正(LAN上与标准间差小于1毫秒,WAN上几十毫秒),且可介由加密确认的方式来防止恶毒的协议1。 ntp 参考 w32tmpowershell参考 参考…

激光雷达的「新」难题

车载激光雷达赛道正在进入关键时刻。 本周,又一家造车新势力—极石汽车旗下首款车型极石01正式对外发布,高阶智驾配置三颗来自禾赛的激光雷达,包括1个128线前向激光雷达和2个侧向纯固态激光雷达。 在此之前,中国市场已经量产交付的…

探索归并排序:分而治之的排序艺术

1. 引言:排序算法的重要性与背景 排序是计算机科学中的基础问题之一,它在各种应用中都得到了广泛的应用,从搜索引擎到数据库管理系统。而归并排序(Merge Sort)作为一种经典的排序算法,通过分治法的思想&am…

Python“牵手”京东工业商品详情数据采集方法,京东工业商数据API申请步骤说明

京东工业平台介绍 京东工业平台是京东集团旗下的一个B2B电商平台,主要面向企业客户提供一站式的采购服务。京东工业平台依托京东强大的供应链和配送能力,为企业用户提供全品类、全渠道、全场景的采购解决方案,涵盖电子元器件、机械配件、办公…

smartbi token回调获取登录凭证漏洞

2023年7月28日Smartbi官方修复了一处权限绕过漏洞。未经授权的攻击者可利用该漏洞,获取管理员token,完全接管管理员权限。 于是研究了下相关补丁并进行分析。 0x01分析结果 依据补丁分析,得到如下漏洞复现步骤 第一步,设置Engi…

java开源 VR全景商城 saas商城 b2b2c商城 o2o商城 积分商城 秒杀商城 拼团商城 分销商城 短视频商城 小程序商城搭建 bbc

​ 1. 涉及平台 平台管理、商家端(PC端、手机端)、买家平台(H5/公众号、小程序、APP端(IOS/Android)、微服务平台(业务服务) 2. 核心架构 Spring Cloud、Spring Boot、Mybatis、Redis 3. 前…

FPGA功能及特点

集成电路芯片包括数字芯片和模拟芯片两大类,数字芯片又分为存储器芯片和逻辑芯片。 逻辑芯片一般包括CPU、GPU、DSP等通用处理器芯片以及专用集成电路芯片ASIC。 FPGA(现场可编程门阵列)就是逻辑芯片的一种。 FPGA功能 FPGA中文名是现场可…

【速成】蓝桥杯嵌入式省一教程:(十)利用共用体进行E2PROM读写

在上一节中我们了解到,AT24C02芯片(E2PROM存储器)内部含有256个8位字节,每一次只能对一个字节进行读写操作。因此,其只能处理unsigned char或uint8_t类型的数据,对于int、float型等大于占用一个字节的数据&…

VMware虚拟机---Ubuntu无法连接网络该怎么解决?

在学习使用Linux系统时,由于多数同学们的PC上多是Windows系统,故会选择使用VMware创建一个虚拟机来安装Linux系统进行学习。 安装完成之后,在使用时总是会遇到各种各样的问题。本片随笔就主要针对可能出现的网络问题进行一个总结,…

2022中国主要城市的绿地数据

绿地是城市生态的重要组成部分,在很多分析中都会用到绿地数据! 本次给大家带来的是中国主要城市的绿地数据!31个城市 该数据是中山大学的石茜等研究者通过深度学习方法,基于GoogleEarth影像和城市边界数据绘制的!数据格式为栅格格式(.tif)。 01 数据预览 我们以北京…

联邦学习:对“数据隐私保护”和“数据孤岛”困境的破局

作者:vivo 互联网安全团队- Tu Daxi 随着计算力、算法和数据量的巨大发展,人工智能迎来第3次发展高潮,开始了各行业的落地探索。然而,在“大数据”兴起的同时,更多行业应用领域中是“小数据”或者质量很差的数据。“数…

php开发websocket笔记(1)

1.运行server1.php文件 Windows命令行运行 php server1.php<?phperror_reporting(E_ALL); set_time_limit(0); //ob_implicit_flush(); $address 0.0.0.0;//可以监听网络上的请求 $address 127.0.0.1;//只能监听本机的请求$port 10005; //创建端口 $socket1 socket_cr…

智能型温湿度传感器在各个行业的广泛应用

在物联网时代&#xff0c;传感器的重要性是不言而喻&#xff0c;各类传感器在不同领域都有着极为重要的应用。如在智能家居领域&#xff0c;现代人们追求高品质舒适生活&#xff0c;对于所处环境要求进一步提升&#xff0c;以环境监测为主的智能家居设备广受追捧。这时候温湿度…

数据库——Redis 常见数据结构以及使用场景分析

文章目录 1. string2. list3. hash4. set5. sorted set 你可以自己本机安装 redis 或者通过 redis 官网提供的在线 redis 环境。 1. string 介绍 &#xff1a;string 数据结构是简单的 key-value 类型。虽然 Redis 是用 C 语言写的&#xff0c;但是 Redis 并没有使用 C 的字符串…

数据分析利器:pandas库的奥秘与代码示例

pandas是Python中一款强大的数据分析库&#xff0c;它提供了数据清洗、数据操作、数据可视化等功能&#xff0c;使得数据分析与处理变得更加高效和便捷。本文将从基本概念、基础知识、高级特性、实战案例和总结五个方面&#xff0c;深入介绍pandas库的用法和技巧。 一、基本概念…

安装Docker并配置镜像加速器、容器

1.安装docker服务&#xff0c;配置镜像加速器 安装软件包 [rootlocalhost ~]# yum install -y yum-utils device-mapper-persistent-data lvm2 设置yum源 [rootlocalhost ~]# yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo…

ZDRE6VP4-1X/50MG24K4V比例压力阀放大器

DRE 6-11/100MG24K4M比、DRE 10-6X/200YMG24K4M、DRE 20-52/200YMG24K4M、DRE 20-6X/200YMG24K4M、ZDRE6VP1-1X/315MG24N9K4M、ZDRE6VP4-1X/50MG24K4V、Z3DRE6VP2-2X/50G24K4M、Z3DRE6VP1-2X/100G24K4M、Z3DRE10VP2-1X/100XYG24K4M、Z3DRE10VP1-1X/315XLG24K4V 功能: 设定值通…