IBM Spectrum LSF Session Scheduler(会话调度程序)提高总体集群利用率和系统性能

news2024/7/4 5:44:14

 IBM Spectrum LSF Session Scheduler 提高总体集群利用率和系统性能

LSF Session Scheduler 使用户能够使用作业级任务调度程序在单个 LSF 作业的分配中运行短期任务的大型集合,该调度程序为作业分配一次资源,并对每个任务复用已分配的资源。 LSF Session Scheduler 实现了分层的个人调度范式,可提供非常低的延迟执行。 由于每个作业的等待时间非常短,因此 LSF Session Scheduler 非常适合执行非常短的作业,无论这些作业是任务列表还是具有参数执行的作业数组。

虽然传统的 LSF 作业提交,调度和分派方法 (例如,作业数组或作业块) 非常适合长时间和短时间运行的作业或具有相互依赖关系的作业的组合,但 LSF Session Scheduler 是具有短时间运行时间的大量独立作业的理想选择。

随着集群的增长和工作负载量的增加,委派调度决策的需求也会增加。 LSF Session Scheduler 支持将多个任务作为单个 LSF 作业提交,从而提高 LSF 调度程序的吞吐量和性能。

每个 LSF Session Scheduler 都以类似于并行作业的方式动态调度。 然后, ssched 命令的每个实例在其分配的工作负载中管理其自己的工作负载。 工作作为任务数组或任务定义文件提交。

LSF Session Scheduler 满足运行大量短作业的以下目标:

 - 最大限度减少调度短作业时的等待时间; 
 - 提高总体集群利用率和系统性能;
 -  根据 LSF 策略分配资源 ;
 - 支持现有 LSF执行前,执行后程序,作业启动程序,资源限制等; 
 - 每个用户处理数千个用户和超过 50000 个短作业。

系统需求

支持的操作系统

LSF Session Scheduler 在以下分发版中交付:

  • lsf10.1.0_ssched_lnx26-libc23-x64.tar.Z

所需的库

注: 缺省情况下,所有 Linux 发行版都可能未安装这些库。

在 Linux 2.6 (x86_64) 上,需要以下外部库:

  • libstdc++.so.6
  • libpthread-2.3.4.so 或更高版本

兼容的 Linux 发行版

经认证的兼容发行版包括:

  • Red Hat Enterprise Linux AS 3 或更高版本
  • SUSE Linux Enterprise Server 10

IBM Spectrum LSF

LSF Session Scheduler 随附于 IBM Spectrum LSF Advanced Edition ,并作为 IBM Spectrum LSF的其他版本的附加组件提供:

  • 如果要使用 IBM Spectrum LSF Advanced Edition,请从与 IBM Spectrum LSF Advanced Edition 分发包相同的下载页面下载 LSF Session Scheduler 分发包。
  • 如果要使用其他版本的 IBM Spectrum LSF,请购买 LSF Session Scheduler 作为单独的附加组件,然后从 LSF Session Scheduler 下载页面下载分发包。

LSF Session Scheduler 术语

作业

由 mbatchd 和 mbschd 单独调度并分派到 sbatchd 的传统 LSF 作业

任务

类似于作业,用于描述可执行文件及其在执行节点上运行的环境的工作负载单元。 任务由 LSF Session Scheduler管理和分派。

作业会话

LSF 作业,由 mbatchd单独调度,但未作为 LSF 作业进行分派。 相反,正在运行的 LSF Session Scheduler 作业会话表示用于运行大量任务集合的节点分配

调度程序

在为作业会话分配的节点中接受和分派任务的组件。

体系结构

当 LSF 会话调度程序开始运行时,它将在其分配中的每个主机上启动一个执行代理程序。

将提交,调度和分派 LSF Session Scheduler 个作业 (如正常 LSF 个作业)。

当 LSF Session Scheduler 开始运行时,它将在其分配中的每个主机上启动一个 LSF Session Scheduler 执行代理程序。

然后, LSF Session Scheduler 将读取任务定义文件,该文件包含要运行的任务的列表。 任务将发送到执行代理程序并运行。 任务完成后,列表中的下一个任务将分派到可用主机。 这将一直持续到所有任务都已运行。

通过 LSF Session Scheduler 提交的任务会绕过 LSF mbatchd 和 mbschd。 LSF mbatchd 无法识别个别任务。

组件

LSF Session Scheduler 包含以下组件。

LSF Session Scheduler 命令 (ssched)

ssched 命令接受并分派为作业会话分配的节点中的任务。 它读取任务定义文件并将任务发送到执行代理程序。 ssched 还会记录错误,执行任务记帐以及根据需要重新排队任务。

sservice 和 sschild

这些组件是执行代理程序。 它们在分配中的每个远程主机上运行。 他们设置任务执行环境,运行任务,并启用任务监视和资源使用情况收集。

性能

已测试 LSF Session Scheduler 以支持多达 50,000 个任务。 根据性能测试,最佳最大分配大小 (由 bsub -n指定) 取决于任务的平均运行时。 以下是一些典型结果:


平均运行时 (秒)

建议的最大分配大小 (槽)

012
564
15256
30512

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1149126.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

css position属性与js滚动

“视口”就是浏览器窗口中实际显示文档内容的区域,不包含浏览器的“外框”,如菜单、工具条和标签。文档则是指整个网页。 1 css 的position static 正常定位,是元素position属性的默认值,元素遵循常规流。 relative 相对定位&…

什么是 CNN? 卷积神经网络? 怎么用 CNN 进行分类?(3)

参考视频:https://www.youtube.com/watch?vE5Z7FQp7AQQ&listPLuhqtP7jdD8CD6rOWy20INGM44kULvrHu 视频7:CNN 的全局架构 卷积层除了做卷积操作外,还要加上 bias ,再经过非线性的函数,这么做的原因是 “scaled p…

SpringCloud 微服务全栈体系(八)

第九章 Docker 二、Docker 的基本操作 1. 镜像操作 1.1 镜像名称 镜像的名称组成: 镜像名称一般分两部分组成:[repository]:[tag]。在没有指定 tag 时,默认是 latest,代表最新版本的镜像 比如:mysql 就是 reposito…

Linux — vim编辑器的操作

目录 1. vim的整体操作2. 命令模式下的常见命令3. 底行模式下的常见命令结语 1. vim的整体操作 我们使用 touch 创建一个文件之后,直接 vim 文件名 就能够进入到vim编辑器中。如果vim 文件名的文件还不存在时,vim会自动创建该文件,但需要保存…

中山大学计算机学院2024届推免拟录取及分析

拟录取名单: 分析 中山大学计算机学院2023年共录取推免生245人,其中 计算机科学与技术(学硕)录取245人,计算机技术(专硕)录取58人,计算数学录取11人。 很明显可以看出,学…

C++笔记-RTTR编译安装简单使用

这里以Linux为例,我使用的机器的gcc版本是4.9.2 使用的RTTR的版本是0.9.5 编译&安装 首先在官网将rttr的0.9.5版本下载下来。 Home |RTTR 按照官方的安装流程: 但这里可能会出现一个问题: 按照解答,切换成root用户&#x…

医学手术麻醉临床信息系统源码

手术麻醉临床信息系统遵循“以病人为中心、服务于临床”的宗旨,使医护人员从繁琐的病历书写中解放出来,集中精力关注病人的诊疗,将更多的时间用于分析、诊断。以服务围术期临床业务工作的开展为核心,为医护人员、业务管理人员、院…

高级工技能等级认定---网络设备安全

目录 一、DHCP 安全配置 二、SSH配置 三、标准ACL的配置 四、配置交换机端口安全 五、三层交换和ACL的配置 一、DHCP 安全配置 配置要求: 1.给交换机配置enable密码. 2.在交换机上创建VLAN 100,将F0/1-3口改为Access口,并加入到VLAN …

【LeetCode刷题-哈希】--706.设计哈希映射

706.设计哈希映射 class MyHashMap {private class Pair{private int key;private int value;public Pair(int key ,int value){this.key key;this.value value;}public int getKey(){return key;}public int getValue(){return value;}public void setValue(int value){this…

Win10安装WSL2和ubuntu

目录 一、win10系统设置 二、安装WSL 三、win10中ubuntu迁移到D盘 四、在vscode中访问ubuntu 在win10中安装WSL2虚拟机,然后安装ubuntu,最后使用vscode连接ubuntu。教程适用于: ubuntu22.04ubuntu20.04ubuntu18.04 一、win10系统设置 …

大型微服务架构智慧工地云平台源码(SaaS模式)

智慧工地云平台建设是采用先进的移动互联、物联网、云计算、大数据等新一代信息技术,主要由信息采集层、网络接入层、网络传输层、信息储存与处理层组成,主要包括云管理平台、综合管理系统、质量管理系统、安全管理系统等模块。施工管理人员可通过PC端&a…

欧姆龙PLC与上位机通讯说明

欧姆龙PLC与上位机连接时一般采用的是Hoslink协议,它是一种简易经济的通讯方式,比较适合一台上位机和一台PLC或者多台PLC进行通讯。上位机可对漂亮C进行程序传送和读写等操作。HOSTLINK系统允许一台上位机通过上位机链接命令向HOSTLINK系统的PLC发送命令…

MyBatis-Plus 实战教程三 拓展插件

文章目录 扩展功能代码生成安装插件使用 静态工具逻辑删除通用枚举定义枚举配置枚举处理器测试 JSON类型处理器定义实体使用类型处理器 仓库地址 扩展功能 代码生成 在使用MybatisPlus以后,基础的Mapper、Service、PO代码相对固定,重复编写也比较麻烦。…

鸿蒙开发第一步-入门

本人安卓开发小趴菜一枚,在现公司做中控产品,目前通过 Java,Kotlin开发,但是随着后面可能会用到华为产品(后续华为可能不支持安卓)做中控设备,所以在领导的建议下,入手鸿蒙开发。 先说下中控产品吧,以pad开…

线扫相机DALSA-相机平场矫正详细步骤

在相机视野下铺放白色亚克力板或纯白纸,采集图像。打开曲线图。 选择 Line Profile 模式。调节好相应所需的曝光时间、光源、增益和镜头光圈,让白平衡纸显示出来的灰度值大概在 150-200 左右。 在Calibration Algorithm 中将显示的数值设置好。 先暗场…

NodeJS回调地狱及Promise优化

NodeJS中有很多异步API,比如常见的fs模块的readFile方法。虽然有同步的版本readFileSync, 但是其性能肯定不如前者。所以这里从异步异步版本readFile说起: const fs require(fs);fs.readFile(./a.txt, utf-8, function(error, data) {if (!error) {console.log(a.…

目标检测理论知识

目标检测 1.基本概念 目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,…

【Linux】深入理解系统文件操作(1w字超详解)

1.系统下的文件操作: ❓是不是只有C\C有文件操作呢?💡Python、Java、PHP、go也有,他们的文件操作的方法是不一样的啊 1.1对于文件操作的思考: 我们之前就说过了:文件内容属性 针对文件的操作就变成了对…

AI:43-基于深度学习的昆虫图像识别

🚀 本文选自专栏:AI领域专栏 从基础到实践,深入了解算法、案例和最新趋势。无论你是初学者还是经验丰富的数据科学家,通过案例和项目实践,掌握核心概念和实用技能。每篇案例都包含代码实例,详细讲解供大家学习。 📌📌📌本专栏包含以下学习方向: 机器学习、深度学…

AI:42-基于机器学习方法下以沙发为例的家具风格识别技术研究

🚀 本文选自专栏:AI领域专栏 从基础到实践,深入了解算法、案例和最新趋势。无论你是初学者还是经验丰富的数据科学家,通过案例和项目实践,掌握核心概念和实用技能。每篇案例都包含代码实例,详细讲解供大家学习。 📌📌📌本专栏包含以下学习方向: 机器学习、深度学…