WARP 加速您的 AI 数据存储基础设施

news2024/12/24 8:19:28

你知道一些最好的人工智能模型的秘诀吗?这是他们可以访问的数据量,他们可以接受培训。对于 AI/ML 模型:快速访问数据为王。让我强调一下,这不仅仅是数据,而是快速访问的数据。如果有人可以构建更快、更强大的模型,那么你已经输掉了人工智能竞赛。

在设计 AI 基础设施组件(尤其是数据存储组件)时,当 ML 工程师和数据科学家需要存储机器学习算法并有效管理 MinIO 集群中的可用资源时,确保他们的整体体验至关重要。这确保了快速有效地构建可靠的模型,而不会成为存储基础设施的瓶颈。

AI 基础设施层中需要多个组件,这些组件不仅需要构建 AI 模型,还需要将生成的模型训练并存储在可快速访问的数据存储(如 MinIO)中。ML Ops 的世界正处于 DevOps 的交汇点,并集成了正在以极快速度生成的 ML 模型。在这篇文章中,我们将向您展示如何使用 WARP 衡量 MinIO AI 数据存储基础设施的性能。

WARP 是一款开源全功能 S3 性能评估软件,用于在 WARP 客户端和对象存储主机之间进行测试。WARP 针对 MinIO 集群测量多个客户端的 GET 和 PUT 性能。WARP 具有许多选项,可通过命令行或环境变量进行配置,允许您创建与工作负载一致的测试。我们将快速向您展示如何运行它,以便您可以开始分析您的 AI 数据存储基础设施。

运行和分析 WARP

创建 warp 客户端侦听器以运行分布式 warp 基准测试,在这里我们将它们作为跨客户端节点的有状态集运行。

kubectl apply -f https://raw.githubusercontent.com/minio/warp/master/k8s/warp.yaml

在 warp-job.yaml 中,更新 --warp-clients and --host 标志,以匹配您的集群细节。设置后,按如下方式部署


kubectl apply -f https://raw.githubusercontent.com/minio/warp/master/k8s/warp-job.yaml

WARP 作业完成后,可以在日志中找到状态

kubectl get pods -l job-name=warp-job

NAME             READY   STATUS      RESTARTS   AGE

warp-job-6xt5k   0/1     Completed   0          8m53s


~ kubectl logs warp-job-6xt5k

...

-------------------

Operation: PUT. Concurrency: 256. Hosts: 4.

* Average: 412.73 MiB/s, 12.90 obj/s (1m48.853s, starting 19:14:51 UTC)


Throughput by host:

 * http://minio-0.minio.default.svc.cluster.local:9000: Avg: 101.52 MiB/s, 3.17 obj/s (2m32.632s, starting 19:14:30 UTC)

...


Aggregated Throughput, split into 108 x 1s time segments:

 * Fastest: 677.1MiB/s, 21.16 obj/s (1s, starting 19:15:54 UTC)

 * 50% Median: 406.4MiB/s, 12.70 obj/s (1s, starting 19:14:51 UTC)

 * Slowest: 371.5MiB/s, 11.61 obj/s (1s, starting 19:15:42 UTC)


您还可以将 WARP 设置为执行分布式基准测试。这使您可以使用多个 WARP 客户端以更逼真的方式执行测试,就像现实世界中通常的情况一样。

运行 WARP 时,请确保安装客户端的节点位于专用服务器上,因为如果客户端暴露,则可能会受到 DDoS。此外,避免在生产高峰期运行 WARP,否则最终可能会陷入资源争夺的境地。

可以随机化对象大小,文件将具有“随机”大小,直至精细的对象大小。

对象示例(水平)及其大小,最大 100MB:

当结果被认为是稳定的时,也可以自动终止 WARP。为了检测稳定的设置,Warp 连续将当前数据下采样到当前时间范围内延伸的 25 个数据点。要使基准测试被视为“稳定”,25 个数据点中的最后 7 个必须在指定的百分比内。

从一段时间内的吞吐量来看,它可能看起来像这样

红框显示用于评估稳定性的窗口。盒子的高度由当前速度的阈值百分比决定。

超速前进!

我们鼓励您参阅文档,了解如何执行更多测试方案。例如,您可以启用 TLS 和服务器端加密来衡量它们在环境中的影响。可以通过增加并发测试的数量来增加基础结构的压力。您可以使用对象大小的随机组合,也可以指定与当前环境和工作负载相匹配的对象大小。您可以将测试配置为在定义的时间段内运行或自动终止,就像我们上面所做的那样。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1860095.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

量子计算的崛起:开启计算新纪元

人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…

外贸SEO工具有哪些推荐?

"我们作为一个专业的Google SEO团队,比较推荐一下几个适合外贸SEO的工具。Ahrefs 是一个非常强大的工具,可以帮助你深入分析竞争对手的表现,找到有潜力的关键词,还可以监控你的网站链接状况。另外,SEMrush 也很不…

unity使用XR插件开发SteamVR项目,异常问题解决方法

一、unity使用XR插件开发SteamVR项目,运行后相机高度异常问题解决方法如下操作 (一)、开发环境 1、Unity 2021.3.15f 2、XR Interaction Toolkit Version 2.5.2 (com.unity.xr.interaction.toolkit) 3、OpenXR Pl…

互联网IT公司网站选择科技蓝,从来没让人失望过。

选择科技蓝色作为IT官网的主题颜色有以下好处: 专业感:科技蓝色通常与科技、创新和专业相关联,使用科技蓝色可以给访问者一种专业、可靠的印象,增强品牌形象,特别适合IT行业。技术感:科技蓝色给人一种科技…

现身说法,AI小白的大模型学习过程

导读 写这篇文章的初衷:作为一个AI小白,把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大…

微信小程序笔记 七!

页面配置 1. 页面配置文件的作用 小程序中,每个页面都有自己的 .json 配置文件,用来对当前页面的窗口外观、页面效果等进行配置。 2. 页面配置和全局配置的关系 小程序中,app.json 中的 window 节点,可以全局配置小程序中每个…

AVI 是什么格式,AVI 格式用什么播放器打开?

AVI 是什么格式?提到 AVI 格式想必大家多数会想到在 DVD 横行的年代,光盘中所包含的媒体视频格式多是以 AVI 格式存储。AVI 是一个非常通用的容器格式,支持多种视频和音频编解码器。这意味着从DVD中提取视频内容时,可以通过转码为…

国际网络专线怎么开通?

在全球化日益加速的今天,企业越来越需要稳定、高效的网络来支撑他们的跨国业务。国际网络专线,作为外贸企业、出海企业等拓展全球业务的关键基础设施,其重要性不言而喻。那么,企业如何才能开通国际网络专线呢?本文将详…

嵌入式系统习题库及答案

嵌入式系统习题库及答案 ## 1.选择题 1. 以下哪个不是嵌入式系统的设计的三个阶段之一:(A) A 分析 B 设计 C 实现 D 测试 2. 以下哪个不是RISC架构的ARM微处理器的一般特点:&#xff08…

展厅设计规划都有哪些重要性

1、明确展览目标 在展厅设计上一定要有一个清晰的目标,现在互联网多媒体技术的出现,对于展厅设计有很大的帮助。而获得效益是进行展厅展馆设计的根本意图,在展厅展馆规划过程中需要对展览的目标以及展览的技术手段进行剖析和匹配,…

mysql中存储过过程和游标的联合使用

1.SQL如下: DELIMITER // DROP PROCEDURE IF EXISTS PrintAllEmployeeNames5; CREATE PROCEDURE PrintAllEmployeeNames5() BEGINDECLARE error_count INT DEFAULT 0;DECLARE num INT ;DECLARE done INT DEFAULT 0;DECLARE id1 BIGINT DEFAULT 0;DECLARE address VA…

Mysql----表的约束

提示:以下是本篇文章正文内容,下面案例可供参考 一、表的约束 表的约束:表中一定要有约束,通过约束让插入表中的数据是符合预期的。它的本质是通过技术手段,让程序员插入正确的数据,约束的最终目标是保证…

Word怎么删除空白页?5招轻松删除!

在文字的海洋中遨游,我们时常会遭遇一些“隐形刺客”——它们悄无声息地潜入我们的文档,让原本整洁的页面变得凌乱不堪。这些“刺客”就是Word文档中的空白页,它们可能隐藏在章节的末尾,也可能潜伏在页眉页脚的深处,给…

七天速通javaSE:第一天 入门:Hello,Word与程序运行机制

文章目录 前言一、Hello,Word!1.新建一个文件夹存放代码2.新建一个.java文件3.编写代码 二、编译与运行1.在控制台编译java文件2.运行class文件 三、java程序运行机制1.高级语言的分类1.1 编译型语言1.2 解释型语言 2.程序运行机制 四、IDEA五、代码规范…

Kotlin设计模式:工厂方法详解

Kotlin设计模式:工厂方法详解 工厂方法模式(Factory Method Pattern)在Kotlin中是一种常见的设计模式,用于将对象创建的责任委派给单一的方法。本文将详细讲解这一模式的目的、实现方法以及使用场景,并通过具体的示例…

k8s如何使用 HPA 实现自动扩展

使用Horizontal Pod Autoscaler (HPA) 实验目标: 学习如何使用 HPA 实现自动扩展。 实验步骤: 创建一个 Deployment,并设置 CPU 或内存的资源请求。创建一个 HPA,设置扩展策略。生成负载,观察 HPA 如何自动扩展 Pod…

“拿来主义”学习无限滚动动画(附源码)

欢迎关注:xssy5431 小拾岁月 参考链接:https://mp.weixin.qq.com/s/xVTCwR1ZSn5goWmc2yimVA 动画效果 需求分析 需求中涉及无线滚动,说明需要使用 animation 动画。另外,为了方便用户点击操作,需要给滚动对象添加鼠标…

1.5自然语言的分布式表示-word2vec学习的实现

文章目录 0写在前面1优化器2训练类的构建2.1训练类的初始化2.2训练类的拟合模块2.2.1去重操作remove_duplicate2.2.2反向传播过程2.2.2.1 SoftmaxWithLoss层的反向传播2.2.2.2其它层的反向传播 2.3训练类的损失可视化模块 3训练结果输出 0写在前面 之前的笔记中,我…

USB2.0学习1--基本概念

目录 1.USB概念 2.USB协议发展 3.USB接口类型 3.1 TYPE类型 3.2 Mini类型 3.3 Micro类型 4. USB体系结构和关键概念 4.1 USB工作原理 4.2 USB物理拓扑结构 4.3 USB逻辑拓扑结构 4.4 USB软件架构 4.5 USB数据流模型 4.5.1 USB设备端点 4.5.2 USB管道 4.6 USB即插…

linux中的调试工具gdb

目录 1.背景知识补充 2.使用 知识补充 1.背景知识补充 1.gcc下编译默认是release方式发布的,无法直接进行调试 如果要以debug方式发布,需要携带-g 可以使用grep查询 因为携带debug信息,其文件体积要大一些 2.使用 1.gdb 可执行程序 …