MinIO 的 S3 over RDMA 计划: 为高速人工智能数据基础设施设定对象存储新标准

news2024/11/20 0:22:34

随着 AI 和机器学习的需求不断加速,数据中心网络正在迅速发展以跟上步伐。对于许多企业来说,400GbE 甚至 800GbE 正在成为标准选择,因为数据密集型和时间敏感型 AI 工作负载需要高速、低延迟的数据传输。用于大型语言处理、实时分析和计算机视觉等任务的 AI 模型需要处理大量数据,并几乎立即在存储和计算节点之间移动。传统的网络速度根本不足以处理这些工作负载所需的数据吞吐量。这种向 400GbE/800GbE 的转变是支持依赖大量分布式数据集的 AI 应用程序的自然演变,这些数据集通常跨 GPU 集群或专用加速器进行处理。然而,随着网络速度的提高,TCP/IP 等传统协议难以保持效率,由于 CPU 开销和延迟高而造成瓶颈。通过将其 S3 功能与 RDMA 保持一致,MinIO 正在开拓新的方法来满足现代 AI 工作负载的性能和可扩展性要求,同时也使客户能够无缝过渡到更高速的网络标准。这种对 S3 over RDMA 的前瞻性支持扩展了 MinIO 在构建针对未来优化的 AI 就绪数据基础设施的企业中的领导地位。S3 over RDMA 功能在新的 AIStor 中可用。

什么是 RDMA?

远程直接内存访问 (RDMA) 允许绕过 CPU、操作系统和 TCP/IP 堆栈,直接在两个系统的内存之间移动数据。这种直接内存访问减少了与 CPU 和操作系统处理数据相关的开销和延迟,使 RDMA 对于低延迟、高吞吐量网络特别有价值。

为什么随着我们向 800GbE 迈进,以及 AI 基础设施的联网范围,RDMA 变得更加重要

随着对更快数据访问的需求不断增加,400GbE/800GbE 网络将成为 AI 数据基础设施的支柱。虽然 TCP/IP 多年来一直支持以太网的发展,但它却难以满足超高速网络的要求,原因如下:

  • CPU 瓶颈:TCP/IP 严重依赖 CPU 来处理数据包处理、重组和流控制等任务。在 800GbE 时,数据包的庞大数量和速度可能会使 CPU 不堪重负,从而造成性能瓶颈。

  • 延迟和抖动:TCP/IP 通过多个层(应用程序、传输、网络、链接)处理数据,从而增加延迟。缓冲、重传和数据包重组会进一步增加延迟和抖动,而这些延迟和抖动会随着速度的提高而被放大。

  • 内存带宽限制:TCP/IP 在用户和内核空间之间传输数据,添加多个内存副本。在 800GbE 时,这会使内存带宽紧张,从而进一步降低性能。

RDMA 已成为处理海量数据流并在这些速度下最大限度地减少 CPU 开销的关键技术。RDMA 通过以下方式解决了 TCP/IP 在高速网络中的限制:

  • 直接内存访问:RDMA 绕过内核和 CPU,通过允许内存到内存的数据传输来减少延迟。

  • 零拷贝数据传输:数据直接从一个应用程序的内存移动到另一个应用程序的内存,无需中间缓冲,从而提高效率。

  • CPU 卸载:RDMA 将网络处理卸载到 NIC,从而释放 CPU 资源。

  • 高效的流量控制:RDMA 基于 NIC 的流量控制比 TCP 的拥塞控制更快,使用的 CPU 周期更少,从而实现更稳定的高速性能。

以太网势在必行,RDMA 的优势传统上仅限于使用 InfiniBand 的高性能计算 (HPC) 环境,长期以来一直受到低延迟、高吞吐量应用程序的青睐。然而,以太网已成为 AI 和其他数据密集型工作负载的首选,原因如下:

  • 成本和无处不在:以太网具有成本效益且广泛兼容,而 InfiniBand 需要专门的硬件和专业知识。以太网的跨平台通用兼容性使其更易于实施,尤其是在集成 RoCE 的情况下。

  • RoCE 标准化:基于融合以太网的 RDMA (RoCE) 为以太网带来了 RDMA 的优势,在熟悉的可扩展基础设施上支持低延迟、高吞吐量的数据传输。

  • 多功能性:与通常用于专用环境的 InfiniBand 不同,以太网支持单个网络基础设施上的一系列工作负载。对于 AI 和数据分析环境,以太网提供了灵活性,而无需单独的网络架构。

对于希望其 AI 数据基础设施面向未来的公司来说,以太网(尤其是支持 RDMA 的 RoCE)是平衡性能与成本效益的合理选择。

S3 over RDMA:面向未来的 AI 部署,满足未来的网络标准

随着 AI 网络基础设施的发展,MinIO 通过 RDMA 集成 S3 为需要快速、可靠数据访问的 AI 工作负载提供了必要的超低延迟和高吞吐量,尤其是在模型训练和推理期间。这有助于:

  • 减少延迟:借助 RDMA 的内存到内存数据传输,S3 GET 和 PUT 请求的处理延迟最小,从而在 AI 训练和分析工作流中实现更快的数据检索。

  • 提高吞吐量:RDMA 允许 MinIO 在没有 CPU 瓶颈的情况下处理更多的并行数据传输,这在 GPU 密集型 AI 环境中至关重要。

  • 效率提升:通过将数据处理卸载到支持 RDMA 的 NIC,MinIO 降低了 CPU 使用率,使组织能够将更多资源集中在 AI 模型训练和分析上。

  • 与未来以太网标准的兼容性:RDMA 提供了实现 TB 级以太网速度的途径,使 MinIO 的 S3 解决方案可以随着网络技术的进步而扩展。

  • 成本效益:通过减少对 CPU 的依赖,RDMA 降低了能源和运营成本,这在组织扩展其数据基础设施时尤为有价值。

借助 S3 over RDMA,MinIO 提供了一个强大的、面向未来的对象存储平台,符合数据中心网络的最高标准。

结论

MinIO 支持 S3 over RDMA 的举措是对现代高速网络环境需求的前瞻性响应。通过在熟悉的 S3 框架中利用 RDMA 的低延迟、高吞吐量功能,MinIO 使客户能够充分利用其 400GbE 和 800GbE 以太网投资,提供快速、可扩展且高效的存储解决方案。对于希望面向未来的 AI 和数据密集型工作负载的企业,MinIO 的 S3 over RDMA 可确保其基础设施能够满足未来的需求,从而将 MinIO 定位为下一代网络时代高性能对象存储的明确选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2243706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怀旧游戏打卡清单(TODO)

感觉忙碌了好久好久,真的好想休息一下。。 整理一下将来休息时候的打卡清单,不工作了去个海边狂打游戏,想想就惬意啊。当然,最好找个work from home,去海边找个酒店上班。挣钱休息两不误。。。 能不能实现另说&#xf…

《Python制作动态爱心粒子特效》

一、实现思路 粒子效果: – 使用Pygame模拟粒子运动,粒子会以爱心的轨迹分布并运动。爱心公式: 爱心的数学公式: x16sin 3 (t),y13cos(t)−5cos(2t)−2cos(3t)−cos(4t) 参数 t t 的范围决定爱心形状。 动态效果: 粒子…

使⽤MATLAB进⾏⽬标检测

目录 数据准备定义模型并训练用测试集评估性能推理过程⼀⾏代码查看⽹络结构⼀⾏代码转onnx结语 ⼈⽣苦短,我⽤MATLAB。 Pytorch在深度学习领域占据了半壁江⼭,最主要的原因是⽣态完善,⽽且api直观易⽤。但谁能想到现在MATLAB⽤起来⽐Pytorch…

word-毕业论文的每一章节的页眉单独设置为该章的题目怎么设置

在Microsoft Word中,为毕业论文的每个章节设置不同的页眉,通常需要使用“分节符”来分隔各个章节,然后在每个章节中单独设置页眉。以下是详细步骤: 使用分节符 插入分节符: 将光标放在每个章节的末尾(注意…

【简历】25届江苏二本JAVA简历:本末倒置,重点部分格式错误,不重要的写了一堆

简历总体说明 校招的第一法则就是必须要确定校招层次。 开发岗分为大中小厂,不同的层次对学校背景、时间点、项目和考点的要求都不太一样,所以必须要确定就业的层次。 这是一个25届二本同学的JAVA简历。 最近不知道怎么回事,看两份简历都…

字母异位词分组(java)

题目描述 给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 字母异位词 是由重新排列源单词的所有字母得到的一个新单shilie 示例 1: 输入: strs ["eat", "tea", "tan", "ate", "n…

fpga spi回环

SPI设备间的数据传输之所以又被称为数据交换,是因为 SPI协议规定一个 SPI设备 不能在数据通信过程中仅仅只充当一个"发送者(Transmitter)“或者"接收者 (Receiver)”.在每个 Clock 周期内,SPI 设备都会发送并接收一个 bit 大小的数据(不管主 设备好还是从设备),相当于…

计算机网络-理论部分(二):应用层

网络应用体系结构 Client-Server客户-服务器体系结构:如Web,FTP,Telnet等Peer-Peer:点对点P2P结构,如BitTorrent 应用层协议定义了: 交换的报文类型,请求or响应报文类型的语法字段的含义如何…

路由器基本原理与配置

一 , 路由是什么? 从源主机到目标主机的转发过程; 二 , 路由器 (1)路由器的工作原理 路由器是一种三层设备,是使用IP地址寻址,实现从源IP到达目标IP地址的端到端的服务&#xff0c…

windows的WSL Ubuntu子系统重置root或其他用户的密码

思路:以管理员身份运行PowerShell,在命令行窗口重置密码 ,不需要删除或重新安装Linux子系统。 1、以管理员身份运行PowerShell 2、用root用户启动Ubuntu,执行 wsl.exe --user root 3、重置密码,执行passwd username&…

autoDL微调训练qwen2vl大模型

autodl是一家GPU服务厂商,提供专业的GPU租用服务,秒级计费、稳定好用 先去autodl把官方的帮助文档看懂先 AutoDL帮助文档 autodl注册并登陆,充钱,根据自己的情况租用新实例 创建新实例后马上关机,因为有个省钱的办法…

9.2 使用haarcascade_frontalface_default.xml分类器检测视频中的人脸,并框出人脸位置。

1)程序代码: # 2.使用haarcascade_frontalface_default.xml分类器检测视频中的人脸,并框出人脸位置 import cv2# 加载人脸检测的 Haar 级联分类器 face_cascade cv2.CascadeClassifier(./data/haarcascades/haarcascade_frontalface_defaul…

K8S containerd拉取harbor镜像

前言 接前面的环境 K8S 1.24以后开始启用docker作为CRI,这里用containerd拉取 参考文档 正文 vim /etc/containerd/config.toml #修改内容如下 #sandbox_image "registry.aliyuncs.com/google_containers/pause:3.10" systemd_cgroup true [plugins.…

ARM64环境部署EFK8.15.3收集K8S集群容器日志

环境规划 主机IP系统部署方式ES版本CPU架构用户名密码192.168.1.225Ubuntu 22.04.4 LTSdockerelasticsearch:8.15.3ARM64elasticllodyi4TMmZD ES集群部署 创建持久化目录(所有节点) mkdir -p /data/es/{data,certs,logs,plugins} mkdir -p /data/es/certs/{ca,es01}服务器…

前端小练习——星辰宇宙(JS没有上限!!!)

前言:在刚开始学习前端的时候,我们会学习到前端三件套中的JavaScript,可能那时候读者没有觉得JavaScript这个语言有多么的牛逼,本篇文章将会使用一个炫酷的案例来刷新你对JavaScript这个语言的认知与理解。 ✨✨✨这里是秋刀鱼不做…

图文教程 | 2024年IDEA安装使用教程,JDK简易下载方法

前言 📢博客主页:程序源⠀-CSDN博客 📢欢迎点赞👍收藏⭐留言📝如有错误敬请指正! 目录 一、IDEA安装 二、激活 三、JDK安装 四、JDK环境配置 五、验证 一、IDEA安装 进入官网下载: Other…

【阅读记录-章节2】Build a Large Language Model (From Scratch)

目录 2.Working with text data2.1 Understanding word embeddings2.2 Tokenizing text通过一个简单的实验来理解文本的词元化概念关键概念 2.3 Converting tokens into token IDs实现分词器类(Tokenizer Class)应用分词器测试文本的编码与解码通过分词器…

已有docker增加端口号,不用重新创建Docker

已有docker增加端口号,不用重新创建Docker 1. 整体描述2. 具体实现2.1 查看容器id2.2 停止docker服务2.3 修改docker配置文件2.4 重启docker服务 3. 总结 1. 整体描述 docker目前使用的非常多,但是每次更新都需要重新创建docker,也不太方便&…

网页作业9

<!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>服务中心</title><style>* {margin:…

HTML and CSS Support HTML 和 CSS 支持

GoTo DevExpress Data Grid 数据网格 HTML and CSS Support HTML 和 CSS 支持 HTML和CSS支持允许您创建完全自定义的UI元素&#xff0c;并消除使用基于属性的UI自定义和CustomDraw事件。您可以构建 HTML 格式的 UI&#xff0c;并使用 CSS 样式自定义 UI 元素的外观设置、大小、…