配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

news2024/9/16 17:27:00

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

服务器端配置

在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。

安装 OFED

首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。

sudo apt-get update
sudo apt-get install openib-tools openib-ucm libibverbs1 ibverbs-utils rdma-core
配置 NIC

确保 NIC 已经正确识别并且启用了 InfiniBand 功能。

# 检查 NIC 是否被识别
ibv_devinfo
配置 MTU

为了获得更好的性能,通常需要增加 MTU(最大传输单元)。

# 设置 MTU
ip link set dev <interface> mtu 9000
启用无损以太网

如果使用的是 RoCE,还需要启用无损以太网特性,这通常涉及到 PFC(Priority-Flow Control)和 DCB(Data Center Bridging)。

# 启用 PFC
echo 1 > /sys/class/net/<interface>/pfc/capable
echo 1 > /sys/class/net/<interface>/pfc/enabled

# 启用 DCB
echo 1 > /sys/class/net/<interface>/dcb/priority_flow_control
测试 IB 连接

使用测试工具验证 IB 连接是否正常工作。

# 使用 ibping 测试连接
ibping -d <device> -a <remote_address> -c 100

# 使用 iperf3 测试带宽
iperf3 -s -T
iperf3 -c <server_ip> -T

华为 IB 交换机配置

华为 IB 交换机通常通过命令行界面(CLI)进行配置。以下是一些基本的配置步骤:

登录交换机

首先,通过 SSH 或串口登录到交换机。

ssh admin@<switch_ip>
配置子网管理器

确保子网管理器(SM)已启动并配置好。

# 启动子网管理器
system-view
subnet-manager enable
subnet-manager start
subnet-manager quit
配置端口

配置交换机端口的速度、模式和其他参数。

# 进入系统视图
system-view

# 配置端口速度
interface <port>
speed 100G
quit

# 配置端口模式
interface <port>
port-type ib
quit
配置 QoS

配置 QoS 策略,以确保不同类型的流量得到合理的优先级处理。

# 配置端口 QoS
traffic-policy <policy_name> inbound
traffic-policy <policy_name> outbound
配置 VLAN

如果使用 VLAN 来隔离不同类型的流量,需要在交换机上配置 VLAN。

# 创建 VLAN
vlan <vlan-id>

# 将端口加入 VLAN
interface <port>
port access vlan <vlan-id>
quit
监控网络状态

使用交换机的监控工具来实时查看网络状态和性能指标。

display interface <port>
display dcb

综合配置和测试

在完成服务器端和交换机端的配置后,需要进行一些综合性的配置和测试,以确保整个网络正常运行:

测试网络连通性

使用 ibpingiperf3 等工具测试节点之间的连通性和带宽。

ibping -d <device> -a <remote_address> -c 100
iperf3 -s -T
iperf3 -c <server_ip> -T
性能优化

根据测试结果调整网络参数,如 MTU、队列深度等,以优化性能。

# 调整 NIC 上的队列深度
echo 128 > /sys/class/infiniband/<device>/ports/1/max_qp_depth
故障排查

使用日志和监控工具进行故障排查。

dmesg | grep mlx5
display diagnostic-information

注意事项

  • 在配置过程中,确保所有节点的时间同步(如使用 NTP)。
  • 监控网络性能和健康状况,及时调整配置以优化性能。
  • 根据具体的应用需求,可能还需要配置其他相关的软件和服务,如存储服务、数据库等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2116403.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式学习[5]---装饰模式

文章目录 前言1. 原理阐述2. 举例2.1 人装饰方案一2.2 人装饰方案二2.3 人装饰方案三 总结 前言 近期在给一个已有的功能拓展新功能时&#xff0c;基于原有的设计类图进行讨论。其中涉及到了装饰模式&#xff0c;因为书本很早已经看过一遍&#xff0c;所以谈及到这个名词的时候…

Unity Adressables 使用说明(一)概述

使用 Adressables 组织管理 Asset Addressables 包基于 Unity 的 AssetBundles 系统&#xff0c;并提供了一个用户界面来管理您的 AssetBundles。当您使一个资源可寻址&#xff08;Addressable&#xff09;时&#xff0c;您可以使用该资源的地址从任何地方加载它。无论资源是在…

php转职golang第二期

以下是一份简单的 Go 基本语法笔记&#xff1a; 变量与常量&#xff1a; • var 声明变量。• const 声明常量。数据类型&#xff1a; • 整型、浮点型、布尔型、字符串型等。流程控制&#xff1a; • if-else 语句。• for 循环。函数&#xff1a; • 定义和调用函数。数…

【Hot100】LeetCode—394. 字符串解码

目录 1- 思路栈实现四种情况处理 2- 实现⭐394. 字符串解码——题解思路 3- ACM 实现 原题链接&#xff1a;394. 字符串解码 1- 思路 栈实现四种情况处理 ① 遇到数字&#xff0c;进行倍数相加 、②遇到左括号&#xff0c;压栈之前的元素、③遇到右括号弹出&#xff0c;栈进行…

DFS 算法:洛谷B3625迷宫寻路

我的个人主页 {\large \mathsf{{\color{Red} 我的个人主页} } } 我的个人主页 往 {\color{Red} {\Huge 往} } 往 期 {\color{Green} {\Huge 期} } 期 文 {\color{Blue} {\Huge 文} } 文 章 {\color{Orange} {\Huge 章}} 章 DFS 算法&#xff1a;记忆化搜索DFS 算法&#xf…

理解分类器(linear)为什么可以做语义方向的指导?(解纠缠)

Attribute Manipulation&#xff08;属性编辑&#xff09;、disentanglement&#xff08;解纠缠&#xff09;常用的两种做法&#xff1a;线性探针和PCA_disentanglement和alignment-CSDN博客 在解纠缠的过程中&#xff0c;有一种非常简单的方法来引导G向某个方向进行生成&…

【Android】使用和风天气API获取天气数据吧!(天气预报系列之一)

【Android】使用和风天气API获取天气数据吧&#xff01;&#xff08;天气预报系列之一&#xff09; 古话说得好&#xff0c;要有天气预报&#xff0c;首先需要有天气&#xff0c;和预报。 今天给大家介绍一个好用的天气预报API&#xff1a;和风天气。以及webAPI的使用方法~&a…

【H2O2|全栈】关于HTML(3)HTML基础(二)

HTML相关知识 目录 HTML相关知识 前言 准备工作 标签的具体分类&#xff08;二&#xff09; 本文中的标签在什么位置使用&#xff1f; 本期前置知识点 超文本 超文本引用和源属性 图片标签 锚链接 iframe 锚点 预告和回顾 后话 前言 本系列博客将分享HTML相关…

JavaWeb后端开发总结(3)

AOP基础 AOP概述 首先我们要知道AOP是什么&#xff1f; 看下图 个人解析&#xff1a; AOP叫做面向切面编程&#xff0c;但是实际上就是面向方法编程 图中下面一部分是一个AOP的案例 AOP快速入门案例代码实现 案例&#xff1a;测出业务中各个业务方法所需的执行时间 如果…

怎么利用NodeJS发送视频短信

随着5G时代的来临&#xff0c;企业的数字化转型步伐日益加快&#xff0c;视频短信作为新兴的数字营销工具&#xff0c;正逐步展现出其大的潜力。视频群发短信以其独特的形式和内容&#xff0c;将图片、文字、视频、声音融为一体&#xff0c;为用户带来全新的直观感受&#xff0…

单片机DMA原理及应用详解(上篇)(附工程源码)

这篇文章详细介绍单片机的DMA原理和应用范例。希望我的分享能给你带来不一样的收获&#xff01; 目录 一、DMA简介 二、DMA原理 三、DMA中断 1. DMA中断的工作原理 2. DMA中断的优点 3. DMA中断的配置和处理 4. 应用场景 四、结语 一、DMA简介 1、DMA&#xff08;D…

数据分析训练模型后输出模型评估报告

数据分析训练模型后输出模型评估报告 1、模型评估指标 1.1、概念: A:n个正样本,检测到是真值的数量 B:m个负样本,检测到是真值的数量 C:n个正样本,检测到假值的数量 D:m个负样本,检测到假值的数量 1.2、准确率(Accuracy) 正确预测的样本数量与总样本数量的比值。…

轨迹规划-B样条

B样条究竟是干啥的&#xff1f;白话就是给出一堆点&#xff0c;用样条的方式&#xff0c;给这些点连接起来&#xff0c;并保证丝滑的。 同时B样条分为准均匀和非均匀&#xff0c;以下为准均匀为例。 参考链接1&#xff1a;https://zhuanlan.zhihu.com/p/50626506https://zhua…

IP宿主信息在不同领域的广泛应用

在网络世界中&#xff0c;IP地址作为网络设备的唯一标识&#xff0c;扮演着至关重要的角色。而IP宿主信息&#xff0c;通过IP与POI/AOI信息关联&#xff0c;能够帮助用户了解特定IP地址所属的详细信息。本文将深入探讨IP宿主信息在不同领域的广泛应用。 什么是IP宿主信息&…

汽车功能安全--TC3xx之PBIST、MONBIST

目录 1.PMS 电源监控速览 2.PBIST 3.MONBIST 4.小结 1.PMS 电源监控速览 英飞凌TC3xx芯片的四种硬件机制&#xff0c;分别是&#xff1a; PMS:PBIST: Power Built-in Self Test. MCU:LBIST: Logic Built-in Self Test. PMS:MONBIST: Monitor Built-in Self Test. VMT:MBI…

嵌入式基础1-模拟电路技术-3.放大电路

1. 基本放大电路 1. 放大概念与放大电路性能指标 2. 基本共射放大电路工作原理 3. 放大电路的分析方法 阻容耦合 4.案例 2. 多级放大电路 1. 多级放大电路的耦合方式 2. 多级放大电路动态分析 3. 差分放大电路 3. 集成运算放大电路 4. 放大电路的反馈 1. 反馈的基本概念…

云计算第四阶段----CLOUD 01-03

CLOUD Day01 一、虚拟化平台搭建 虚拟化技术产品介绍 #黄线标注的&#xff0c;都是比较主流且常用的虚拟化平台。 虚拟化与云计算的关系 虚拟化是一种技术&#xff0c;它允许在单个物理服务器上创建和运行多个虚拟机&#xff08;VMs&#xff09;&#xff0c;每个虚拟机都有其…

二叉树的相关选择题和基本方法(持续更新)

二叉树相关选择题和基本方法 选择题1选择题2选择题3选择题4选择题5选择题6选择题7选择题8选择题9选择题10选择题11选择题12选择题13选择题14选择题15选择题16选择题17选择题18选择题19选择题20选择题21选择题22实现二叉树的基本操作查询二叉树当中节点的个数遍历思想子问题思想…

[数据集][图像分类]熊分类数据集309张5类别黑熊泰迪北极熊等

数据集格式&#xff1a;仅仅包含jpg图片&#xff0c;每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数)&#xff1a;309 分类类别数&#xff1a;5 类别名称:["black","grizzly","panda","polar","teddy"] 每个类别图…

大数据之Flink(五)

15、Flink SQL 15.1、sql-client准备 启用Hadoop集群(在Hadoop100上) start-all.sh启用yarn-session模式 /export/soft/flink-1.13.0/bin/yarn-session.sh -d启动sql-client bin/sql-client.sh embedded -s yarn-sessionsql文件初始化 可以初始化模式、环境&#xff08;流/批…