【问题处理】银河麒麟操作系统实例分享,鲲鹏服务器GaussDB测试ping延迟过高问题

news2025/1/20 3:52:27

1.问题环境

系统环境

物理机

网络环境

私有网络

硬件环境

机型

TaiShan 200 (Model 2280) (VD)

处理器

HUAWEI Kunpeng 920 5250

内存

32GB*16

显卡

主板型号

BC82AMDDRE

架构

ARM

固件版本

iBMC固件版本 3.03.00.31 (U82)   单板ID 0x00a9 BIOS版本 1.89 (U75)   主板厂商 Huawei CPLD版本 6.06 (U6076)   主板型号 BC82AMDDRE iBMC主UBoot版本 13.5.10.1  (11:57:29 Apr 19 2022)   主板序列号 102286080977 iBMC备UBoot版本 13.5.10.1  (11:57:29 Apr 19 2022)   PCB 版本 .D 部件编码 0302020417

系统硬盘

SSD 2.911TB

软件环境

操作系统版本

Kylin Linux Advanced Server V10 (SP2)

内核版本

Kernel:4.19.90-24.4.v2101.ky10.aarch64

第三方软件

GaussDB

2.问题描述

数据库无压力测试时,网络时延正常,有压力测试时,网络时延不稳当。

3.问题分析

3.1.查看系统信息

可见内核版本为4.19.90-23.8.v2101.ky10.aarch64

3.2.查看CPU信息

查看CPU情况,共96个CPU核心。分了4个numa节点。node0包含CPU0-23。

cat /sys/class/net/enp125s0f0/device/numa_node可见enp125s0f0在numa node 0上,所以网卡enp125s0f0在numa node 0上的CPU上运行,性能更好。

cat /sys/class/net/enp125s0f0/device/local_cpulist,查看网卡的亲和性CPU,可见网卡更倾向于使用CPU0-23。

共96个CPU,CPU使用并不算高。

3.3. 查看网卡信息

可见主要使用enp125s0f0这个网卡,使用的驱动是hns3。bus-info为000:7d:00.0

查看网卡队列(ethtool -l enp125s0f0),可见只有一个网卡队列。

通过lspci -vvv | grep -i msi-x -A 20 可见这个华为网卡是支持多队列的(Capabilities:[a0] MSI-X: Enable+ Count=131 Masked-),Count=131说明网卡最大支持131个队列。

但是上面的ethtool -l enp125s0f0查看最大队列只有Combined=1。

说网卡的哪里的配置存在问题。

查看发现enp125s0f0存在RxErrs和RxDrop,但是不多,存在少了丢包。

使用xsos -r . 可见net.core.netdev_max_backlog和net.core.netdev_budget的值是足够(sufficient)的。

3.4.分析网卡中断及CPU使用率

cat /proc/interrupts | grep hns3查看,如下图所示。使用ethtool -i enp125s0f0可见该网卡的bus-info为0000:7d:00.0。经数后确认enp125s0f0网卡硬中断使用了CPU18。

使用命令sar -n DEV 1分析可见CPU18使用率高达61%,其中%system高达59%,初步怀疑是CPU使用率过高导致的ping延迟。由此可见enp125s0f0网卡只有一个网卡队列,只使用了一个CPU处理网卡中断,所有的网络收发包,都经过一个CPU18。

3.5.skbtrace分析icmp包的发包流经函数

可见dev_hard_start_xmit函数到consume_skb耗时较长,可能是发送的时候出现了延时。

4.问题小结

1、从CPU信息可见,96个CPU核心,分为4个numa node。网卡亲和numa node 0,倾向于使用CPU0到CPU23。

2、从网卡队列和网卡中断上看,网卡只有一个队列,只有一个网卡中断,所以性能都消耗在node 0上的一个CPU上,导致单个CPU的性能差。

3、根据分析网卡是支持网卡多队列的。但是由于某种原因,只有一个网卡队列,根据分析可能是BIOS配置导致网卡只有一个队列。

5.问题处理

根据鲲鹏服务器厂商协调分析,造成这个问题的原因在于我们服务器原本配的是电口,bios的配置就是1,后来换成光口,但是bios 没有自动刷新为光口的默认配置,导致性能差。根据文档中的配置,进行网卡队列配置https://support.huawei.com/enterprise/zh/doc/EDOC1100118649/f539cb72(配置网课队列数- 华为 TM280灵活IO卡用户指南)

1、进入BIOS界面。

2、按照“Advanced > LOM Configuration > NIC Configuration”顺序进入“NIC Configuration”界面。

3、进入 “Port Configuration” 界面,如 图4-4 所示,参数说明如 表4-1 所示。

4、图4-4 “Port Configuration”

根据华为服务器的人说,Tqp number/ function Number就是队列数。华为后面配置Function Number 为1,Tqp Number为60。

5、保持BIOS,重启,使用ethtool -l enp125s0f0可见队列数变为了60.

6.参考资料

https://support.huawei.com/enterprise/zh/doc/EDOC1100118649/f539cb72

https://support.huawei.com/enterprise/zh/doc/EDOC1100088652/3080fa99

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1568721.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

canvas+javascript 实现贪吃蛇游戏

引言 在当今数字化时代,编程已经成为一种极具创造力和趣味性的活动。通过编写代码,我们可以创造出各种各样的应用程序和游戏,其中包括经典的贪吃蛇游戏。本文将向您介绍如何使用 JavaScript 编程语言制作一个简单而有趣的贪吃蛇游戏&#xf…

蓝桥杯刷题day13——玩游戏【算法赛】

一、问题描述 小 A 和小 B 两个人在海边找到了 n 个石子,准备开始进行一些游戏,具体规则如下:小 B 首先将 n 个石子分成若干堆,接下来从小 A 开始小 A 和小 B 轮流取石子,每次可以任选一堆石子取走任意个,…

huggingface使用git上传model或者Dataset到HF,当然也可以上传代码,以及大文件,很哇塞!!!

本地设置huggingface可写token(仅需一次) 第一次使用时,需要使用huggingface-cli设置系统全局的huggingface token,这个token必须是可写(write)权限的才能上传模型。 点击huggingface首页右上角的头像 → settings → access to…

洛谷_P1048 [NOIP2005 普及组] 采药_dp_python写法

P1048 [NOIP2005 普及组] 采药 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) T, M map(int,input().split())dp [[0]*(T1) for _ in range(M1)]for i in range(1,M1):t, v map(int,input().split())for j in range(1,T1):if j<t:dp[i][j] dp[i-1][j]else:dp[i][j] ma…

蓝桥杯真题:路径

import java.util.Scanner; // 1:无需package // 2: 类名必须Main, 不可修改public class Main {public static void main(String[] args) {int n 2022; //从下标为1开始&#xff0c;方便计算int[] q new int[n]; //存储最短路q[1] 0; //起始条件for (int i 2; i < 202…

[QOpenGLWidget+QMouseEvent]实时绘制长方形

复现moho-打卡第1天 - 20240402 1.1--QOpenGLWidget中显示长方形 实现方法&#xff1a;顶点着色器中给定长方形的四个顶点数据&#xff0c;代码如下&#xff1a; // 顶点位置 GLfloat vertics[1][4][3] { {{mousePressPosX,mousePressPosY,0.0},{mousePressPosX,mouseMoveP…

【大模型应用篇2】提示词实践-短剧文案

在上节课《【大模型应用篇1】学会对模型念咒语》带大家一起学习了提示词工程&#xff0c;我相信大部分朋友学完之后&#xff0c;还是有懵懂的&#xff0c;这节课带大家实操一下提示词的应用场景&#xff0c;现在短剧的创作很火&#xff0c;好看的短剧内容一定不会差&#xff0c…

Kubesphere 自动化部署失败报错

Kubesphere 自动化部署在 push tag 阶段失败报错 git push http://****:****github.com/****/devops-java-sample.git --tags --ipv4 remote: Support for password authentication was removed on August 13, 2021. remote: Please see https://docs.github.com/get-started/g…

中颖51芯片学习1. 系统时钟及IO口输出操作

中颖51芯片学习1. 系统时钟及IO口输出操作 一、芯片介绍1. 规格2. 资源3. 中断源&#xff1a;4. 方框图5. 封装&#xff08;1&#xff09;32脚LQFP封装&#xff08;2&#xff09;28脚SOP封装&#xff08;3&#xff09;20脚SOP封装 二、开发环境搭建1. 安装keil2. 安装中颖keil插…

鸿蒙实战开发:【实现应用悬浮窗】

如果你要做的是系统级别的悬浮窗&#xff0c;就需要判断是否具备悬浮窗权限。然而这又不是一个标准的动态权限&#xff0c;你需要兼容各种奇葩机型的悬浮窗权限判断。 fun checkPermission(context: Context): Boolean if (Build.VERSION.SDK_INT < Build.VERSION_CODES.M)…

江大白 | 万字长文,近3年Transformer在小目标检测领域,进展与突破系统梳理!

本文来源公众号“江大白”&#xff0c;仅用于学术分享&#xff0c;侵权删&#xff0c;干货满满。 原文链接&#xff1a;万字长文&#xff0c;近3年Transformer在小目标检测领域&#xff0c;进展与突破系统梳理&#xff01; 以下文章来源于微信公众号&#xff1a;AI视界引擎 …

WEB漏洞挖掘详细教程--用户输入合规性(sql注入测试)

前置教程&#xff1a;WEB漏洞挖掘&#xff08;SRC&#xff09;详细教程--信息收集篇-CSDN博客 WEB漏洞挖掘&#xff08;SRC&#xff09;详细教程--身份认证与业务一致性-CSDN博客 WEB漏洞挖掘&#xff08;SRC&#xff09;详细教程--业务数据篡改-CSDN博客 2.4 用户输入合规性…

C#学生信息管理系统

一、引言 学生信息管理系统是现代学校管理的重要组成部分&#xff0c;它能够有效地管理学生的基本信息、课程信息、成绩信息等&#xff0c;提高学校管理的效率和质量。本文将介绍如何使用SQL Server数据库和C#语言在.NET平台上开发一个学生信息管理系统的课程设计项目。 二、项…

risc-v向量扩展strlen方法学习

riscv向量文档中给出了strlen的实现&#xff0c; 大概是这么一个思路&#xff0c; 加载向量: 使用向量加载指令&#xff08;如 vload&#xff09;从内存中加载一个向量长度的字符。比较向量与零: 使用向量比较指令&#xff08;如 vmask 或 vcmpeq&#xff09;来检查向量中的每…

HTTPS RSA 握手解析(计算机网络)

传统的 TLS 握手基本都是使用 RSA 算法来实现密钥交换的&#xff0c;在将 TLS 证书部署服务端时&#xff0c;证书文件其实就是服务端的公钥&#xff0c;会在 TLS 握手阶段传递给客户端&#xff0c;而服务端的私钥则一直留在服务端。 在 RSA 密钥协商算法中&#xff0c;客户端会…

【generate】如何维护一套icon组件库,直接输出svg为react component

https://github.com/ant-design/ant-design-web3/pull/761/files 实现了icon-preview(通过jsdoc, 鼠标放在组件上可以看到icon的样式)&#xff0c;因为打包方式、产物以及命名上有一些不同&#xff0c;可能需要稍加改造。 这个同步脚本应该后续也用得上&#xff0c;略加改造同步…

装饰工程管理系统|基于Springboot的装饰工程管理系统设计与实现(源码+数据库+文档)

装饰工程管理系统-项目立项子系统目录 目录 基于Springboot的装饰工程管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员功能实现 &#xff08;2&#xff09;合同报价管理 &#xff08;3&#xff09;装饰材料总计划管理 &#xff08;4&#xff0…

深度解析GPT中的Tokenizer

继学习完深度解析大语言模型中的词向量后&#xff0c;让我们继续学习大语言模型中另外几个重要概念&#xff1a;token&#xff08;词元&#xff09;、tokenization&#xff08;词元化&#xff09;、tokenizer&#xff08;词元生成器&#xff09;。 在GPT模型中&#xff0c;toke…

Minikube本地搭建单节点Kubernetes集群

1、什么是 Minikube Minikube 是一个开源工具&#xff0c;旨在为开发者提供一种便捷的方式在本地环境中搭建单节点的 Kubernetes 集群。它主要用于开发、测试和学习 Kubernetes 应用程序&#xff0c;无需依赖大型的硬件资源或复杂的多节点集群配置。minikube 使用轻量级虚拟化技…

小林coding图解计算机网络|基础篇02|键入网址到网页显示,期间发生了什么?

小林coding网站通道&#xff1a;入口 本篇文章摘抄应付面试的重点内容&#xff0c;详细内容还请移步&#xff1a;小林coding网站通道 文章目录 孤单小弟——HTTP真实地址查询——DNS指南好帮手——协议栈可靠传输——TCP远程定位——IP两点传输——MAC出口——网卡送别者——交…