dwceqos网络驱动性能优化

dwceqos网络驱动性能优化

news2025/4/28 9:01:58

文章介绍

本文会介绍优化QNX系统下io-pkt-v6-hc驱动模块cpu loading过高问题，经过优化可以降低约一半的cpu loading.

问题背景

激光雷达通过以太网发送数据到ADAS域控中，测试发现在激光功能激活的情况下，会出现比较明显的网络丢帧现象。

初步调查发现，在发生丢帧时，整个系统的cpu loading非常的高（100%），而且持续处于这种状态，整个系统cpu资源处于过载的状态.

从上面的cpu loading表现来看，QNX的io-pkt-v6-hc的整体cpu loading很高.

由于这个问题的存在已经严重影响了功能的正常使用，所以我们想在不影响性能的前提下，尽可能优化cpu loading，已达到一个合理的范围。

调查过程

这个时候第一个问题已经出现：即当前在这种测试场景下，我们cpu loading表现是否正常？是否符合芯片设计的要求？

这里引出来几个话题：

一、我们的硬件设计是怎样的？

可以看到基本上框架为：SOC-GMAC-RGMII-SWITH

二、io-pkt-v6-hc是和那个硬件模块交互？

io-pkt-v6-hc对接的MAC以太网驱动devnp-dwceqos-mv88e1512.so，而MAC是SOC片上的RGMII模块.在产生数据传输时，最先有MAC硬件接收，DMA数据传输完成之后，产生中断，有io-pkt-v6-hc调用devnp-dwceqos-mv88e1512.so中的中断处理函数，中断处理数据完成之后，调用if_input（）接口注入io-pkt-v6-hc网络服务，再由应用程序读取数据.

而在芯片层面，MAC这个硬件模块大致与CPU以及其他模块的连接大致如下（不完全准确）：

其中比较重要的是需要知道，MAC硬件模块与SOC的中断控制器（IC）有数条中断线进行连接，其中的中断号可以通过对应的手册查询到：

三、当前的loading状态是否正常？

针对这个问题，我们最先和我们的芯片供应商进行了讨论，但是从反馈来看，他们似乎也并没有什么比较好的解决方法（他们知道这个问题的存在）.并且他们并没有计划也没有能力去进行优化（这个驱动由ip core供应商开发，他们没有参与这个部分）.

查看了这个MAC的IP core状态，是synopsys公司的dwceqos模块，这个ip core不止在我们这个SOC上使用，同时在高通的多款芯片上也有应用。

基于这个背景，我们也同时测试了8155 q+a/8155 lv/8255 q+a/8295 q+a 这几个平台上的表现，发现表现基本相同，即在千兆以太网传输的case下，cpu loading普遍会很高.

从各方反馈的结果来看，测试结果似乎符合预期的？但是直觉上又感觉不合理，因为进行网络传输占用如此多都cpu资源似乎并不合理（相比其他平台进行网络传输并不会有很高的loading）。

调查思路

一般来说，cpu负荷过高通常有2个原因，一是，cpu现在的确一直在干活，那么优化的思路是优化cpu的工作内容，二是，cpu一直在被中断，反复的状态切换带来的高消耗。

优化尝试

1，确认是否启用DMA

2，修改网络模块收发buffer size

3，修改驱动加载参数

4，中断优化

基于中断合并的思路，我们翻阅了"DesignWare Cores Ethernet Quality-of-Service
Databook" 这个ip core的datasheet，其中有一段描述：

这段话简单概括来说是，如果你想优化性能，那么最好使用IOC标志位&定时器来产生中断，而不是每次DMA传输完成都产生一次中断.

其中还有一段关于中断模式的描述：

简单概括来说就是，在中断模式0（default）的情况下，只要检测到RX/TX的IOC标志位都会立即触发通用中断（sbd_intr_o），而在1/2模式下，则完全不触发sbd_intr_o中断，而只会触发sbd_perch_tx_intr_o[]或者sbd_perch_rx_intr_o[]

到这里，我们又遇到了问题：该如何确认我当前驱动工作在那个模式下？

通过驱动代码&SOC芯片手册，我们可以确定这个GMAC控制的寄存器地址，通过devmem2直接读取其值：

note:

1，这里读到的值是我修改过之后的值，默认情况下读到的值是0x0

2，如果devmem2工具不可用，那么可以用qnx提供的in32/out32来读写寄存器

4.1 中断模式修改

到这里，我们首先尝试直接修改中断模式，修改为1/2模式之后，网络驱动完全不可用，无法传输数据。想了下，原因其实很简单，因为驱动已经指定了中断触发的源是sbd_intr_o，我们更改模式之后，因为并没有中断源与当前驱动挂钩，所以即使有数据传输产生也不会产生任何函数调用。

我们通过修改驱动更新了中断源为sbd_perch_rx_intr_o，测试之后发现效果并没有什么变化

原因在于，现在每次DMA描述符都被设置了IOC标志位，意味着，每次传输完成都会产生sbd_perch_rx_intr_o中断，与我们预期还是不符合.

4.2 中断模式修改+修改中断源+定时器触发

基于上面的原因，我们清除了驱动中大部分都DMA描述符的IOC标志位，只在特定的DMA描述符上设置IOC标志位，比如4/16/32。

不过这个时候还是有问题，因为DMA传输只在有IOC标志位的描述符传输完成时产生中断，如果没有检测到IOC标识符则不会产生中断，那么数据的实时性就没有保证了，比如你只传递了一次数据，那么这个数据并不会及时得接收到（因为还未达到IOC触发阈值）.

为了解决这个问题，我们需要增加一个timer来定时触发中断，按照手册的描述：

当timer寄存器写入数值时，如果此时一个RX DMA传输完成，且IOC标志位没有被设置，那么timer将会启动，在RWT*RWTU个系统时钟后超时，并产生中断.

优化结果对比

优化前测试结果

iperf3传输速度：

cpu loading表现（每隔1s采样一次）

中断表现：

优化后测试结果

iperf3 测试表现：

cpu loading表现（每隔1s采样一次）

中断表现

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2180600.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

HT8731 内置自适应H类升压和防破音功能的10W D类及AB类音频功率放大器

HT8731 内置自适应H类升压和防破音功能的10W D类及AB类音频功率放大器

1、特点防削顶失真功能(防破音,Anti-Clipping Function, ACF) 免滤波器数字调制，直接驱动扬声器输出功率 10W(VBAT4.2V,RL3Ω,THDN10%, fiN 1kHz) 6W(VBAT3.3~4.2V,RL4Ω,THDN<1%,20-20kHz 全频段) 3W (VBAT3.3~4.2V,RL8Ω, THDN<1%, 20- 20kHz 全频段 VB…

阅读更多...

DPLL的DCO与PLL的VCO(数控振荡器与压控振荡器)

DPLL的DCO与PLL的VCO(数控振荡器与压控振荡器)

1.概述无论DPLL还是PLL都是由PD，LPF和DCO/VCO组成。 PD：鉴相器，是将VCO/DCO输出的频率信号分频后与refclk进行相位比对，输出一个相位差信号 LFP：是将相位差信号转换为VCO的压控信号或DCO的延迟信号。 VCO&#xf…

阅读更多...

js将对象的键和值分别归纳进对象，并将多层对象转化成数据的方法

js将对象的键和值分别归纳进对象，并将多层对象转化成数据的方法

前言： 后端传给我一个没有处理过的json串，但是我要传入el-tree做渲染，此篇来记录一下整个数据处理过程以及el-tree的使用需求描述： 一、树结构可以展开可以收缩，默认全部展开二、有一些关键词需要高亮展示红色 …

阅读更多...

第十三届蓝桥杯真题Python c组D.数位排序(持续更新)

第十三届蓝桥杯真题Python c组D.数位排序(持续更新)

博客主页：音符犹如代码系列专栏：蓝桥杯关注博主，后期持续更新系列文章如果有错误感谢请大家批评指出，及时修改感谢大家点赞👍收藏⭐评论✍ 问题描述小蓝对一个数的数位之和很感兴趣, 今天他要按照数位之和给数排序。…

阅读更多...

Knots_3D 9.3.0 一款教你绑绳结的手机应用

Knots_3D 9.3.0 一款教你绑绳结的手机应用

Knots 3D (3D绳结)是一款教你绑绳结的手机应用，可以掌握一些必备的绳结系法，拥有 120 个 3D 效果的绳结，教你系上、解开，户外爱好者必备。Knots 3D已经被全世界的园艺师、渔民、消防员、登山者、军人和童子军使用，它将…

阅读更多...

9.2 Linux_I/O_标准I/O相关函数

9.2 Linux_I/O_标准I/O相关函数

打开与关闭文件打开就是判断这个文件资源可不可以被占用，如果可以，就能够打开成功，否则打开失败文件关闭就是释放文件资源 1、打开文件 1.1 函数声明 FILE *fopen(const char *pathname, const char *mode); 返回值：出错返…

阅读更多...

永不失联！遨游双卫星三防手机成为高效应急关键所在

永不失联！遨游双卫星三防手机成为高效应急关键所在

今年9月被戏称为“台风月”，台风“摩羯”、“贝碧嘉”以及热带气旋“普拉桑”接连来袭，极端天气不仅导致了电力中断、道路损毁，更使得传统的通信网络遭受重创，给应急通信保障工作带来了极大的压力。面对“三断”的实战难题&#x…

阅读更多...

铰链+屏幕齐发力，告诉你 Mate XT 是如何让折痕变得“无存在感”

铰链+屏幕齐发力，告诉你 Mate XT 是如何让折痕变得“无存在感”

“折痕”是折叠手机永恒的话题，每一款折叠屏手机产品的问世，都逃不过对折痕的关注和讨论。为什么会存在折痕？ 材料在弯折的状态下会受到力的作用，在内部产生“压缩”的应力和“拉伸”的应力，这些应力集中在弯折的区…

阅读更多...

pytorch线性/非线性回归拟合

pytorch线性/非线性回归拟合

一、线性回归 1. 导入依赖库 import numpy as np import matplotlib.pyplot as plt import torch from torch import nn, optim from torch.autograd import Variable numpy：用来构建数据matplotlib.pyplot： 将构建好的数据可视化torch.nn&#xff1a…

阅读更多...

《向量数据库指南》——Fivetran 的 Partner SDK：构建自定义连接器和目标

《向量数据库指南》——Fivetran 的 Partner SDK：构建自定义连接器和目标

哈哈，说到 Fivetran 的 Partner SDK，这可真是个好东西啊！作为向量数据库领域的“老司机”，我今天就来给大家详细讲讲这个 SDK 的厉害之处，以及如何用它来构建自定义连接器和目标，实现与 Fivetran 自动化数据移动平台的无缝集成。一、Fivetran Partner SDK：开启自定义连…

阅读更多...

二叉树深搜专题篇

二叉树深搜专题篇

目录计算布尔二叉树的值求根节点到叶节点数字之和二叉树剪枝验证二叉搜索树二叉搜索树中第K小的元素二叉树的所有路径计算布尔二叉树的值题目思路这道题其实是比较简单的，对二叉树来一次后序遍历即可，当遇到叶子结点直接返回叶子节点中…

阅读更多...

干部画像系统怎么实现人岗智能匹配的？

干部画像系统怎么实现人岗智能匹配的？

人岗匹配的核心在于实现“岗得其人”和“人适其岗”，即根据不同人的个体特征将不同的人安排在各自最合适的岗位上，达到人尽其才的目标。干部画像系统作为一种辅助领导智慧识才的工具，通过集成多种技术手段和分析方法，对干部的定性…

阅读更多...

【代码实现】torch实现F.pixel_shuffle和F.pixel_unshuffle

【代码实现】torch实现F.pixel_shuffle和F.pixel_unshuffle

原理 pixel_shuffle 和 pixel_unshuffle 常用于神经网络减少特征图尺寸以减少计算量，由于有些硬件不支持这两个算子，可以根据原理使用torch实现。代码实现 import torch.nn.functional as F import torch def pixelshuffle_inv(tensor, scale2):N, c…

阅读更多...

C++详解vector

C++详解vector

目录构造和拷贝构造赋值运算符重载： vector的编辑函数： assign函数： push_back和pop_back函数： insert函数： erase函数： swap函数： clear函数： begin函数： e…

阅读更多...

【以图搜图代码实现2】--faiss工具实现犬类以图搜图

【以图搜图代码实现2】--faiss工具实现犬类以图搜图

第一篇：【以图搜图代码实现】–犬类以图搜图示例使用保存成h5文件，使用向量积来度量相似性，实现了以图搜图，说明了可以优化的点。第二篇：【使用resnet18训练自己的数据集】准对模型问题进行了优化，取得了…

阅读更多...

汽修行业的知识库搭建：赋能在线教育与知识付费

汽修行业的知识库搭建：赋能在线教育与知识付费

随着汽修行业的蓬勃发展，其业务范围和技术要求日益多元化。为了应对这一趋势，许多汽修公司开始探索线上教育模式，通过开设汽修知识课程，实现知识的有偿分享与传播。这一转变不仅拓宽了企业的盈利渠道，也为广大汽修爱好…

阅读更多...

深度学习之贝叶斯分类器

深度学习之贝叶斯分类器

贝叶斯分类器 1 图解极大似然估计极大似然估计的原理，用一张图片来说明，如下图所示： 例：有两个外形完全相同的箱子，1号箱有99只白球，1只黑球；2号箱有1只白球，99只黑球。在一次…

阅读更多...

【Spark 实战】基于spark3.4.2+iceberg1.6.1搭建本地调试环境

【Spark 实战】基于spark3.4.2+iceberg1.6.1搭建本地调试环境

基于spark3.4.2iceberg1.6.1搭建本地调试环境文章目录基于spark3.4.2iceberg1.6.1搭建本地调试环境环境准备使用maven构建sparksql编辑SparkSQL简单任务附录A iceberg术语参考环境准备 IntelliJ IDEA 2024.1.2 (Ultimate Edition)JDK 1.8Spark 3.4.2Iceberg 1.6.1 使用mave…

阅读更多...

C++----类和对象（一）

C++----类和对象（一）

一.类的定义 1.类定义的格式 • class为定义类的关键字，ST为类的名字，{}中为类的主体，注意类定义结束时后面分号不能省略。类体中内容称为类的成员：类中的变量称为类的属性或成员变量; 类中的函数称为类的方法或者成员函数。 …

阅读更多...

NAND Flash虚拟层设计概述

NAND Flash虚拟层设计概述

NAND Flash虚拟层的建立需要对NAND Flash虚拟层进行初始化，根据相应的NAND Flash的物理结构参数建立逻辑结构，并建立索引表来管理逻辑虚拟层与物理虚拟层之间的联系；而在NAND Flash虚拟层运行过程中需要对NAND Flash虚拟层进行相应的垃圾回收…

阅读更多...

推荐文章

最新文章