[网络] ifconfig down掉的网口,插上网线网口灯依然亮?

news2024/11/28 8:28:32

1、软硬件环境

 环境1:

        硬件: 飞腾E2000Q ARM64 平台 + YT8521SH (phy) 

        软件: linux 4.19.246

 环境2:

        硬件: NXP T1042 PowerPC 平台  +  YT8521SH (phy) 

        软件: linux 4.1.35

备注:

1、环境1的网口是飞腾E2000Q 原生MAC + 裕太PHY YT8521SH 组成。

2、环境2的网口是 NXP T1042 原生MAC + 裕太PHY YT8521SH 组成。

3、两个环境中 phy的驱动(YT8521SH 的配置)使用同一版本,配置上没有差异。内核版本与MAC驱动不同。

2、问题现象

 环境1:飞腾E2000Q ARM64 平台 (异常)

不接网线时:网口up状态,ifconfig eth1 down 掉网口后,插上网线,link灯亮起。

 环境2:NXP T1042 PowerPC 平台(正常)

不接网线时:网口up状态,ifconfig eth1 down 掉网口后,插上网线,link灯灭的。

3、问题分析与排查

根据这个现象,初步判断可能是ifconfig down的时候,phy 没有suspend。下面我们来验证一下!

我们先看下正常的ifconfig down, 的函数调用流程是怎样的。

NXP T1042平台


还是利用利器ftrace来观察:

ifconfig eth1 up

cd /sys/kernel/debug/tracing
echo function > ./current_tracer
echo 1 > options/func_stack_trace
echo .yt8521_suspend > ./set_ftrace_filter
echo > trace
ifconfig eth1 down
cat trace

从上面过程中来看,ifconfig down 是通过ioctl 来和驱动交互的,会调用 MAC驱动的 ndo_stop() , 最终会调到 phy_suspend。

飞腾E2000Q平台


下面我们来看看问题设备,,使用ftrace 或者 驱动里加printk调试信息,发现不插网线的时候,ifconfig down , 并不会调用phy_suspend, 只有在有网线的时候,ifconfig down,才会调用 phy_suspend,而且这个过程没有ioctl的参与,完全是phy的状态机的行为。

 不插网线时, 我们重新 trace一下带 ioctl的流程,看看具体为什么没有调用 phy_suspend,根据MAC驱动,我们可以看出 ndo_stop函数具体是macb_close:

~/linux-ft $ grep ndo_stop -nR drivers/net/ethernet/phytium/
drivers/net/ethernet/phytium/macb_main.c:3430:	.ndo_stop		= macb_close,

这次我们 跟踪函数 macb_close向上的调用栈 :

ifconfig eth1 up

cd /sys/kernel/debug/tracing
echo function > ./current_tracer
echo 1 > options/func_stack_trace
echo macb_close> ./set_ftrace_filter
echo > trace
ifconfig eth1 down
cat trace

 看来是飞腾E2000Q  MAC驱动中 ndo_stop时没有对phy进行操作。对phy的操作,完全有phy的状态机来控制,这点和T1042不同。我们看下 phy_state_machine 中的实现。针对该网卡,ifconfig down的时候,phy的状态会变成 PHY_HALTED 

 /**
  * phy_state_machine - Handle the state machine
  * @work: work_struct that describes the work to be done
  */
 void phy_state_machine(struct work_struct *work)
 {
    ........
         switch (phydev->state) {
         case PHY_DOWN:

    ........
        case PHY_HALTED:
                if (phydev->link) {
                        phydev->link = 0;
                        phy_link_down(phydev, true);
                        do_suspend = true;
                }
                break;

    ........
        if (needs_aneg)
                err = phy_start_aneg_priv(phydev, false);
        else if (do_suspend)
                phy_suspend(phydev);

    ........
}

 从上述代码里可以看到 当PHY的状态变成PHY_HALTED,意思就是要关闭网口,关闭PHY,但是只有当phy的link 从1变成0 才会进行 suspend操作,这里设计的感觉不太合理,应该在PHY的状态变成PHY_HALTED时,就对phy进行suspend, 这猜测是内核的一个bug,我们在内核的upstream上找找看, 

在最新版本内核上,执行git log drivers/net/phy/phy.c  扒拉扒拉看看有没有新的patch

果真找到了一个patch, 如下:

~/src/linus_torvalds/linux$ git show 95fb8bb3181bbe1ee87c95e91dff94f74f148c33
commit 95fb8bb3181bbe1ee87c95e91dff94f74f148c33
Author: Jian Shen <shenjian15@huawei.com>
Date:   Wed Aug 28 09:34:47 2019 +0800

    net: phy: force phy suspend when calling phy_stop
    
    Some ethernet drivers may call phy_start() and phy_stop() from
    ndo_open() and ndo_close() respectively.
    
    When network cable is unconnected, and operate like below:
    step 1: ifconfig ethX up -> ndo_open -> phy_start ->start
    autoneg, and phy is no link.
    step 2: ifconfig ethX down -> ndo_close -> phy_stop -> just stop
    phy state machine.
    
    This patch forces phy suspend even phydev->link is off.
    
    Signed-off-by: Jian Shen <shenjian15@huawei.com>
    Reviewed-by: Heiner Kallweit <hkallweit1@gmail.com>
    Signed-off-by: David S. Miller <davem@davemloft.net>

diff --git a/drivers/net/phy/phy.c b/drivers/net/phy/phy.c
index f3adea9ef400..0acd5b49f450 100644
--- a/drivers/net/phy/phy.c
+++ b/drivers/net/phy/phy.c
@@ -911,8 +911,8 @@ void phy_state_machine(struct work_struct *work)
                if (phydev->link) {
                        phydev->link = 0;
                        phy_link_down(phydev, true);
-                       do_suspend = true;
                }
+               do_suspend = true;
                break;
        }

至此,解决。

4、总结

  • 不同网卡驱动实现不一样,这里包括不同平台CPU原生MAC驱动实现,虽然使用同一颗phy,但由于MAC不同,phy的现象也可能会有差异。
  • 遇到内核问题,可以多去upstream上看看有无相关patch,自己遇到的问题,可能是别人已踩过坑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/719868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Rdkit|分子可视化

Rdkit|分子可视化 Github&#xff1a; 地址 单个展示 从mol对象到图片&#xff1a;MolToImage(mol, size, kekulize, wedgeBonds, fitImage, …) mol&#xff1a;mol对象 size&#xff1a;图片尺寸&#xff0c;默认(300, 300) kekulize&#xff1a;是否展示kekule形式&#…

Apikit 自学日记:新建 API 请求

进入流程测试用例详情页&#xff0c;点击添加测试步骤&#xff0c;在下拉菜单中选择 添加API请求 &#xff0c;系统会自动进入API测试步骤编辑页面&#xff0c;接下来你可以编辑API的请求参数、返回结果、校验规则等内容。 设置 API 测试步骤 API测试步骤设置分为以下几个部分…

react笔记_07类组件

目录 复习展开运算符 组件什么叫做组件&#xff1f;分类类组件es6新增构造函数语法类组件渲染类组件的this指向类组件的三大属性state作用语法-初始化数据语法-修改state数据语法-获取state中的数据案例 propspropTypes属性(prop-types库)defaultProps属性 refs[1] 字符串形式的…

搞定HashMap

搞定HashMap 1.Map是个啥&#xff1f; HashMap隶属于Java中集合这一块&#xff0c;我们知道集合这块有list&#xff0c;set和map&#xff0c;这里的HashMap就是Map的实现类&#xff0c;那么在Map这个大家族中还有哪些重要角色呢&#xff1f; 上图展示了Map的家族&#xff0c;…

Cernox 温度传感器碳陶瓷基体结构

Cernox 温度传感器具有高灵敏度、稳定性好、遵循单一电阻与温度曲线&#xff0c;磁场性能优良和耐辐射等特性。适用于低温系统中1.5-375K范围内的测量。传感器在及其严格的质量控制下制造&#xff0c;并在强磁场、中子伽马辐射、热循环和机械耐久条件下证明长期稳定性。与其他可…

基于springboot+mysql+jsp高校社团管理系统

基于springbootmysqljsp高校社团管理系统 一、系统介绍二、所用技术三、功能展示三、其它系统四、获取源码 一、系统介绍 管理员&#xff1a;登录注册、个人中心&#xff08;个人信息、密码修改、注销&#xff09;、近期活动&#xff08;所有活动、文体类活动、学术类活动、公…

微服务学习1——微服务环境搭建

微服务学习1——微服务环境搭建 &#xff08;参考黑马程序员项目&#xff09; 个人仓库地址&#xff1a;https://gitee.com/jkangle/springboot-exercise.git 微服务就是将单体应用进一步拆分&#xff0c;拆成更小的服务&#xff0c;拆完之后怎么调用&#xff0c;主流的技术有…

【分布式】zabbix 6.0部署讲解

目录 一、 序章二、zabbix概念2.1 zabbix是什么&#xff1f;2.2 zabbix 监控原理2.3 zabbix 6.0 新特性2.4 zabbix 6.0 功能组件 三、zabbix 6.0 部署部署服务端3.1 部署 Nginx PHP 环境并测试3.1.1 安装nginx3.1.2 安装php3.1.3 修改 Nginx 配置3.1.4 修改 php 配置3.1.5 创建…

Python +selenium 自动化之元素定位

selenium之八大元素定位&#xff1a; 1、通过ID的方式定位 id是页面的唯一标识 例如&#xff1a;找到百度的搜索输入框 driver.findElement(By.id("kw")) 2、通过tagName的方式定位 用标签名定位非常少 ---一般会重复 driver.findElements(By.tagName(&qu…

Vue2 Diff 算法简易版

背景 最近复习的过程中&#xff0c;准备对比一下Vue2和Vue3的diff算法区别&#xff0c;好知道两者直接的差异和优缺点。刚好看了网上的文章&#xff0c;但是对方写的代码不太正确&#xff0c;所以特意记录一下我的学习过程~ 双端比较法 Vue2采用的双端比较法&#xff0c;即新…

MBD开发 STM32 Timer

开两个定时器 一快一慢 两个中断都要使能 没有自动更新&#xff0c;切换下timerx就好了&#xff0c;但是触发UP要手动勾选

剑指offer27.二叉树的镜像

这道题很简单&#xff0c;写了十多分钟就写出来了&#xff0c;一看题目就知道这道题肯定要用递归。先交换左孩子和右孩子&#xff0c;再用递归交换左孩子的左孩子和右孩子&#xff0c;交换右孩子的左孩子和右孩子&#xff0c;其中做一下空判断就行。以下是我的代码&#xff1a;…

爬虫入门指南(8): 编写天气数据爬虫程序,实现可视化分析

文章目录 前言准备工作爬取天气数据可视化分析完整代码解释说明 运行效果完结 前言 天气变化是生活中一个重要的因素&#xff0c;了解天气状况可以帮助我们合理安排活动和做出决策。本文介绍了如何使用Python编写一个简单的天气数据爬虫程序&#xff0c;通过爬取指定网站上的天…

Pandas+Pyecharts | 双十一美妆销售数据分析可视化

文章目录 &#x1f3f3;️‍&#x1f308; 1. 导入模块&#x1f3f3;️‍&#x1f308; 2. Pandas数据处理2.1 读取数据2.2 数据信息2.3 筛选有销量的数据 &#x1f3f3;️‍&#x1f308; 3. Pyecharts数据可视化3.1 双十一前后几天美妆订单数量3.2 双十一前后几天美妆销量3.3…

【Linux】线程终结篇:线程池以及线程池的实现

linux线程完结 文章目录 前言一、线程池的实现二、了解性知识 1.其他常见的各种锁2.读者写者问题总结 前言 什么是线程池呢&#xff1f; 线程池一种线程使用模式。线程过多会带来调度开销&#xff0c;进而影响缓存局部性和整体性能。而线程池维护着多个线程&#xff0c;等待着…

智能、安全、高效,看移远如何助力割草机智能化升级

提到割草机&#xff0c;大家可能首先会想到其噪声大、费人力、安全性不足等问题。智能割草机作为一种便捷、高效的智能割草设备&#xff0c;能够自主完成草坪修剪工作&#xff0c;很好地解决传统割草机的痛点问题。 随着人们对家庭园艺以及生活质量要求的逐步提高&#xff0c;割…

向量数据库:新一代的数据处理工具

在我们的日常生活中&#xff0c;数据无处不在。从社交媒体的帖子到在线购物的交易记录&#xff0c;我们每天都在产生和处理大量的数据。为了有效地管理这些数据&#xff0c;我们需要使用数据库。数据库是存储和管理数据的工具&#xff0c;它们可以按照不同的方式组织和处理数据…

python实现简单贪吃蛇

import math import pygame import time import numpy as np # 此模块包含游戏所需的常量 from pygame.locals import *# 设置棋盘的长宽 BOARDWIDTH 90 BOARDHEIGHT 50 # 分数 score 0# 豆子 class Food(object):def __init__(self):self.item (4, 5)# 画出食物def _draw(…

qtav源码包编译(qt5.15+msvc2019)、使用vlc media player串流生成rtsp的url并且在qml客户端中通过qtav打开

QTAV源码包编译 下载源码 下载依赖库&#xff08;里面有ffmepg等内容&#xff09; https://sourceforge.net/projects/qtav/files/depends/QtAV-depends-windows-x86x64.7z/download下载源码包 https://github.com/wang-bin/QtAV更新子模块 cd QtAV && git submod…

vmware postgresql大杂烩

Vmware 窗口过界&#xff1a; https://blog.csdn.net/u014139753/article/details/111603882 vmware, ubuntu 安装&#xff1a; https://zhuanlan.zhihu.com/p/141033713 https://blog.csdn.net/weixin_41805734/article/details/120698714 centos安装&#xff1a; https://w…