网卡故障但bond0不切换原因及处理、脚本监控bond0网卡状态并做相应操作

news2024/11/19 17:21:16

文章目录

  • 故障说明
  • 监控脚本
    • 脚本编写
    • 脚本测试
      • 正常场景
      • 异常场景1
      • 异常场景2
    • 脚本准备和修改网卡名
      • 脚本拷贝到所有需要监控主机
      • 修改网卡名
    • 批量执行脚本

故障说明

  • 在一次交换机升级的割接中,主备交换机重启的时候,我们发现了一个问题,有几台宿主机会中断【ping不通】,交换机重启完毕以后,又恢复正常。起初不知道啥原因,但后果是宿主机上面的虚拟机能ping通,但使用不了,需要重启恢复正常。因为虚拟机一直能ping通,所以给openstaxk的心跳机制造成误判,以为虚拟机一直没死,但网络中断过,导致虚拟机现象就是卷找不到,所以虚拟机就必须重启以后才能恢复正常。
  • 后面总结发现原因就是宿主机上的bond0【内部通信bond,和存储通信】没有正常切换网卡,所以造成交换机重启后宿主机ping不通。
  • 解决方法:分别重启bond0的网卡后,bond0就能正常切换了。
  • 所以这里就写一个脚本,查看bond0绑定的网卡状态是否正常,什么才是bond0的网卡不正常,如下,状态为down,怎么能切换! 就是重启下面down的网卡,让其状态为up
    在这里插入图片描述

监控脚本

在这里插入图片描述

  • 说明,经测试,有2种情况
    • 一是网卡自己down了且bond0配置文件中的网卡存在且状态为down
    • 二是手动down掉bond0中的网卡,然后配置文件中的网卡就不显示了,并且ip a看到down掉的网卡状态依然为up
    • 所以上面2种情况都给监控上

脚本编写

  • 因为每台主机的网卡名称可能并不一致,所以采用脚本放本地的思路去完成,因为就需要修改网卡而已。
    所以现在先在一台上成功执行。
    脚本内容很基础,不做太多说明
[root@controller01 ~]# cat bond.sh 
#!/bin/bash

echo "eno3:"
if grep -q "eno3" /proc/net/bonding/bond0 ; then
        echo "/proc/net/bonding/bond0 :" `ip a | grep eno3`
        cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: eno3"

else
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
ip a | grep eno3
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"

fi

echo __________________________________________________________________
echo -e "\n"

echo "ens6f0"

if grep -q "ens6f0" /proc/net/bonding/bond0 ; then
        echo "/proc/net/bonding/bond0 :" `ip a | grep ens6f0`
        cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: ens6f0"

else
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
        echo "/proc/net/bonding/bond0 :" `ip a | grep eno3`
        cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: eno3"
echo "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"

fi

echo -e "\n"

up=`cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface"  |egrep -A1 eno3 | grep MII | awk '{print $3}'`
if [ $up = "down" ] ; then
        echo "eno3:"
        echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"
        cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: eno3"
        ip a | grep ens5f0
        echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"

else
#为up不输出内容,下面放个echo是为了不让脚本报错
echo 

fi


echo -e "\n"


up=`cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface"  |egrep -A1 ens6f0 | grep MII | awk '{print $3}'`
if [ $up = "down" ] ; then
        echo "ens6f0:"
        echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"
        cat /proc/net/bonding/bond0 | egrep -A1 "Slave Interface: ens6f0"
        ip a | grep ens6f0
        echo "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"

else
echo 

fi

脚本测试

正常场景

  • 2个网卡都正常的情况下,输出内容为下面
[root@compute31 ~]# sh bond.sh 
ens5f0:
/proc/net/bonding/bond0 : 8: ens5f0: <BROADCAST,MULTICAST,SLAVE,UP,LOWER_UP> mtu 1500 qdisc mq master bond0 state UP group default qlen 1000
Slave Interface: ens5f0
MII Status: up
__________________________________________________________________


ens6f0
/proc/net/bonding/bond0 :

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1838383.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

类的继承性(Java)

本篇学习面向对象语言的第二特性——继承性。 1 .为什么需要继承 我们来举个例子&#xff1a;我们知道动物有很多种&#xff0c;是一个比较大的概念。在动物的种类中&#xff0c;我们熟悉的有猫(Cat)、狗(Dog)等动物&#xff0c;它们都有动物的一般特征&#xff08;比如能够吃…

web安全渗透测试十大常规项(一):web渗透测试之XML和XXE外部实体注入

#详细点: XML被设计为传输和存储数据,XML文档结构包括XML声明、DTD文档类型定义(可选)、文档元素,其焦点是数据的内容,其把数据从HTML分离,是独立于软件和硬件的信息传输工具。等同于JSON传输。XXE漏洞XML External Entity Injection,即xml外部实体注入漏洞,XXE漏洞发…

Prometheus告警Alertmanager部署

Prometheus告警Alertmanager部署 资源监控一般离不开预警&#xff0c;因为我们不可能每时每刻都盯着某个资源监控看&#xff0c;而且在实际的工作中当中我们搭建的解决方案涉及到的服务器是多台甚至数十台&#xff0c;所以更加不现实&#xff0c;因此资源告警是一个必不可少的…

男士内裤品牌哪个好?2024公认好穿的五款男士内裤分享

男士内裤作为大家每天都要长时间穿着的贴身衣物&#xff0c;它的重要性不言而喻。为了确保健康与卫生&#xff0c;专家和医生建议您每三个月更换一次内裤&#xff0c;避免细菌滋生&#xff0c;让身体更加清爽自在。而一款优质的内裤&#xff0c;不仅要有舒适的弹性&#xff0c;…

学生课程信息管理系统

摘 要 目前&#xff0c;随着科学经济的不断发展&#xff0c;高校规模不断扩大&#xff0c;所招收的学生人数越来越 多&#xff1b;所开设的课程也越来越多。随之而来的是高校需要管理更多的事务。对于日益增 长的学生相关专业的课程也在不断增多&#xff0c;高校对其管理具有一…

《无与伦比》Centos7 扩容到已有逻辑卷

命令可以查找硬盘和分区情况 fdisk -l lsblk

【会议征稿,CPS出版】第三届先进机械电子与电气工程国际学术会议(ICAMEE 2024,7月19-21)

第三届先进机械电子与电气工程国际学术会议&#xff08;ICAMEE 2024&#xff09;将于2024年7月19-21日在桂林隆重举行。会议主要围绕“机械电子”、“电气工程” 等研究领域展开讨论&#xff0c; 旨在为机械电子、电气工程等领域的专家学者、工程技术人员、技术研发人员提供一个…

项目文章 | ATAC-seq联合转录组探究牦牛肌肉的调控机制

还在苦恼没有研究方向&#xff1f;还在找寻开启调控表观调控大门的钥匙&#xff1f;拿到材料不知如何下手&#xff1f;两篇ATAC联合转录组的牦牛调控机制分析或许能给你一点方向。 为了研究不同牦牛品种之间以及牦牛在成熟过程中&#xff0c;骨骼肌的调控如何影响肉类品质&…

OpenStack快速入门

任务一 熟悉OpenStack图形界面操作 1.1 Horizon项目 •各OpenStack服务的图形界面都是由Horizon提供的。 •Horizon提供基于Web的模块化用户界面。 •Horizon为云管理员提供一个整体的视图。 •Horizon为终端用户提供一个自主服务的门户。 •Horizon由云管理员进行管理…

Datacom HCIE实验考试通过率90%!深圳智汇云校传来5月捷报!

坚持不懈地努力&#xff0c;才能取得成功的果实 这是不变的真理 深圳云校传来5月捷报 在Datacom HCIE实验考试中 共有10名学员应战 其中9名学员凭借出色的表现 一次性通过了考试 展现出了扎实的技术能力 通过率高达90% &#xff08;华为历年考试平均通过率约60%&#…

【Hudi】基础概念-数据写

目录 数据写写操作写流程(UPSERT)写流程(Insert)写流程(Insert Overwrite)Key生成策略删除策略 数据写 写操作 UPSERT&#xff1a;默认行为&#xff0c;数据先通过index打标&#xff0c;有一些启发式算法决定消息的组织以及优化文件的大小>CDC导入INSERT:跳过index,写入效…

Java历史

Java程序设计语言史 Java是一种面向对象的编程语言&#xff0c;由Sun Microsystems于1990年初由开发人员James Gosling、Mike Sheridan和Patrick Naughton开发。1991年&#xff0c;詹姆斯戈斯林和他的朋友们组成了一个名为“绿色团队”的团队&#xff0c;进一步致力于这个项…

如何使用nginx 将新老网站域名重定向?(亲测收藏版)

目录 1. 安装Nginx 2. 配置Nginx 3. 启用新配置 结论 最近公司需要推行海外的业务&#xff0c;原来公司的名字麦聪软件的官网maicongs.com暂时用不上了&#xff0c;想启用sqlynx.com&#xff0c;但因为历史流量的原因&#xff0c;有很多的业务是指向的maicongs.com&#xf…

小程序分页新写法

// pages/query/query.js import {request } from ../../utils/request; Page({/*** 页面的初始数据*/data: {tabClickIndex: ,page: 1,limit: 10,listData: []},/*** 生命周期函数--监听页面加载*/onLoad(options) {this.getList()},/*** 生命周期函数--监听页面初次渲染完成*…

Sylar C++高性能服务器学习记录23 【Http模块-知识储备篇】

早在19年5月就在某站上看到sylar的视频了&#xff0c;一直认为这是一个非常不错的视频。 由于本人一直是自学编程&#xff0c;基础不扎实&#xff0c;也没有任何人的督促&#xff0c;没能坚持下去。 每每想起倍感惋惜&#xff0c;遂提笔再续前缘。 为了能更好的看懂sylar&…

Python10 python多线程

1.什么是python多线程 Python的多线程指的是在一个Python程序中同时运行多个线程&#xff0c;以达到并发执行多个任务的目的。线程是操作系统能够进行运算调度的最小单位&#xff0c;它被包含在进程之中&#xff0c;是进程中的实际运作单位。 在Python中&#xff0c;多线程的…

C# OCCT Winform 选中模型改变状态

选中状态设置 _context new AIS_InteractiveContext(_viewer);var selectionDrawer new Prs3d_Drawer();selectionDrawer.SetColor(Colors.Selection);selectionDrawer.SetDisplayMode(1);selectionDrawer.SetTransparency(0.1f);_context.SetSelectionStyle(selectionDrawe…

【机器学习】机器学习重要方法——无监督学习:理论、算法与实践

文章目录 引言第一章 无监督学习的基本概念1.1 什么是无监督学习1.2 无监督学习的主要任务 第二章 无监督学习的核心算法2.1 聚类算法2.1.1 K均值聚类2.1.2 层次聚类2.1.3 DBSCAN聚类 2.2 降维算法2.2.1 主成分分析&#xff08;PCA&#xff09;2.2.2 t-SNE 2.3 异常检测算法2.3…

【Gradio】Chatbot | 如何使用 Gradio Blocks 创建自定义聊天机器人

简介 重要提示&#xff1a;如果您刚开始接触&#xff0c;我们建议使用 gr.ChatInterface 来创建聊天机器人——它是一个高级抽象&#xff0c;使得可以快速创建漂亮的聊天机器人应用程序&#xff0c;往往只需一行代码。在这里了解更多信息。 本教程将展示如何使用 Gradio 的低级…

【网络安全】简单的免杀方法(非常详细)零基础入门到精通,收藏这一篇就够了_免杀加壳工具

目录 一、免杀的概念 二、免杀系统搭建 三、免杀工具介绍 1、myccl 2、C32asm 3、OD 4、LordPE 5、ImportREC 6、VC6.0/visual studio 7、数字签名 四、关于杀软排名不分前后 1、360。 2、金山毒霸 3、江民 4、瑞星 5、安天防线 6、卡巴斯基 7、NOD32 8、诺…