设备稳定运行一方面依赖于完备的网络规划,另一方面,也需要通过日常的维护发现并消除设备的运行隐患。
日常维护怎么才能进行呢?有哪些必要的步骤呢?
记住这五步:
1、设备环境检查
设备运行环境正常是保证设备正常运行的前提
检查的时候遵循以下步骤:
下面我们来详细介绍一下每个步骤需要注意的点:
1.1 设备位置摆放是否合理、牢固
设备应放在通风、干燥的环境中,且放置位置牢固、平整,远离热源。设备周围不得有杂物堆积。
1.2 机房温度状况
机房温度:0℃~40℃。
1.3 机房湿度状况
机房湿度:5%RH~90%RH。
1.4 机房内空调运行是否正常
空调可持续稳定运行,使机房的温度和湿度保持在设备规定范围内。
1.5 清洁状况
- 注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。
- 设备本身应无明显灰尘附着。
- 有效的防鼠措施,避免小动物(如蟑螂等)进入。
1.6 接地方式及接地电阻是否符合要求
- 一般要求机房的工作接地、保护接地、建筑防雷接地分开设置,因机房条件限制,可采用联合接地。
- 设备的接地线连接至接地排的接线柱上时,接地电阻应小于5Ω。
- 设备的接地线连接至接地体上时,接地电阻应小于10Ω。
- 当环境不具备接地条件时,可将设备的接地线相连,保持几台设备的带电压差一致。
1.7 电源连接是否正常可靠
电源线应正确的连接到设备的指定位置上,且连接牢固。设备的电源指示灯应常亮绿色。
电源插线板质量可靠,有CCC安全认证。
1.8 供电系统是否正常
要求供电系统运行稳定。直流额定电压范围为–48V DC~–60V DC。交流额定电压范围为100V AC~240V AC。
1.9 酸碱状况
无金属生锈、PCB板腐蚀,连接器没有锈蚀。
1.10 防雷状况
- 串口线缆不存在室外走线。
- 以太网电缆不存在室外走线。
1.11 安装规范性
- 没插接口模块的槽位安装有假拉手条。接口模块、假拉手条、电缆拧紧固定螺钉。
- 各种电缆的绝缘层避免接触高温物体。
- 各种电缆分类整齐并绑定,并保证一定的自由度,能够防止误插拔。电源线不能和信号线捆扎在一起。
- 未使用的光口有堵头。
2、设备基本信息检查
检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。
检查的时候遵循以下步骤:
下面我们来详细介绍一下每个步骤需要注意的点:
下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。
2.1 设备运行的版本
单板PCB版本号、软件版本号与要求相符。
执行命令:
display version
2.2 检查软件包
检查下述系统文件名是否正确:
- 当前启动大包名
- 下次启动大包名
- 备份大包名
- 配置、许可文件、补丁、语音的当前启动文件名和下次启动文件名
执行命令:
display startup
2.3 License信息
- 查看GTL License文件名、版本及配置项是否符合要求,确认是否需要升级。
- “Masterboard licensestate”项为“Normal”。“Masterboard licensestate”项为“Demo”或“Trial”时,确认License在有效期内。
执行命令:
display license
display license state
2.4 检查补丁信息
- 补丁文件必须与实际要求一致,建议加载华为公司发布的该产品版本对应的最新的补丁文件。
- 补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。
执行命令:
display patch-information
2.5 检查系统时间
- 时间应与当地实际时间一致(时间差不大于5分钟),便于故障时通过时间精确定位。
- 如果不合格,请在用户视图下执行clockdatetime命令修改系统时间。
执行命令:
display clock
2.6 检查Flash空间
Flash里的文件都必须是有用的,否则请在用户视图下执行delete /unreserved
命令删除。
执行命令:
dir flash
2.7 检查SD卡空间
SD卡里的文件都必须是有用的,否则请在用户视图下执行delete /unreserved
命令删除。
执行命令:
dir sd0
2.8 信息中心
“InformationCenter”项为“enabled”。
执行命令:
display info-center
2.9 检查配置正确性
通过查看当前生效的配置参数,验证设备配置是否正确。
执行命令:
display current-configuration
2.10 检查debug开关
设备正常运行时debug开关应该全部关闭。
执行命令:
display debugging
2.11 检查配置是否保存
当前的配置和下次启动的配置文件内容一致。
执行命令:
compare configuration
2.12 检查网络连通性
设备之间互通正常。
执行命令:
ping
tracert
3、设备运行检查
检查设备的运行情况,如单板运行状态、设备复位情况、设备温度等是否正常。
检查的时候遵循以下步骤:
下面我们来详细介绍一下每个步骤需要注意的点:
下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。
3.1 单板运行状态
重点关注单板在位信息及状态信息是否正常。
- 单板“Online”为“Present”。
- 单板“Power”为“PowerOn”。
- 单板“Register”为“Registered”。
- 单板“Alarm”为“Normal”。
执行命令:
display device
3.2 设备复位情况
通过查看复位信息(包括复位时间、复位原因),确认无非正常复位。
执行命令:
display reset-reason
学习更多网络技术,欢迎关注【网络技术联盟站】
3.3 设备温度
各模块当前的温度应该在上下限之间,即“Temperature”的值在“Upper”和“Lower”之间。
执行命令:
display temperature all
3.4 风扇状态
Present项为YES表示正常。
执行命令:
display fan
3.5 电源状态
State项为Supply表示正常。
执行命令:
display power
3.6 FTP网络服务端口
不使用的FTP网络服务端口要关闭。
执行命令:
display ftp-server
3.7 告警信息
- 无告警信息。
- 如果有告警,需要记录,对于严重以上告警需立即分析并处理。
执行命令:
display alarm active
3.8 CPU状态
各模块的CPU占用率正常。如果CPU占用率如果超过80%,建议重点关注。
执行命令:
display cpu-usage
3.9 内存占用率
内存占用情况正常,如果“Memory Using Percentage Is”超过60%时需要关注。
执行命令:
display memory-usage
3.10 日志信息
不存在异常信息。
执行命令:
display logbuffer
display trapbuffer
4、接口内容检查
检查设备的接口信息,如接口协商模式、接口配置、接口状态等是否正确。
检查的时候遵循以下步骤:
下面我们来详细介绍一下每个步骤需要注意的点:
下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。
4.1 接口错包
业务运行时,要检查接口有无错包,包括CRC错包等。
执行命令:
display interface
4.2 接口配置
接口的配置项合理,如接口双工模式、协商模式、速率、环回配置等。
执行命令:
display interface
4.3 接口状态
接口的Up/Down状态满足规划要求。
执行命令:
display interface brief
4.4 PoE供电
PoE供电状态正常,“Portpower ON/OFF”为“ON”的接口,其“Port powerstatus”为“Delivering-power”。
执行命令:
display poe power-state interface interface-type interface-number
5、业务检查
检查设备运行的业务是否正常。
检查的时候遵循以下步骤:
下面我们来详细介绍一下每个步骤需要注意的点:
下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。
5.1 组播
成员接口和路由器接口信息
静态成员接口、动态成员接口、静态路由器接口和动态路由器接口的信息正确。
执行命令:
display igmp-snooping port-info
报文统计信息
VLAN发送的IGMP报文个数,接收的IGMP报文和PIMHello报文个数,以及所有VLAN内发生的二层事件次数统计合理。
执行命令:
display igmp-snooping statistics vlan
转发表信息
组播转发表项正确。
执行命令:
# 查看二层组播转发表项:
display l2-multicast forwarding-table vlan vlan-id
# 查看三层组播转发表项
display multicast forwarding-table
组播路由协议
- 域内组播路由协议采用PIM-SM。
- 与组播相连的接口都必须要使能IGMP。
执行命令:
display multicast routing-table
5.2 IP 业务
IP流量统计信息
- 单次采集的错包和TTL超时报文数小于100。
- 正常情况下,两次采集的错包数和TTL超时报文数没有增长。
执行命令:
display ip statistics
ICMP流量统计信息
“destination unreachable”和“redirects”项不超过100。
执行命令:
display icmp statistics
IP地址池信息
“Conflict”项为0。
执行命令:
display ip pool
NAT ALG的使能情况
确认“dns”、“ftp”、“rtsp”、“sip”项的使能状态“status”是否符合自身业务需求。
执行命令:
display nat alg
NAT Server配置信息
公网地址和服务端口号GlobalIP/Port、私有地址和服务端口号Inside IP/Port配置正确,符合自身业务需求。
执行命令:
display nat server
NAT流表信息
确认NAT转换后的“NewSrcAddr”、“NewSrcPort”、“NewDestAddr”和“NewDestPort”项符合自身业务需求。
执行命令:
display nat session all verbose
5.3 广域网
PPP协议状态
“current state”项为“UP”时,“Line protocol current state”项需为“UP”。
执行命令:
display interface serial
FR协议状态
“current state”项为“UP”时,“Line protocol current state”项需为“UP”。
执行命令:
display interface mfr
MP捆绑链路情况
捆绑的链路数正确。
执行命令:
display ppp mp
5.4 3G/LTE
呼叫连接信息
- “Current Service Status”项为“Service available”。
- “Packet Session Status”项为“Active”。
执行命令:
display cellular interface number all
5.5 可靠性
备份接口状态
备份接口的物理状态为“down”。
执行命令:
display interface brief
VRRP状态
- “State”不为“Initialize”状态。
- 备份组中的设备的VRRP状态“State”不能同时为“Master”。
- “Checksum errors”、“Versionerrors”和“Vrid errors”为零。
执行命令:
display vrrp
display vrrp statistics
BFD Session状态
所有BFD Session的状态为Up。
执行命令:
display bfd session all verbose
display bfd statistics
5.6 MSTP
MSTP状态
- 指定端口和根端口的“STP State”为“FORWARDING”。
- 备份根端口的“STP State”为“DISCARDING”。
执行命令:
display stp brief
MST域配置信息
域名、域的修订级别、VLAN与生成树实例的映射关系以及配置的摘要符合要求。
执行命令:
display stp region-configuration
MSTP拓扑变化
- 查看MSTP拓扑变化相关的统计信息。
- 如果设备拓扑变化次数递增,则可以确定网络存在震荡。
执行命令:
display stp topology-change
TC/TCN报文收发计数
正常情况下,两次数据应该无增长或增长很少,表示实例端口状态稳定。
执行命令:
display stp tc-bpdu statistics
5.7 路由信息
路由表信息
- 具有默认路由或者其他精确路由,便于故障时候可以远程定位。
- 对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。
执行命令:
display ip routing-table
OSPF错包情况
正常情况下,两次的数据没有增长。
执行命令:
display ospf error
OSPF邻居状态
OSPF邻居状态:
- 邻居状态“State”为“Full”。
- 正常情况下,没有邻居down掉。
执行命令:
display ospf peer
IS-IS邻居状态
IS-IS邻居状态:
- 邻居状态“State”为“Up”。
执行命令:
display ospf peer last-nbr-down
BGP邻居状态
BGP邻居状态:
- 邻居状态“State”为“Established”。
执行命令:
display bgp peer
OSPF Router ID
- 指定Router ID为Loopback口地址。
- 如未分配Loopback口地址,则要指定为上行口地址或其他Down掉概率最小接口的地址。
执行命令:
display current-configuration configuration ospf
OSPF路由引入配置
尽量使用Network方式发布路由,也可以通过import方式引入路由。
执行命令:
display current-configuration configuration ospf
OSPF虚连接
邻居状态“State”为“Full”。
执行命令:
display ospf vlink
OSPF STUB区域
STUB区域,不能使用Import方式引入路由。
执行命令:
display current-configuration configuration ospf
BGP路由发布
- 不建议采用
import-route protocol
命令发布IP路由。 - 应使用
network{ ipv4-address | ipv6-address prefix-length 命令和ip route-static ip-address { mask | mask-length }null0
命令手工聚合路由后再静态发布。
执行命令:
display current-configuration configuration bgp
IBGP邻居
基于协议稳定性的考虑,建议使用Loopback这类状态总为UP的接口建立邻居关系。
执行命令:
display current-configuration configuration bgp
5.8 L3VPN
VPN路由信息
确认路由表项中有去往对端CE的路由。
执行命令:
display ip routing-table vpn-instance vpn-instance-name
VPN实例发出/收到的路由属性
Export VPN Targets和Import VPN Targets配置正确。
执行命令:
display ip vpn-instance verbose
5.9 WLAN
AP信息
“State”项为“Normal”。
执行命令:
display ap
总结
本文给大家介绍了设备例行维护的命令大集合,整理花费了大量的时间,请大家多多转发,多多点赞!