故障案例:网络访问慢

news2025/4/16 15:37:32

现象描述

FW作为中间设备的场景下,用户访问网页慢,报文延时大等。

相关告警与日志

  • 相关告警

  • 相关日志

    ARP/4/ARP_DUPLICATE_IPADDR

原因分析

图1 网络访问慢故障定位思路

  • 丢包

    报文在网络链路上传输时,可能会有部分报文在链路中被丢弃,无法及时到达对端,导致通信两端都在等待接收对端的报文,于是出现网络访问慢的现象。

    借助流量统计确定是否存在丢包及产生丢包的设备,如果存在丢包,进一步确认丢包原因,根据丢包原因进行相应处理。

    1. ARP冲突

      ARP冲突时,ARP表项存在漂移现象,报文有时无法转发到正确的目的地,只有报文正确转发出去了,网络才能通,因此,在用户端会出现访问网络慢的现象。

    2. 安全策略阻断部分流量导致访问网页慢。

      在某些业务场景下,用户上网时可能需要向多个Web服务器(对应不同的IP地址)请求资源,若安全策略只放行到部分IP地址的流量,则可能导致部分资源请求不到。客户端重连多次失败后,才会向下一个Web服务器请求资源,于是出现了访问慢的情况

    3. 未配置长连接。

      在某些特殊业务场景中,一条会话的两个连续报文可能间隔时间很长,如果没有配置长连接,会话老化后,需要重新建立连接,可能会出现访问慢的现象,这种场景下,就需要配置长连接。

    4. 接口过载保护阈值设置过高。

      出入接口上设置的过载保护阈值过高。一旦流量稍微波动,就会超过接口的最大带宽,从而引起拥塞。

  • 延时

    报文在网络链路上传输的时延大,也会导致网络访问慢。

    首先通过在终端上执行tracert命令,确认延时大的设备,然后在该设备上确定延时原因。对于FW,通常CPU使用率高会导致报文延时。

  • C:\Users\ccpladmin>tracert www.google.com
    Tracing route to www.google.com [1.1.1.1]
    over a maximum of 30 hops:
      1     5 ms     5 ms     4 ms  10.1.1.1  //从左到右分别表示:序号、最快时间、平均时间、最慢时间、链路上设备的IP地址。
      2     *        *        *     Request timed out.  //*号表示超时,一定时间内,没有返回任何时间信息,所以用*号来代替。
      3     4 ms     2 ms     2 ms  10.2.1.1
      4     2 ms     3 ms     2 ms  10.1.2.1
      5     2 ms     2 ms     2 ms  172.16.1.1
      6    83 ms   163 ms   243 ms  172.16.2.1  //第6跳,延时较大,请排查该设备。
      7     3 ms     5 ms     3 ms  192.168.1.1
      8     3 ms     3 ms     4 ms  192.168.2.1
     ...
     21     *        *        *     Request timed out.
     22     *        *        *     Request timed out.
     23     4 ms     4 ms     4 ms  1.1.1.1
    Trace complete.
    C:\Users\ccpladmin>
    1. 业务超过设备处理性能。

      流量过大,CPU使用率过高,造成部分流量无法正常转发,从而引起网络访问慢的现象。

    2. 启用了内容安全检测导致大量流量上送IAE(Intelligent Awareness Engine,智能感知引擎)处理。

      流量经过IAE后,会有一定程度的延迟,且流量上送IAE,会占用一定的CPU资源,可能会导致CPU使用率过高,从而引起网络访问慢的现象。

操作步骤

  1. 检查FW的日志缓冲区信息,查看是否存在ARP冲突日志。若存在ARP冲突,则根据日志中提示的冲突MAC地址找到冲突设备,隔离该设备后,观察是否还存在网络访问慢的现象,如果不存在,则说明是该设备导致,需要对该设备进行相应处理。

    <sysname> display logbuffer
    %2018-05-07 21:33:20 sysname %%01ARP/4/ARP_DUPLICATE_IPADDR(l): Received an ARP packet with a duplicate IP address from the interface. (IpAddress=192.168.1.1, InterfaceName=Ethernet0/0/0, MacAddress=0024-xxxx-xxxx)
    %2018-05-07 21:33:15 sysname %%01ARP/4/ARP_DUPLICATE_IPADDR(l): Received an ARP packet with a duplicate IP address from the interface. (IpAddress=192.168.1.1, InterfaceName=Ethernet0/0/0, MacAddress=0024-xxxx-xxxx)
    %2018-05-07 21:33:10 sysname %%01ARP/4/ARP_DUPLICATE_IPADDR(l): Received an ARP packet with a duplicate IP address from the interface. (IpAddress=192.168.1.1, InterfaceName=Ethernet0/0/0, MacAddress=0024-xxxx-xxxx)
    %2018-05-07 21:33:05 sysname %%01ARP/4/ARP_DUPLICATE_IPADDR(l): Received an ARP packet with a duplicate IP address from the interface. (IpAddress=192.168.1.1, InterfaceName=Ethernet0/0/0, MacAddress=0024-xxxx-xxxx)

  2. 结合业务场景,查看安全策略的配置是否合理。

    在某些业务场景下,用户上网时可能需要向多个Web服务器(对应不同的IP地址)请求资源,若安全策略只放行到部分IP地址的流量,则可能导致部分资源请求不到。客户端重连多次失败后,才会向下一个Web服务器请求资源,于是出现了访问慢的情况。通过在用户端抓包确定用户端是否会向多个IP地址发起请求。

    这种场景下,需要先配置较宽泛的安全策略放行指定域间流量,观察访问慢的现象是否消失。若现象消失,则确认是该原因引起。再根据实际业务流向将安全策略修改为明细安全策略,允许用户上网的流量通过。

  3. 结合业务场景,判断是否需要配置长连接。如果需要,先配置精确的安全策略,用于匹配需要长时间保持会话的流量,然后在安全策略中启用长连接并配置合理的长连接老化时间。

    在某些特殊业务场景中,一条会话的两个连续报文可能间隔时间很长,如果没有配置长连接,会话老化后,需要重新建立连接,可能会出现访问慢的现象,这种场景下,就需要配置长连接。

    例如,客户端访问SQL数据库的场景中,FW作为中间设备,客户端和服务器之间通过心跳报文来探测连接是否正常,通常两次心跳报文之间间隔时间较长。如果FW上没有配置相应的长连接,则可能出现后续的心跳报文没有匹配到相应的会话而被丢弃。此时,需要重新建立连接,就会出现用户访问SQL数据库变慢或使用该数据库服务的应用程序报错的现象。

  4. 查看接口的过载保护阈值配置。通常情况下,建议将接口的过载保护阈值配置为90%。

    在Web界面,选择“网络 > 接口”,单击接口所在行的,进入接口配置界面,查看过载保护阈值的配置。

  5. 检查FW的日志缓冲区信息,查看是否存在数据面CPU高的告警。

    <sysname> display logbuffer
    %2017-01-03 16:39:58 sysname %%01SYSTEM/2/DATAPLANECPU(l): The dataplane CPU usage exceeded the threshold (90%). The dataplane CPU usage was 99%.

    若存在,再执行display cpu-usage命令查看哪些进程占用了较高的CPU,针对不同原因采取相应措施。

    如下示例表明fpath.out(转发进程)或nge.out(内容安全过滤进程)占用过高的CPU。

    <sysname> display cpu-usage
    CPU Usage Stat. Cycle: 10 (Second) 
    CPU Usage            : 82.2%  Max: 96.6% 
    Management-plane CPU Usage: 11.9% Data-plane CPU Usage : 99.5% 
    CPU Usage Stat. Time : 2018-04-26 14:27:58 
    CPU utilization for ten seconds:  82.2% : one minute:  82.8% : five minutes:  81.9% 
    PID    ProcessName    CPU    Runtime    State 
    718    fpath.out      47.5%  68063937   S 
    311    vrp            2.8%   2598048    S 
    720    gm.out         2.1%   3083493    S 
    667    vrpio_s        0.2%   414173     S 
    737    nge.out        50.6%  105723     S 

    若是fpath.out占用较高CPU,则表示业务量过大,可考虑使用处理性能更高的型号替换该FW。

    若是nge.out占用较高CPU,则可执行engine bypass命令将IAE(Intelligent Awareness Engine,智能感知引擎)手动设置为Bypass状态后测试。

  6. 查看安全策略中是否启用了内容安全检测。若已启用,在允许的情况下,执行engine bypass命令将IAE手动设置为Bypass状态,若此时上网恢复正常,则表明是该原因引起。然后关闭Bypass状态后,配置明细安全策略,仅对需要进行内容安全检测的流量启用相应的内容安全检测功能。

    在安全策略中启用了IPS、AV 、URL filter、文件过滤等内容安全检测功能后,匹配了安全策略的所有流量会上送IAE处理,IAE会针对流量的应用层信息进行检测和处理。当IAE处理的流量很大时,可能会影响用户的上网速度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1967912.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

用深度学习改进乳腺癌MRI诊断| 文献速递--AI辅助的放射影像疾病诊断

Title 题目 Improving breast cancer diagnostics with deep learning for MRI 用深度学习改进乳腺癌MRI诊断 01 文献速递介绍 乳腺磁共振成像&#xff08;MRI&#xff09;是一种检测乳腺癌的高度敏感的方式&#xff0c;报告的敏感性超过80%。传统上&#xff0c;其在筛查…

【算法】动态规划-斐波那契数列模型

目录 1、第N个泰波那契数 1.1 算法原理讲解 1.1.1 状态表示 1.1.2 状态转移方程 1.1.3 初始化 1.1.4 填表顺序 1.1.5 返回值 1.2 代码实现 1.3 空间优化 2、三步问题 2.1 算法原理讲解 2.1.1 状态表示 2.1.2 状态转移方程 2.1.3 初始化 2.1.4 填表顺序 2.1.5 返…

(四十一)大数据实战——spark的yarn模式生产环境部署

前言 Spark 是一个开源的分布式计算系统。它提供了高效的数据处理能力&#xff0c;支持复杂的数据分析和处理任务&#xff0c;是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。Spark Core&#xff1a;实现了Spark的基本功能&#xff0c;包含任务调度、内存管理、错误…

上线前端系统

上线一个静态的前端系统&#xff08;续&#xff09; 在eleme服务器上 启动服务 启动rpcbind [rooteleme-static ~]# systemctl restart rpcbind 启动nfs [rooteleme-static ~]# systemctl restart nfs 重启服务 启动smb [rootstatic-server img]# systemctl start smb…

SQL数据库模糊查询指定的字符的表资料(CHARINDEX)

1.目的 MSG栏位里面有很多组合内容的字符信息&#xff0c;需要进行模糊查询。 2.问题 正常使用LIKE 语句可以通用大部分的查询需求&#xff0c;但是遇到部分的特殊字符&#xff0c;例如&#xff1a;[] 资料是存在数据资料中&#xff0c;但是查询反馈的结果是没有内容&#xf…

二刷代码随想录训练营Day 16|513.找树左下角的值、112.路径总和、106.从中序与后序遍历序列构造二叉树

1.找到左下角的值 513. 找树左下角的值 - 力扣&#xff08;LeetCode&#xff09;代码随想录 (programmercarl.com) 代码&#xff1a; class Solution { public:int maxDepth INT_MIN;int result;// 深度最大&#xff0c;确保是最后一行 先遍历左孩子再遍历右孩子 确保是左下…

进程地址空间,零基础最最最详解

目录 建议全文阅读&#xff01;&#xff01;&#xff01; 建议全文阅读&#xff01;&#xff01;&#xff01; 建议全文阅读&#xff01;&#xff01;&#xff01; 一、什么是地址空间 1、概念 2、主要组成部分 3、特点和作用 &#xff08;1&#xff09;虚拟化&#xf…

Java并发—volatile关键字

在这篇文章Java并发—Java内存模型以及线程安全-CSDN博客多次提及volatile关键字&#xff0c;这是一个非常重要的概念&#xff0c;主要用于多线程编程中&#xff0c;它确保了变量的可见性和禁止指令重排序&#xff0c;但不保证原子性&#xff0c;下面详细解释volatile关键字的作…

未来3-5年,哪些工作会被AI取代

一篇由高盛经济学家约瑟夫布里格斯 &#xff08;Joseph Briggs&#xff09;和德维西科德纳尼 &#xff08;Devesh Kodnani&#xff09;撰写的报告指出&#xff0c;全球预计将有3亿个工作岗位被生成式AI取代。 报告称&#xff1a;“最近出现的生成式人工智能将降低劳动力成本和…

​宁德时代:续航还剩多少?

车企价格战打到供应商&#xff0c;连续增利不增收。 今天我们看宁德时代的增长电池续航还剩多少&#xff1f; 巨头长成&#xff0c;就要面临增长瓶颈。“宁王”24年中报公布&#xff0c;业绩喜忧参半。二季度营收869.96亿&#xff0c;同比下滑13.18%&#xff0c; 已经是宁德时…

冠军之选:奥运冠军青睐的游泳耳机款式大公开

在最新一届的夏季奥林匹克运动会中&#xff0c;泳池边的激烈竞争再次点燃了全球观众的热情。游泳运动员们&#xff0c;以惊人的速度和毅力&#xff0c;一次又一次地刷新纪录&#xff0c;向世人展示了人类极限的无限可能。而在这些运动员备战的过程中&#xff0c;有一个细节或许…

吴恩达老师机器学习-ex5

有借鉴网上部分博客 首先&#xff0c;我先使用该数据集&#xff0c;通过线性回归的方法&#xff0c;做了一个预测问题 import numpy as np import scipy.io as sio import matplotlib.pyplot as plt from scipy.optimize import minimize#读取数据 path "./ex5data1.ma…

Spine 核心功能入门

核心功能入门 本文主旨是整理我在入手学习 spine 时的流程&#xff0c;以及对于基本功能的理解和常规 2D 动画实现的思路。 意在整理出一个简要的入门 spine 的流程&#xff0c;以及对于一些高阶功能的应用的思考。 本文基于 https://zh.esotericsoftware.com/ 官网教程进行思…

2024.8.1 作业

使用两个线程完成两个文件的拷贝&#xff0c;分支线程1拷贝前一半&#xff0c;分支线程2拷贝后一半&#xff0c;主线程回收两个分支线程的资源 #include <myhead.h>struct Buf {const char *file1;const char *file2;int start;int size; };int get_len(const char *arr…

从线段中搜寻提取闭合轮廓(二)

接上篇文章从线段中搜寻闭合轮廓_多线段搜索区域集合 快速-CSDN博客 1. 前言 调试了上篇文章中参考代码修了一些问题&#xff0c;优化了显示&#xff0c;但是由于算法逻辑存在一些问题&#xff0c;有很多不必要的性能损耗&#xff0c;且逻辑不是最优的&#xff0c;于是博主找…

FPGA开发——蜂鸣器实现音乐播放器的设计

一、概述 我们在进行蜂鸣器的学习的时候&#xff0c;总会在想既然蜂鸣器能够发出声音&#xff0c;那么它能够播放音乐吗&#xff0c;今天这篇我们文章我们就一起来学习怎样使用使用蜂鸣器来播放音乐&#xff0c;也就是怎样成为一个音乐播放器。 1、蜂鸣器的类型 在设计的时候…

玩机进阶教程-----手机恢复出厂 误删除照片视频 误刷机后 几种数据恢复操作步骤解析【一】

手机中存储有众多的照片 视频 文件或者电话本这类的数据,虽然目前很多机型都有云存储。可以随时同步手机的存储数据。但万一云存储没有开启同步或者密码忘记。或者恢复出厂等等原因造成以上的数据丢失。或者手机系统问题导致的不开机但需要其中的数据等等。那么如何简单快速的…

【项目日记(五)】梦幻笔耕-测试报告

❣博主主页: 33的博客❣ ▶️文章专栏分类:项目日记◀️ &#x1f69a;我的代码仓库: 33的代码仓库&#x1f69a; &#x1faf5;&#x1faf5;&#x1faf5;关注我带你了解更多项目内容 目录 1.项目背景2.测试环境3.测试计划3.1功能测试3.2自动化测试 1.项目背景 个人博客系统…

剪画小程序:自媒体创业者的准备-文案!

作为一个刚刚踏入自媒体领域的新人&#xff0c;我满怀着激情和憧憬&#xff0c;渴望通过视频分享自己的见解和生活点滴。然而&#xff0c;视频文案的创作却成了我面前难以逾越的高山。 在构思旅行视频时&#xff0c;面对美丽的风景和丰富的经历&#xff0c;我却无法用恰当的文字…

嵌入式学习Day19---Linux软件编程

目录 一、标准I/O 1.1.fseek 1.偏移量 2.实例 ​编辑 1.2.ftell 2.实例 ​编辑 二、文件I/O 2.1.打开文件 1.open 2.2.实例 2.2.读写文件 1.write 实例 ​编辑 2.read 实例 2.3.关闭文件 1.close 2.3.lseek 实例 三、标准I/O与文件I/O的区别 3.1.区别 四、其…