专线通常是指运营商为企事业单位提供的专用网络线路,用于满足其业务需求。专线管理可以提供对专线基础信息的维护,以及性能数据的监测能力。通过系统自动地、周期性地执行专线测试,获取指标数据,实现专线连通性、性能数据的全面感知。
监控易产品架构的设计和部署,可以确保运维人员随时监测国际或国内专线网络上的任何一个节点。通过这个节点,进而访问节点上的每一个交换机和路由器。监控易通过探针的方式监控链路接口的状态和链路之间的通断性。通过SNMP协议,实时监控各个端口以及每条线路的通断情况和性能指标。
1、探针监控不同链路之间以及链路两个节点之间的通断性。运维人员可以通过网络抖动、丢包等指标,来衡量网络链路质量。探针监测有两种方式:一是通过监控易服务所在的机器,用探针监测链路的端口;另一种是通过带源(地址)Ping的方式。
2、监控链路接口的状态。运维人员一般比较关心链路端口的通断情况、端口错包率,以及端口发送流量和接收流量的数据状态变化等。这些数据指标信息,能够直观反应链路当前的健康度状态。
多种方式监控网络链路状态
对于网络链路的展示,监控易提供专线管理、网络拓扑图、流量监控三种方式 。
- 专线管理
每条链路单独展示,可对国际和国内专线进行跨区域链路监控,以及监控由交换机、路由器连接的专线链路的流量、丢包率等。
监控易专线管理主要有专线配置和专线监测两大功能。
- 专线配置。专线配置功能又分为数据字典和专线测试。
基于数据字典功能,用户可针对自身专线场景,自定义配置其相关的专线参数,用于专线基本信息维护。比如:专线运营商、维护人姓名、维护人电话等字段的填写。
专线测试功能,可通过①探针监测和②接口监测两种测试方式,获取指标数据,通过指标阈值设定,系统自动判断专线状态,自动计算专线连通性,自动换算专线中断时间。
- 专线监测。专线监控功能体现在探针测试可获取的指标和接口测试可获取的指标,都支持图、表形式查看。
探针测试可获取的指标,包括服务成功率、延迟、抖动。
接口测试可获取的指标,包括接收流量、发送流量、状态、每秒发送数据包(PCS/s)、每秒接收数据包(PCS/s)、发送丢包率(%)、接收丢包率(%)、发送包错误率(%)、接收包错误率(%)、广播包(PCS/s)、接收带宽使用率(%)、发送带宽使用率(%)、管理状态等。
- 网络拓扑图
网络拓扑图,可以通过系统自动扫描获取,也可以手动绘制,进而全面展示网络架构和路由关系,比如全国网络拓扑、省级网络拓扑、局域网网络拓扑等。
通过网络拓扑图,能够可视化的展现专线的设备连接关系,以及专线状态。监控易网络拓扑图可以展现所有专线的具体信息,包括设备名称、接口名称、接口输出率、接口带宽、监测点状态、接口管理状态等。
- 流量监测
流量监控可以对所有专线接口的流量数据进行内容分析,查看应用 、协议、会话数据等。同时,可以新增专线并进行属性设置,包括专线名称、设备、端口、端口方向等。
如何进行专线监测
专线管理的设置非常简单,只需选择一个网络设备交换机或者路由器,再选择这个交换机或路由器的网络端口,主机地址就是带源(地址)Ping。专线监测时,使用带源(地址)Ping方式,从一个网络节点的本端地址Ping目的端口的连通性。因为一台机器会有很多网卡,无法明确是具体哪个接口的IP地址Ping的这个网卡,所以需要一个带源(地址)Ping来指定一个IP地址,保证是通过这个IP地址来Ping对应的网卡,最终确保这条链路的连通性。
在采集网络链路信息的时候,难免会涉及到网络规模带来的挑战。规模大的网络,链路数量非常多,面临链路采集数量庞大的运维压力。监控易对网络链路的监测,是通过安装旁路探针的方式进行分布式采集。当有很多条链路需要监测的时候,可以通过不同的采集器监控同一条链路。基于分布式部署,可以保障链路通断数据采集的时效性。
通过设置专线基本信息、添加采集器、添加策略(哪些设备之间设置专线监测),即可完成对一条网络网线的配置。监控易专线管理,可以自定义专线名称,比如命名安徽专线、襄阳专线;选择服务专线的运营商,移动、联通或者电信;还可以设置对端IP、中断时间、IP地址、本端设备、网络接口、测试策略、策略项等。
接下来,是对网络链路进行监控的过程。
前面已经提到,监控易网络专线监控策略,目前分为探针监控和接口监控两种方式。
探针监控:探针监控能够获取网络抖动、平均响应时间、服务成功率等信息,这些指标均可以设置阈值,网络监测到异常时提前预警或告警。通过网络链路数据采集,可以查看当前抖动和服务成功率的具体数值,连通状态是Up还是Down。若是down的状态,网络拓扑就会显示中间的某一条链路已断开,出现故障。
接口方式监控:链路监测从一个网络端口发起,可监控网络设备端口的指标,包括发送指标、接收指标、发送流量、接收流量、通断性、端口状态、管理状态等。任何一个指标的异常,都会在链路监测中展示。
专线监控策略建好之后,链路数据就开始自动采集。配置专线时,除了必填字段外,还可编辑扩展字段。扩展字段用来唯一标识或者标识某一条专线,通过自定义新增属性来实现。比如,字段名称、类型、日期、单选文本或多选文本等。新增这些字段后,已有的专线监测都会即时生效。
在网络链路监控中,运维人员最为关心运行期间的链路健康状态,是中断还是正常运行。假如说链路运行期间有中断,那当前状态是正常吗?再进一步,过去的24小时以及7天,链路是否有中断,中断的时长是多久?这些数据指标,都可以在监控易网络链路专线管理中展示。对于中断时长,可以按中断时间的长短进行排序,汇总查看时一目了然。
网络拓扑图上,点击拓扑专线,即可显示专线两端节点的设备名称、接口名称、接口输出速率、接口带宽、监测点状态、接口管理状态等。
比如网络拓扑中有一条北京怀柔专线,在过去的24小时之内,通过探针或者SNMP监测到这条链路的当前状态是健康。回顾一下历史监测数据,可以看到这段时间流量的变化区间,以及接收流量、发送流量、接包率、丢包率、错包率等指标。查看7天内数据,可以看到前三天是链路中断,之后一天是连通状态,然后又中断了两天。通过专线监测的时间线的颜色标识,能够清晰查看到具体哪个时间段联通、哪个时间段中断,清晰监测不同时间的连通和中断情况。
例子中北京怀柔专线,目前监测时间策略是设置为两分钟的频率,也可以自定义设置为5秒监测(监控易最低监测频率为秒级)。如果链路中断,可以查看链路中断原因。监控易自带自研的BigRiver数据库,具备高压缩机制,硬盘存储空间利用率很高。结合监控易存储监控功能,可以确保硬盘存储无忧使用。
监控易链路专线监控案例
监控易一体化综合监控运维方案,通过集中监控平台实现统一展示、统一管理。在安徽省农行链路专线监测项目中,监控易携手移动、电信、联通,实现联合运维,对3000多条链路实现统一监控、实时告警。具体价值如下:
全网链路拓扑直观管理。自动发现网络拓扑结构,并作为视图进行展示,拓扑可编辑。采用高效、多线程算法,支持对全网设备和连接定时轮询和状态刷新。
定向告警提高运维效率。对各类设备提供准确预警、告警。告警定向发送,运维人员只会收到自己负责的设备或链路相关的告警。
专线对接数据互通。监控平台与运营商网管平台对接,实现与运营商直接通过数据专线对接数据互通。