带你学习毫秒级的故障检测技术BFD

news2024/9/20 14:35:48

【微|信|公|众|号:厦门微思网络】

【微思网络http://www.xmws.cn,成立于2002年,专业培训21年,思科、华为、红帽、ORACLE、VMware等厂商认证及考试,以及其他认证PMP、CISP、ITIL等】


  什么是BFD? 

BFD(Bidirectional Forwarding Detection,双向转发检测)是一种基于RFC 5880标准的高速故障检测机制,两个系统建立BFD会话后,在它们之间的通道上周期性地发送BFD报文,如果一方在协商的检测时间内没有接收到BFD报文,则认为这条双向通道上发生了故障。上层协议通过BFD感知到链路故障后可以及时采取措施,进行故障恢复。

为什么要用BFD?

为了减小设备故障对业务的影响,提高网络的可靠性,网络设备需要能够尽快检测到与相邻设备间的通信故障,以便及时采取措施,保证业务继续进行。

在现有网络中,有些链路通过硬件检测信号检测链路故障,如SDH(Synchronous Digital Hierarchy,同步数字体系)告警,但并不是所有的介质都能提供硬件检测。此时,应用就要依靠上层协议自身的Hello报文机制来进行故障检测。上层协议的检测时间通常在秒级,当数据传输速率达到GB级时,秒级检测时间内,大量数据将会丢失。在三层网络中,Hello报文检测机制无法针对所有路由来检测故障,如静态路由。这对系统间互联互通定位故障造成困难。

BFD协议就是在这种背景下产生的,BFD提供了一个通用的标准化的介质无关和协议无关的快速故障检测机制,它具有以下优点:

  • 提供轻负荷、短周期的故障检测,故障检测时间可达到毫秒级,可靠性更高。

  • 支持多种故障检测,如接口故障、数据链路故障、转发引擎本身故障等。

  • 不依赖硬件,能够对任何介质、任何协议层进行实时检测。

BFD典型应用场景

通常,BFD不能独立运行,而是作为辅助与接口状态或与路由协议(如静态路由、OSPF、IS-IS、BGP等)联动使用,此处介绍两种典型应用,其他应用场景请参见BFD应用场景。

 BFD与接口状态联动  

BFD与接口状态联动提供一种简单的机制,使得BFD检测行为可以关联接口状态,提高了接口感应链路故障的灵敏度,减少了非直连链路故障导致的问题。BFD检测到链路故障会立即上报Down消息到相应接口,使接口进入一种特殊的Down状态:BFD Down状态。该状态等效于链路协议Down状态,在该状态下只有BFD的报文可以正常处理,从而使接口也可以快速感知链路故障。

图片

BFD与接口状态联动

如图所示,链路中间存在其他设备,虽然三层仍是直连,但由于实际物理线路分段,一旦链路故障,两端设备需要比较长的时间才能检测到,导致直连路由收敛慢,网络中断时间长。在SwitchA和SwitchB上配置BFD会话,配置接口联动后,当BFD检测到链路出现故障,立即上报Down消息到相应接口,使接口进入BFD Down状态。

 BFD与OSPF联动  

网络上的链路故障或拓扑变化都会导致路由重新计算,要提高网络可用性,缩短路由协议收敛时间非常重要。由于链路故障无法完全避免,因此,加快故障感知速度并将故障快速通告给路由协议是一种可行的方案。

BFD与OSPF联动就是将BFD和OSPF协议关联起来,通过BFD对链路故障的快速感应进而通知OSPF协议,从而加快OSPF协议对于网络拓扑变化的响应。下图显示了OSPF协议是否绑定BFD时收敛速度的数据。

图片


OSPF协议收敛速度

图片


BFD与OSPF联动

如上图所示,SwitchA分别与SwitchC和SwitchD建立OSPF邻居关系,SwitchA到SwitchB的路由出接口为Interface 1,经过SwitchC到达SwitchB。邻居状态到达FULL状态时通知BFD建立BFD会话。

当SwitchA和SwitchC之间链路出现故障,BFD首先感知到并通知SwitchA。SwitchA处理邻居Down事件,重新计算路由,新的路由出接口为Interface 2,经过SwitchD到达SwitchB。

BFD是如何工作的?

BFD的检测机制是两个系统建立BFD会话,并沿它们之间的路径周期性发送BFD报文,如果一方在既定的时间内没有收到BFD报文,BFD会话状态变为Down,则认为路径上发生了故障。

下面从BFD故障检测机制、BFD会话建立流程、BFD会话建立方式三个方面介绍BFD是如何工作的。

BFD故障检查机制  

BFD在两台网络设备上建立会话,用来检测网络设备间的双向转发路径,为上层应用服务。BFD本身并没有邻居发现机制,而是靠被服务的上层应用通知其邻居信息以建立会话。会话建立后会周期性地快速发送BFD报文,如果设备在检测时间内没有收到BFD报文则认为该双向转发路径发生了故障,通知被服务的上层应用进行相应的处理。

下面以OSPF与BFD联动为例,简单介绍会话工作流程。

图片


BFD会话建立流程图

上图所示是一个简单的网络组网,两台设备上同时配置了OSPF与BFD,BFD会话建立过程如下所示:

  1. OSPF通过自己的Hello机制发现邻居并建立连接。

  2. OSPF在建立了新的邻居关系后,将邻居信息(包括目的地址和源地址等)通告给BFD。

  3. BFD根据收到的邻居信息建立会话。

  4. 会话建立以后,BFD开始检测链路故障,并做出快速反应。

图片


BFD故障发现处理流程图

如上图所示:

  1. 被检测链路出现故障。

  2. BFD快速检测到链路故障,BFD会话状态变为Down。

  3. BFD通知本地OSPF进程BFD邻居不可达。

  4. 本地OSPF进程中断OSPF邻居关系。

  BFD会话建立流程  

BFD会话有以下四种状态,会话状态变化通过BFD报文的State字段传递,系统根据本地会话状态和接收到对端BFD报文驱动状态改变。

  • Down:会话处于Down或刚刚创建状态。

  • Init:已经能够与对端系统通信,本端希望使会话进入Up状态。

  • Up:会话已经建立成功。

  • AdminDown:会话处于管理性Down状态。

BFD状态机的建立和拆除都采用三次握手机制,以确保两端系统都能知道状态的变化。以BFD会话建立为例,简单介绍状态机的迁移过程。

图片


BFD会话建立流程图

  1. SwitchA和SwitchB各自启动BFD状态机,初始状态为Down,发送状态为Down的BFD报文。对于静态配置BFD会话,报文中Remote Discriminator的值是用户指定的;对于动态创建BFD会话,Remote Discriminator的值是0。

  2. SwitchB收到状态为Down的BFD报文后,状态切换至Init,并发送状态为Init的BFD报文。

  3. SwitchB本地BFD状态为Init后,不再处理接收到的状态为Down的报文。

  4. SwitchA的BFD状态变化同SwitchB。

  5. SwitchB收到状态为Init的BFD报文后,本地状态切换至Up。

  6. SwitchA的BFD状态变化同SwitchB。

  BFD会话建立方式  

BFD有两种会话建立方式,即静态方式和动态方式。静态和动态创建BFD会话的主要区别在于本地标识符(Local Discriminator)和远端标识符(Remote Discriminator)的配置方式不同。BFD通过控制报文中的Local Discriminator和Remote Discriminator区分不同的会话。

  • 静态建立BFD会话静态建立BFD会话是指通过命令行手工配置BFD会话参数,包括配置本地标识符和远端标识符等,然后手工下发BFD会话建立请求。

  • 动态建立BFD会话动态建立BFD会话时,系统对本地标识符和远端标识符的处理方式如下:

  • 动态分配本地标识符当应用程序触发动态创建BFD会话时,系统分配属于动态会话标识符区域的值作为BFD会话的本地标识符。然后向对端发送Remote Discriminator的值为0的BFD报文,进行会话协商。

  • 自学习远端标识符当BFD会话的一端收到Remote Discriminator的值为0的BFD报文时,判断该报文是否与本地BFD会话匹配,如果匹配,则学习接收到的BFD报文中Local Discriminator的值,获取远端标识符。

BFD单臂回声功能

BFD除了与其他协议联动使用,还有一种特殊场景,即BFD单臂回声功能。

单臂回声功能是指通过BFD报文的环回操作检测转发链路的连通性。在两台直连设备中,其中一台设备支持BFD功能,另一台设备不支持BFD功能,只支持基本的网络层转发,此时可以使用BFD单臂回声功能来检测链路。

为了能够快速检测两台设备之间的故障,可以在支持BFD功能设备上创建单臂回声功能的BFD会话,支持BFD功能的设备主动发起回声请求报文,不支持BFD功能的设备接收到该报文后直接将其环回,从而实现转发链路的连通性检测功能。单臂回声功能只适用于单跳BFD会话。

图片


BFD单臂回声功能

如上图所示,SwitchA支持BFD功能,SwitchB不支持BFD功能。在SwitchA上配置单臂回声功能的BFD会话,检测SwitchA到SwitchB之间的单跳路径。SwitchB接收到SwitchA发送的BFD报文后,直接在网络层将该报文环回,从而快速检测SwitchA和SwitchB之间的直连链路的连通性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1153674.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【uniapp+vue3】scroll-view实现纵向自动滚动及swiper实现纵向自动滚动

scroll-view本身不支持自动滚动&#xff0c;通过scroll-top属性控制滚动&#xff0c;但是不可以循环滚动 <scroll-view class"notice-bar" scroll-y"true" ref"scrollViewRef" :scroll-top"data.scrollViewTop"scroll-with-animati…

Power BI 傻瓜入门 18. 让您的数据熠熠生辉

本章内容包括&#xff1a; 配置Power BI以使数据增量刷新发现使用Power BI Desktop and Services保护数据集的方法在不影响性能和完整性的情况下管理海量数据集 如果有更新的、更相关的数据可用&#xff0c;旧数据对组织没有好处。而且&#xff0c;老实说&#xff0c;如果数据…

一文搞懂“支付·清结算·账务”全局

《上帝视角看支付&#xff0c;总架构解析》 对支付的宏观层面做了分析&#xff0c;详解了整个支付体系每一层的架构和业务模型&#xff0c;而每一层的企业内部支付体系建设是什么样的&#xff1f;会涉及到哪些环节和系统&#xff1f;每个系统会涉及到哪些单据和逻辑&#xff0c…

工业级环网交换机的功效和用途

十年前&#xff0c;工业级环网交换机是一个被忽视的领域&#xff0c;在自动化中只占据了很小的一部分&#xff0c;并没有引起太多厂商的重视。随着自动化技术的不断成熟&#xff0c;工业以太网的广泛采用以及大型工业控制网络的建设&#xff0c;自动化厂商也不能忽视丰富产品线…

中文版goole浏览器支持小于12px的文字

1、说明&#xff1a; 中文版goole浏览器默认不支持小于12px的文字&#xff0c;英文版支持。 2、可浏览器设置&#xff1a; goole浏览器前往 chrome://settings/fonts&#xff0c;更改浏览器设置。 3、可代码设置 -webkit-transform:scale() 说明&#xff1a;transform:sca…

数字组合-第10届蓝桥杯省赛Python真题精选

[导读]&#xff1a;超平老师的Scratch蓝桥杯真题解读系列在推出之后&#xff0c;受到了广大老师和家长的好评&#xff0c;非常感谢各位的认可和厚爱。作为回馈&#xff0c;超平老师计划推出《Python蓝桥杯真题解析100讲》&#xff0c;这是解读系列的第1讲。 数字组合&#xff…

01-学成在线项目基础环境模块搭建

基础工程搭建 项目根目录 创建一个空工程xuecheng-plus即项目的根目录,进入Project Structure检查jdk是否配置正确 新增.gitignore文件用来设置工程中不需要向仓库提交的内容 HELP.md target/ !.mvn/wrapper/maven-wrapper.jar !**/src/main/** !**/src/test/** #### STS …

天津重点大数据培训 大数据培训的三个重要内容

随着互联网的发展和技术的进步&#xff0c;大数据的应用范围越来越广泛&#xff0c;对于企业和个人来说&#xff0c;学习和掌握大数据技术已经成为了必不可少的一项能力。大数据技术是当前和未来的发展方向&#xff0c;对于想进入互联网行业或从事相关技术工作的人来说&#xf…

毕业论文常用分析方法

毕业论文选题结束后&#xff0c;需要根据不同的研究主题以及研究目的确定相应的分析方法。同类型的研究方法有很多种&#xff0c;今天梳理了毕业论文写作的常用分析方法&#xff0c;分模块进行汇总整理&#xff0c;方便大家对照查找。 一、基本描述分析 基本描述统计分析包括频…

大坝水库安全监测终端MCU,智能化管理的新篇章!

我国目前拥有超过9.8万座水库大坝&#xff0c;其中超过95%为土石坝&#xff0c;这些大坝主要是在上世纪80年代以前建造的。这些水库大坝在保障防洪、发电、供水、灌溉等方面发挥了巨大的作用&#xff0c;但是同时也存在一定的安全风险&#xff0c;比如坝体结构破损、坝基渗漏、…

Linux环境基础开发工具使用(一)万字讲解

文章目录 一、Linux 软件包管理器 yum1、什么是软件包2、关于 rzsz3、查看软件包4、如何安装软件5、如何卸载软件 二、Linux编辑器——vim1、IDE例子2、Linux编辑器-vim使用3、 vim的基本概念4、 vim的基本操作5、 vim正常模式命令集1、插入模式2、从插入模式切换为命令模式3、…

建模和图表工具:Software Ideas Modeler Crack

用于图表、软件设计和分析的 CASE 工具 Software Ideas Modeler 是一款智能CASE 工具和 图表软件&#xff0c;支持 UML、SysML、ERD、BPMN、ArchiMate、流程图、用户故事、线框图。 提升用户体验和人工智能集成 - Software Ideas Modeler 14.05 最近发布的 14.05 版本带来了一…

uni-app微信小程序打开第三方地图

需求 小程序中有个按钮点击以后会调用手机中第三方地图进行导航。参数 位置信息 经度 与纬度。 实现方法 uni.openLocation({latitude: Number(地址纬度),longitude: Number(地址经度),name: 地址名称,address: 地址详情,success: function (res) {console.log(打开系统位置地…

每日汇评:通胀数据公布前,欧元复苏失去动力

欧元/美元周一上涨后回落至1.0600&#xff1b; 市场参与者将密切关注欧元区通胀数据&#xff1b; 如果价格跌破1.0580-1.0580区间&#xff0c;卖方可能会采取行动&#xff1b; EUR/USD积聚了多头动能&#xff0c;周一实现了一周以来最高的日内收盘价&#xff0c;超过1.0600。然…

想知道自己转本复习的效果,就试试这些方法吧

在你埋头苦学的时候&#xff0c;你觉得自己复习得怎么样&#xff1f;用下面的方法检测一下吧~ 01做题时间证明掌握程度 做题的快慢可以验证知识掌握和熟练程度。做题速度慢往往是因为对知识不熟悉。 像数学等理科&#xff0c;会对计算和解题速度要求比较高&#xff0c;需要先…

轻量级gif制作工具 GIFfun中文 for mac

GIFfun是一款GIF制作工具&#xff0c;可以帮助用户从照片和视频中创建GIF动画。该软件具有多种功能&#xff0c;例如GIF转视频、视频转GIF、照片转GIF、照片转视频、GIF转JPG、调整GIF大小、PDF转GIF、PDF转JPG、裁剪视频、GIF编辑等。 GIFfun还提供了专业版功能&#xff0c;如…

浅析 TLS(ECDHE)协议的握手流程(图解)

前言 通过 wireshark 抓取 HTTPS 包&#xff0c;理解 TLS 1.2 安全通信协议的握手流程。 重点理解几个点&#xff1a; TLS 握手流程&#xff1a;通过 wireshark 抓取 HTTPS 包理解。协商加密&#xff1a;双方通过 ECDHE 椭圆曲线的密钥交换算法&#xff0c;协商出共享的 会话…

高效管理用户权限:深入探索Spring Security的多用户类型认证、授权和Token刷新

前言 对于spring secutiry 来讲&#xff0c;其默认是只支持一种数据类型进行认证的&#xff0c;因为最后组件的方法仅为&#xff1a;loadUserByUsername(String username) 方法。 如果有多个系统来使用这个认证模块&#xff0c;会导致查询问题。这也就是不支持多用户类型认证…

C# TabControl控件设置多行属性multiline为true后切换页签出现空白

一、问题描述&#xff1a; 最近一直在做C#项目&#xff0c;随着项目的不断扩大&#xff0c;Form窗体中TabControl控件的内容一行已经放不下了&#xff0c;于是乎就设置了属性multiline为true&#xff0c;但是随之而来的就是一个新问题。当切换其他程序窗口返回后&#xff0c;就…