论文-分布式-分布式计算|容错-分布式控制下的自稳定系统

news2025/1/15 20:48:39
  • 参考文献
  • Self-stabilizing systems in spite of distributed control
  • 可以把松散耦合的 循环序列过程 间的同步任务,看成是要保持一个这样的不变性:“系统要处于一种合法状态”
  • 因此每个进程在运行每一个可能会改变不变性的步骤之前都要先检查一下是可以执行,还是要延迟执行
  • 如果允许不同进程互斥地访问记录有“当前系统状态”的公共存储,解决方案就很简洁—并且可以很系统化地实现
  • 如果没有一个所有进程都可以访问的公共存储模块的话,复杂度就会增加,因为当前系统的状态就不得不分布式地存储在各个进程内的变量中;
  • 进一步地,如果再对通信进行限定,比如每个进程只能与它的邻居进行通信,复杂度还会上升
  • 问题的复杂性在于单个进程的状态只能被整个系统状态中对它可用的那一部分影响,而进程本地动作要基于本地信息实现全局性的目标
  • 这样的系统(可以称之为“分布式控制”系统)已经被设计出来,但是当时所知的所有设计都不是“自稳定”的,也就是说它们一旦进入非法状态,就会永远处于这种状态
  • 考虑一个由少数边连接的图,图中每个节点对应一个有限状态机;
  • 图中直接相连的那些状态机,它们相互之间称为邻居
  • 每个状态机定义一个或多个"特权",比如是关于它自己和邻居状态的一组布尔函数;
  • 当布尔函数值为 true 时,我们就认为对应的特权“存在”
  • 我们引入一个中央守护进程,采用中央守护进程只是为了方便说明,实际上可以采用一个分布式的 守护进程 来完成,具体算法本文没有涉及
  • 一个简单的观察是如果享有 特权 的是不相邻的状态机,它们的转换是可以并行进行的,它们不需要同步,因为并行运行的结果与通过一个中央守护进程选择一个进行执行是一致的,因为选择一个执行之后,由于它们两个不相邻,因此另一个的邻居状态不会改变,在新的状态中另一个依然是享有特权者,下一次可以继续选择它,而相邻的实际上因为可以相互通信,它们自己可以协调到底是谁进行状态转换
  • 在下面的状态转换手动演练中,实际上我们就充当了中央守护进程的角色,在有多个 特权 存在的情况下,选择其中一个进行状态转换,通过它从“存在”的 特权 中选择一个进行状态转换,每个合法状态中可能有多个特权“存在”,所以需要从里面选择一个进行状态转换
  • 允许多个享有特权者是一种更通用的需求,只有一个享有特权者的情况是互斥锁,而多个则可以类比信号量
  • 拥有该被选定的 特权 的状态机可以进行状态转换—根据一个以它的老状态和邻居状态为输入的状态函数进入新状态
  • 对于不止有一个 特权“存在”的状态机来说,新状态可能还依赖于被选定的特权
  • 状态转换完成后,守护进程再选择一个新的特权
  • 可以通过如下全局规则判断系统是否处于合法状态
  • 要求:
    • 1. 每个合法状态,必须至少要有一个 特权“存在”
    • 2. 在合法状态的每一个执行步骤都要确保系统还是会处于合法状态
    • 3. 每个 特权 至少出现在一个合法状态中
    • 4. 对于任意两个合法状态来说,总是可以通过一定执行步骤从一个到达另一个
  • 我们称一个系统是“自稳定”的,当且仅当无论系统初始状态如何也无论每次为下一个执行步骤选定的 特权 是谁,可以保证在有限数目的执行步骤之后总是至少存在一个 特权 并且系统可以发现它自己处于合法状态
  • “自稳定”的系统是否能通过各节点的本地执行步骤来满足上述的全局性条件,本来也不是可以很直接地得出结论
  • 而守护进程的不确定性引入了额外的复杂度
  • 实际上该问题可以通过如下三个方案解决:
  • 在如下三个解决方案中,我们假设有 N+1 个进程,它们以 0…N 进行编号
  • 假设当前机器编号为 nr.i
  • L,代表机器的左邻居的状态,对应的机器编号为 nr.(i-1) mod (N+1)
  • S,代表当前机器自己的状态,编号为 nr.i
  • R,代表机器的右邻居的状态,对应的机器编号为 nr.(i+1) mod (N+1)
  • 换句话说,我们假设机器是像环一样连接在一块
  • 机器 nr.0 又称为“底部机器”,机器 nr.N 则又被称为“顶部机器”
  • 同时在这里我们将那些只有一个 特权“存在”的状态作为合法状态
  • 同时所有的方案描述,均采用了如下格式:
  • “if privilege then corresponding move fi” 如果有特权,那么就进行相应的操作
  • Solution with K-state Machines (K>N)
  • 每个机器的状态由一个整数 S 表示,并且0=<S<K
  • 对于每个机器来说,只定义一个 特权,具体如下:
  • 对于底部机器来说,if L = S then S := (S+1)mod K fi
  • 对于其他机器来说,if L != S then S := L fi
  • 说明 1:对于一个中央式的守护进程来说,K>=N 就可以了
  • 说明 2:C.S.Scholten 扩展了该解决方案,使之可以应用到任意网络结构
  • 根据格式“if privilege then corresponding move fi”,我们可以看出,在上面的解决方案中,对于 底部机器 来说 L=S 就是 特权,意味着如果 L=S 它就是享有特权者,对于其他机器来说 L!=S 就是 特权,意味着如果 L!=S 它就是享有特权者
  • 我们可以以 3 个状态机为例,令 K=4,根据上面的算法进行模拟运行可以发现,即使一开始不满足有一个特权者,执行一段时间后会进入只有一个特权者的状态,并且此后一直处于只有一个特权者的状态
  • 比如如下状态转换序列,如下数组中的值分别代表编号为 0,1,2 的状态机的状态值
  • [0, 1, 2] -> [0, 0, 2] -> [0, 0, 0] -> [1, 0, 0] -> [1, 1, 0] -> [1, 1, 1] -> [2, 1, 1] -> [2, 2, 1] -> [2, 2, 2]……
  • 如上,初始状态状态机 0,1,2 对应的 S 值为[0, 1, 2]
  • 根据方案描述:
    • 对于状态 1 来说状态值是 1,左右值分别是 0 和 2,因此满足 L!=S,所以此时状态机 1 享有特权
    • 对于状态机 2 来说状态值是 2,左右值分别是 1 和 0,因此也满足 L!=S,因此它也是享有特权者
    • 对于 0 来说,要看 L 是否等于 S,由于 0 的左右值是 2和 1,因此它不享有特权
  • 可以看到这个初始状态,有两个享有特权者,不满足上面关于合法状态中只有一个特权者的定义
  • 然后我们根据状态转换函数,从初始状态开始不断进行状态转换,可以看到到了[0, 0, 0]后,变成了只有状态机 0为特权者,而此后就一直处于只有一个享有特权者的状态
  • 可以看到整个过程中,就是从初始处于非法状态,然后经过一定步骤进入了合法状态,此后就一直处于合法状态
  • 而这个过程中,进程只看了它左右邻居的状态,通过局部信息就实现了只有一个享有特权者这一全局性需求
  • 这实际上说明了在分布式系统中,我们仅通过部分节点的局部信息不需要得到全局状态,就可以实现全局性的状态要求
  • 其他两个方案代表的含义与上述解决方案类似,有个区别是状态机定义了两个特权
  • 以第三个方案为例,我们再手动模拟一个状态转换过程,假设有 4 个状态机,它们的初始状态值分别为[0,1,2,0]:
  • 按照下面的算法描述,可以得到如下一个状态转换过程
  • [0,1,2,0] 此时 0,1,2 均为享有特权者,选择 0 进行状态转换
  • [2,1,2,0] 此时 1,2 为享有特权者,选择 1 进行状态转换
  • [2,2,2,0] 此时 2,3 为享有特权者,选择 2 进行状态转换
  • [2,2,0,0] 此时 1 为享有特权者,1 进行状态转换
  • [2,0,0,0] 此时 0 为享有特权者,0 进行状态转换……
  • 可以看到,依然是初始不合法,然后一定步骤后变成合法,之后一直合法
  • 方案 3 具体算法如下:

  • 上述三个解决方案说明:对于一个分布式系统来言,即使节点只能跟所有节点中的部分节点进行通信,对于上述特权者(互斥,任意时刻只有一个特权者)问题而言,存在一个“自稳定”的算法
  • 无论系统初始状态如何,经历一定步骤之后它都可以进入合法状态
  • “自稳定”属性使得分布式算法可以从暂态错误中恢复
  • Dijskstra 在论文中提出了“自稳定”概念,并以上述“令牌环”问题为例给出了相应的自稳定算法
  • 在“令牌环”场景下,计算机网络连接成环状,每个计算机可以获取它前面的那个计算机的状态,该状态可以显示该计算机“持有令牌”还是“不持有令牌”
  • 对应的算法要满足如下两个条件:
  • 1.任意时刻只有一个计算机持有令牌
  • 2.持有令牌的计算机会将令牌传给它后面的计算机,最终该令牌可以在环上循环流转
  • 不持有令牌对于单个计算机来说是合法的,但是如果所有计算机都不持有令牌,对于整个系统来说就是非法的
  • 类似的,如果有不止一个计算机持有令牌,也是非法的,但是对于每个计算机来说这很难发现,因为他们每个都只能与邻居通信
  • 因此,论文中的算法并没有去检测错误,而是确保系统不断向着合法状态前进
  • 而且那个时候用于错误检测的传统方法很困难而且很耗时
  • 但是随着新的更高效的错误检测算法的提出,基于错误检测还可以将非自稳定算法结合自稳定算法实现更高效的自稳定算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1134206.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

信息系统架构的设计理论与实践

信息系统架构的设计理论与实践 信息系统架构概述 信息系统架构的定义和发展 信息系统架构的定义 骚戴理解&#xff1a;这里只要背定义即可 信息系统架构的发展 信息系统架构的分类&#xff08;集中式和分布式&#xff09; 集中式结构 分布式结构 信息系统常用的四种架构模型…

操作系统-浅谈CPU与内存

目录 计算机的基本组成CPU内存虚拟内存内存分段内存分页 CPU与内存的交互过程高速缓存cache 所有图片均来自&#xff1a;小林coding 计算机的基本组成 计算机由软件和硬件组成 硬件由CPU(中央处理器&#xff09;存储器(内存外存&#xff09;外部设备组成。 软件由应用软件和系…

Flink 自定义拓展 SQL 语法

1、Flink 扩展 calcite 中的语法解析 1&#xff09;定义需要的 SqlNode 节点类-以 SqlShowCatalogs 为例 a&#xff09;类位置 flink/flink-table/flink-sql-parser/src/main/java/org/apache/flink/sql/parser/dql/SqlShowCatalogs.java 核心方法&#xff1a; Override pu…

JVM 调优JVM 性能优化

所谓“调优”就是一个诊断和处理手段&#xff0c;最终的目标是让系统的处理能力&#xff0c;也就是“性能”达到最优化。 计算机系统中&#xff0c;性能相关的资源主要分为这几类&#xff1a; CPU&#xff1a;CPU 是系统最关键的计算资源&#xff0c;在单位时间内有限&#xf…

Windows10系统安装telnet命令

简介 telnet命令可以测试目标服务器端口是否开通&#xff0c;使用命令 telnet ip地址 端口&#xff0c;输入命令后回车&#xff0c;如果进入输入状态&#xff0c;则表示目标服务器端口已开通&#xff0c;可以通过外网访问 Windows10系统安装步骤 1.打开控制面板 2.选择程序…

MS1112可替代ADS1112,16-bit 多输入内置基准模数转换器

MS1112 是一款高精度 16bit 模数转换器&#xff0c;具有 2 组差分输入 或 3 组单端输入通道&#xff0c;高达 16bits 的分辨率。内部集成 2.048V 基 准源&#xff0c;差分输入范围达到 2.048V 。 MS1112 使用了 I 2 C 兼容接口&#xff0c; 并有 2 个地址管…

Linux网络流量监控iftop

在 Linux 系统下即时监控服务器的网络带宽使用情况&#xff0c;有很多工具&#xff0c;比如 iptraf、nethogs 等等&#xff0c;但是推荐使用小巧但功能很强大的 iftop 工具【官网&#xff1a;http://www.ex-parrot.com/~pdw/iftop/】。iftop 是 Linux 系统一个免费的网卡实时流…

elasticsearch-5.6.15集群部署,如何部署x-pack并添加安全认证

目录 一、环境 1、JDK、映射、域名、三墙 2、三台服务器创建用户、并为用户授权 二、配置elasticsearch-5.6.15实例 1、官网获取elasticsearch-5.6.15.tar.gz&#xff0c;拉取到三台服务器 2、elas环境准备 3、修改elasticsearch.yml配置 4、修改软、硬件线程数 5、修改…

PHP 危险函数1-OS 命令执行函数

OS 命令执行函数 system 函数 特点&#xff1a; 自带输出功能自动区分系统平台&#xff0c;只需得知目标系统在 system() 中输入对应系统的命令即可 使用 <?phpsystem("<系统命令>"); ?>如 <pre> <?phpsystem("ipconfig"); …

如何在VScode中让printf输出中文

如何在VScode中让printf输出中文&#xff1f; 1、在“Visual Studio Code”图标上右击&#xff0c;弹出对话框。见下图&#xff1a; 2、点击“以管理员身份运行”&#xff0c;得到下图&#xff1a; 3、点击“UTF-8”按钮&#xff0c;得到下图&#xff1a; 4、点击“通过编码重…

机器学习实验三:决策树-隐形眼镜分类(判断视力程度)

决策树-隐形眼镜分类&#xff08;判断视力程度&#xff09; Title : 使用决策树预测隐形眼镜类型 # Description :隐形眼镜数据是非常著名的数据集 &#xff0c;它包含很多患者眼部状况的观察条件以及医生推荐的隐形眼镜类型 。 # 隐形眼镜类型包括硬材质 、软材质以及不适合佩…

MFC 注册表

文章目录 打开注册表对注册表的键的操作创建子键删除子键遍历子键 对注册表值的操作读取值设置值 打开注册表 void CREGDemoDlg::OnBnClickedBtnOpen() {//打开注册表HKEY hKey;if (ERROR_SUCCESS ! RegOpenKeyEx(HKEY_CURRENT_USER, L"SOFTWARE\\Baidu.com", 0, KEY…

*Django中的Ajax 纯js的书写样式1

搭建项目 建立一个Djano项目&#xff0c;建立一个app&#xff0c;建立路径&#xff0c;视图函数大多为render, Ajax的创建 urls.py path(index/,views.index), path(index2/,views.index2), views.py def index(request):return render(request,01.html) def index2(requ…

【Java集合类面试二十三】、List和Set有什么区别?

文章底部有个人公众号&#xff1a;热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享&#xff1f; 踩过的坑没必要让别人在再踩&#xff0c;自己复盘也能加深记忆。利己利人、所谓双赢。 面试官&#xff1a;List和Set有什么区别&am…

【Java集合类面试二十五】、有哪些线程安全的List?

文章底部有个人公众号&#xff1a;热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享&#xff1f; 踩过的坑没必要让别人在再踩&#xff0c;自己复盘也能加深记忆。利己利人、所谓双赢。 面试官&#xff1a;有哪些线程安全的List&a…

Controller接收Postman的raw参数时,属性值全部为空

Controller接收Postman的raw参数时&#xff0c;属性值全部为空 情景再现 在进行业务代码的编写过程中&#xff0c;使用Postman等工具调用Controller接口时&#xff0c;发现属性值全部为空后端代码如下&#xff1a; Requset对象为&#xff1a; public class QuerySkuRequest …

十八、字符串(4)

本章概要 扫描输入 Scanner 分隔符用正则表达式扫描 StringTokenizer 类 扫描输入 到目前为止&#xff0c;从文件或标准输入读取数据还是一件相当痛苦的事情。一般的解决办法就是读入一行文本&#xff0c;对其进行分词&#xff0c;然后使用 Integer、Double 等类的各种解析方…

【Java】电子病历编辑器源码(云端SaaS服务)

电子病历编辑器极具灵活性&#xff0c;它既可嵌入到医院HIS系统中&#xff0c;作为内置编辑工具供多个模块使用&#xff0c;也可以独立拿出来&#xff0c;与第三方业务厂商展开合作&#xff0c;为他们提供病历书写功能&#xff0c;充分发挥编辑器的功能。 电子病历基于云端SaaS…

机器学习之查准率、查全率与F1

文章目录 查准率&#xff08;Precision&#xff09;&#xff1a;查全率&#xff08;Recall&#xff09;&#xff1a;F1分数&#xff08;F1 Score&#xff09;&#xff1a;实例P-R曲线F1度量python实现 查准率&#xff08;Precision&#xff09;&#xff1a; 定义&#xff1a; …

ORB-SLAM安装过程遇到问题记录整理

一、ORB-SLAM2 1.c error: ‘decay_t’ is not a member of ‘std’ 如下图所示&#xff1a; 解决方法&#xff1a; 修改 ORB_SLAM的 CMAKELIST.txt文件&#xff0c; 将set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -stdc11") 修改为 set(CMAKE_CXX_STANDARD 14) 2…