分布式操作系统 - 7.分布式一致性与复制管理

news2025/1/11 11:47:50

文章目录

  • 1.一致性与复制
    • 1.1 对象复制问题
      • (1)单副本对象的同步控制
      • (2)单副本同步控制方法
      • (3)多副本对象的同步控制方法
    • 1.2 支持伸缩性的复制技术
  • 2.以数据为中心的一致性模型
    • 2.1 分布式数据仓(data store)模型
    • 2.2 一致性模型
    • 2.3 连续一致性
      • (1)示例
      • (2)一致性单元的粒度选择
    • 2.4 严格一致性
    • 2.5 顺序一致性
      • (1)示例
      • (2)执行(Execution)
      • (3)历程(History)
    • 2.6 线性一致性
    • 2.7 因果一致性
    • 2.8 FIFO一致性
    • 2.9 分组操作
    • 2.10 释放一致性
    • 2.11 入口项一致性
    • 2.12 总结
  • 3.以客户为中心的一致性模型
    • 3.1 最终一致性(eventual consistency)
    • 3.2 客户为中心的一致性
    • 3.2单调读一致性
    • 3.3 单调写一致性
    • 3.4读自己写一致性
    • 3.5 写跟随读一致性
  • 4.复制管理
    • 4.1 副本服务器的放置策略
      • (1)基于距离的方法
    • (2)基于自治系统的方法
      • (3)基于单元的方法
    • 4.2 内容复制与放置
      • (1)永久性副本
      • (2)服务器发起型副本
      • (3)客户端发起副本
    • 4.3 内容分发
      • (1)更新传播
      • (2)推送式与拉取式协议
      • (3)推送式协议与拉取式协议的比较
      • (4)推拉混合式方法
    • 4.4 单播方式与多播方式
  • 5.一致性协议
    • 5.1 远程写协议
      • (1)单个主副本服务器
      • (2)带有备份的主副本服务器
    • 5.2 本地写协议
      • (1)单个主副本服务器
      • (2)带有备份的主副本服务器
    • 5.3 复制式写协议
      • 问题1: 更新顺序问题
      • 问题2:重复调用问题
    • 5.4 基于合法数的协议
    • 5.5 以客户为中心一致性的实现技术
      • (1)基本方法
      • (2)实现技术:单调读一致性
      • (3)实现技术:单调写一致性
      • (3)实现技术:读自己写一致性
      • (4)写跟随读一致性
      • (5)优化方法
        • 基于会话(session)的优化方法
        • 基于时间戳向量的优化方法
        • 例: 单调读一致性
    • 5.6 连续一致性协议
      • (1)数值误差限制实现
      • (2)陈旧度限制的实现
      • (3)次序误差限制的实现

1.一致性与复制

复制的理由:

  • 提高可靠性:防止单点失败,数据校验
  • 提高性能:并行性,可伸缩性

复制的代价

  • 一致性维护:更新问题
  • 例1:Web页的Cache、镜像网站

1.1 对象复制问题

(1)单副本对象的同步控制

例:两个客户并发访问一个分布式远程控制对象

在这里插入图片描述

(2)单副本同步控制方法

由远程对象自己处理对它的并发调用。 如Java,同时只允许执行一个方法线程

由对象适配器处理并发调用。如一个对象一个线程

在这里插入图片描述

(3)多副本对象的同步控制方法

构造感知复制对象,由对象自己保证一致性。

由分布式系统负责复制管理,由系统保证对副本访问的正确次序。例,CORBA中,支持全序的、因果一致性的对象调用

在这里插入图片描述

1.2 支持伸缩性的复制技术

将数据的副本放置在处理它们的进程附近以减少访问时间,解决可伸缩性问题

在这里插入图片描述

**复制策略 **

  • 更新操作和访问操作的trade-off
  • 设进程P对数据d的访问N次/秒,d的更新M次/秒
  • 当N<<M时,访问/更新比非常低,由于一致性维护带来更大代价,因此,不应复制

**一致性维护与可伸缩性问题 **

  • 保证所有的副本都是相同的,→ 紧密一致性
  • 当某个副本上执行更新操作时,需对所有副本进行全局同步 ,在大型系统上很难实施 → 可伸缩性问题

解决策略

  • 松驰一致性,所有副本不一定保持完全相同,尽量减少立即的全局同步

2.以数据为中心的一致性模型

2.1 分布式数据仓(data store)模型

物理上,分布的和复制的。例,分布式共享内存、数据库、文件

操作:每个进程可执行读操作,写操作。写操作在本地副本上进行,再传播给其他副本

在这里插入图片描述

2.2 一致性模型

数据相干性(coherency)

  • 同一个数据在各个数据仓中的值保持一致
  • 从单个数据的视角

一致性模型

  • 多个进程与多个数据之间的操作,保持一致性
  • 进程与数据仓之间的契约(contract)
  • 如果进程遵守约定的规则,数据仓就能工作正常。
  • 如果进程违反了这些规则,数据仓就不再保证操作的正确性

2.3 连续一致性

连续一致性(continuous consistency)

  • (数值误差,次序误差,陈旧度)
  • 数值误差:未传播的写操作的权重值
  • 次序误差:临时写操作的个数
  • 陈旧度:写操作传播的延迟(只要一个副本不太旧,就可以容忍它提供旧的数据。例如,天气报告)

一致性单元(conit):受控的数据集

顺序偏差即在本地还没有提交的更新操作的个数

数值偏差(x,y): x表示其他副本已经做了, 但是本地副本还没看见的操作数量; Y表示这些操作带来的数值变化

举例:conit(x, y)

在这里插入图片描述

<5, B>:5为时间戳,B为从B传过来

(1)示例

示例1:如下图所示,为持续一致性的示意图。在副本A和副本B中有含数据项x和y,这两个变量都假设初始化为0。操作表格中阴影部分表示为持久化(永久性)的操作,不能回滚;其余操作表示暂时的更新操作。请采用向量时钟、顺序误差和数值误差三个指标描述两个副本之间的差异。(其中数值误差用各数据项的差分和表示)

在这里插入图片描述

(1)向量时钟:

  • 对于副本A而言,由于副本A和副本B中有含数据项x和y,这两个变量都假设初始化为0,副本A最后的操作是<14, A>,所以A的向量时钟:A=(15, 5)
  • 对于副本B而言,由于副本A和副本B中有含数据项x和y,这两个变量都假设初始化为0,副本A最后的操作是<10, B>,所以B的向量时钟:B=(0, 11)

(2)顺序偏差

  • 对于副本A而言,阴影部分表示为持久化(永久性)的操作,不能回滚,而A中不是阴影部分的有三个,即<8, A>, <12, A>, <14, A>,所以A中有三个暂存的操作,即顺序偏差为3
  • 对于副本B而言,阴影部分表示为持久化(永久性)的操作,不能回滚,而B中不是阴影部分的有二个,即<5, B>, <10, B>,所以B中有二个暂存的操作,即顺序偏差为2

(3)数值偏差

  • 对于副本A而言,A已经收到了B的<5, B>,但是还未看到<10, B>,所以数值偏差=1(即还有一个没有收到);而此时A中已提交的值是(x, y)=(2, 0),假设收到B的<10,B>之后,y=5;所以副本A的数值偏差=(1,5)
  • 对于副本B而言,B还未看到A中的<8, A>,<12, A>, <14, A>,所以数值偏差=3(即还有三个没有收到);而此时B中已提交的值为(x,y)=(0,0),假设收到A的<8, A>,<12, A>, <14, A>之后,x=(1+2)*2,所以偏差的权重= 6;所以副本B的数值偏差=(3,6)

示例2:如下图所示,为持续一致性的示意图。在副本A和副本B中有含数据项x和y,这两个变量都假设初始化为0。操作表格中阴影部分表示为持久化(永久性)的操作,不能回滚;其余操作表示暂时的更新操作。请采用向量时钟、顺序误差和数值误差三个指标描述两个副本之间的差异。(其中数值误差用各数据项的差分和表示)

在这里插入图片描述

A:向量时钟:(10, 0);顺序偏差:2 ;数值偏差:(2, 16)

B:向量时钟:(3, 17);顺序偏差:2 ;数值偏差:(1, 8)

(2)一致性单元的粒度选择

粗粒度:任意一个更新操作都导致更新传播;

细粒度:当一个数据更新时,另一个数据无需更新

在这里插入图片描述

2.4 严格一致性

规则:对数据项x的读操作返回的值为最近写入x的值

特点:绝对全局时间次序

不可实现性

  • 没有全局时钟
  • 光速限制: t 1 : W 1 ( x ) → S 2 ,   t 2 : R 2 ( x t1:W1(x)→S2, ~ t2:R2(x t1:W1(x)S2, t2:R2(x); 如 t 2 − t 1 = 1 0 − 9 t2-t1=10^{-9} t2t1=109秒, S1和S2的距离为3米, 则需要10倍的光速进行传输

例:严格一致性:

例:非严格一致性:

在这里插入图片描述

2.5 顺序一致性

规则:所有进程执行的结果,等同于它们的操作按某种顺序在数据仓上执行的结果。每个进程的操作都按照程序规定的顺序。

所有进程看到相同的内存访问操作次序,等价于数据库的可串行化(serializability)。

当每个数据项都保持顺序一致性时,他们的组合不一定符合这个要求

顺序一致性模型:

在这里插入图片描述

非顺序一致性:

在这里插入图片描述

(1)示例

3个并行执行的进程,90种正确的执行顺序

在这里插入图片描述
在这里插入图片描述

签名: 把输出结果按照P1, P2,P3的顺序排序

(2)执行(Execution)

进程Pi在数据仓S上的读写操作序列, 记为Ei

在这里插入图片描述

(3)历程(History)

**合并E1,E2,…,En后的序列 **

就像在一个集中式数据仓上执行

合法历程:保持程序的操作次序,符合数据相干性

在这里插入图片描述

非法历程

在这里插入图片描述

性能问题:

  • 设读操作时间为r,写操作时间为w, 包传输时间为t
  • 则r+w≥t。 如果减少r时间,则必然增加w时间

2.6 线性一致性

规则:具有顺序一致性,且如果 t s o p 1 ( x ) < t s o p 2 ( y ) ts_{op1}(x)< ts_{op2}(y) tsop1(x)<tsop2(y), 则$OP1(x) → \rightarrow OP2(y)$

  • 每个操作带有全局时钟戳

  • 执行结果是顺序一致性的

  • 每个进程的操作遵照时间戳顺序

2.7 因果一致性

因果关系(Causality):

  • P1写x, P2读x, 然后写y,则W2(y)与W1(x)具有潜在的因果关系。
  • 否则,操作之间的关系为并发(Concurrent)关系
  • 例:P1写x,P2写z,则W1(x)与W2(z)不具有潜在因果关系。

定义:

  • 对于具有潜在因果关系的写操作,所有进程看到的执行顺序应相同。

  • 并发写操作在不同主机上被看到的顺序可以不同。

例子:因果一致性

在这里插入图片描述

例:违反因果一致性

在这里插入图片描述

例:符合因果一致性

在这里插入图片描述

实现技术:

  • 操作依赖图
  • 向量时钟(vector clock)

2.8 FIFO一致性

规则:同一个进程的写操作的执行次序,其它进程看到的都相同。不同进程的写操作的执行次序,不同进程看到的可以是不同的。

也称作内存管道一致性(Pipelined RAM) :分布式共享内存系统

实现技术:写操作标签(进程ID,顺序号)

例:符合FIFO一致性,但不符合因果一致性

例: 符合FIFO一致性, 可输出“001001”,但不符合顺序一致性

在这里插入图片描述

2.9 分组操作

同步分量:与一个数据区相关联

  • Synchronize(S)
  • 同步所有的数据局部拷贝
  • 导出:

在这里插入图片描述

  • 导入:

在这里插入图片描述

规则:

  • 在一个进程对数据更新完毕之前,不允许另一个进程获取同步变量
  • 一个进程进行互斥访问,其他不能访问,哪怕是非互斥模式
  • 一个进程进行互斥访问,除非变量拥有者执行完操作,否则不能进行下一个操作,哪怕是非互斥模式

2.10 释放一致性

被保护数据: 需要保持一致的共享数据

Acquire(L)操作:进入临界区

  • 导入数据:使被保护数据的局部拷贝与远程的最新版本一致

Release(L)操作:退出临界区

  • 导出数据:将被保护数据上的变化传播到其它的局部拷贝上

规则

  • 在访问共享数据前,所有先前的acquire操作都必须完成。

  • 在执行release前,先前的所有读写操作都必须完成。

  • 对同步变量的访问必须满足FIFO一致性

例:符合释放一致性

在这里插入图片描述

及时释放一致性(EAGER release)

  • 当执行了释放操作,执行此操作的处理机将所有修改的数据传给所有那些已经有其缓冲拷贝且可能需要它的处理机

滞后释放一致性(LAZY release )

  • 在执行释放时,不发送任何数据。
  • 在执行获取操作时,处理机试图从拥有这些变量的机器上取得它们的最新值

2.11 入口项一致性

同步变量

  • 与某个共享数据项相关联 ;不是与数据区中的所有保护型数据关联
  • 拥有者(owner):最后一个获取(acquire)它的进程。 其他进程必须从当前所有者手中取得拥有权。
  • 非互斥方式(non-exclusive):可以读,但不能写;个进程可以非互斥方式同时拥有一个同步变量

规则:

  1. 在进程P获取同步变量S之前,有关的被保护的共享数据上的全部更新操作都必须完成;
  2. 在进程P以互斥模式访问同步变量S之前,不允许其他进程同时拥有S,即 使在非互斥模式下;
  3. 在进程P以互斥模式获取同步变量S之后,任意其他进程都不能对S执行非互斥式访问,除非在S的拥有者P执行之后

例:入口项一致性

在这里插入图片描述

优点:

  • 减少开销
  • 增加并行性

2.12 总结

无同步操作

一致性说明
严格所有的共享访问事件都有绝对时间次序
顺序所有进程都以相同的次序看到所有的共享访问事件,不按时间排序
因果所有进程都以相同的次序看到所有因果联系事件
FIFO所有进程见到的其他进程的写操作次序就是该进 程执行写操作的次序,但来自不同进程的写操作不必以相同的顺序看见

同步操作

一致性说明
当同步操作完成后,共享数据才保持一致
释放当退出临界区后,共享数据才保持一致
入口项当进入临界区时,和该临界区有关的 共享数据才保持一致

3.以客户为中心的一致性模型

分布式数据存储区

  • 没有同时更新(无写-写冲突)或容易解决

  • 大多数操作为读操作

  • 例:Web网页(服务器,代理缓存)

3.1 最终一致性(eventual consistency)

如果很长时间不发生更新操作,则所有的副本将逐渐变为一致的。

移动用户问题:

客户为中心的一致性(Client-centric)

  • 保证对一个客户对数据存储的访问是一致的
  • 考虑不同客户之间的并发访问

假设

  • 每个数据项x有一个拥有者,只有拥有者可以修改x

  • 客户的读写操作在本地副本上进行

  • 更新最终将传播给其他副本上。

3.2 客户为中心的一致性

x i [ t ] x_i[t] xi[t]: 数据项x在局部场地 L i L_i Li上,在时刻t的版本

W S ( x i [ t ] ) WS(x_i[t]) WS(xi[t]): 产生 x i [ t ] x_i[t] xi[t]的所有写操作的集合

W S ( x i [ t 1 ] , x j [ t 2 ] ) WS(x_i[t1], x_j[t2]) WS(xi[t1],xj[t2]) W S ( x i [ t ] ) WS(x_i[t]) WS(xi[t])中的写操作在t2时刻在Lj上执行

在这里插入图片描述

3.2单调读一致性

当一个进程读了数据项x的值后,所有后续的对x的读操作,都将返回相同的值,或者更新的值

例:符合单调写一致性

在这里插入图片描述

例:不能保证单调写一致性

在这里插入图片描述

3.3 单调写一致性

一个进程对数据项x的写操作,必须在该进程对x的所有后续写操作之前完成。

  • 例:软件库更新(版本1,…,n),增量写

例:符合单调写一致性

在这里插入图片描述

例:不能保证单调写一致性

在这里插入图片描述

3.4读自己写一致性

一个进程对数据项x的写操作结果,总能被该进程对x的后续读操作读到。

  • 例1:Web网页更新、浏览

  • 例2:数字图书馆密码更新

例:符合读自己写一致性

在这里插入图片描述

例:不能保证自己写一致性

在这里插入图片描述

3.5 写跟随读一致性

一个进程在对数据项x读操作之后对x的写操作, 必须在x已读出的相同值或者更近的值之上进 行

  • 例:BBS跟帖(读文章A,写文章B)

例:符合写跟随读一致性

在这里插入图片描述

例:不能保证写跟随读一致性

在这里插入图片描述

4.复制管理

两个子问题

  1. 副本服务器位置选择:从多个可行的位置中挑选,放置一台服务器

  2. 内容副本放置:从多个已经存在的副本服务器中挑选一台,放置一份内容的副本

4.1 副本服务器的放置策略

副本服务器的放置问题

  • 从N个位置中选出K个最优位置

(1)基于距离的方法

  • 最优:所有客户与所有位置的距离最短

  • 距离:延时、带宽等指标

(2)基于自治系统的方法

  • 不考虑客户的位置,假设客户在网络上均匀分布

  • 自治系统(autonomous system, AS).所有节点运行相 同的路由协议,且由单个组织管理。

  • 在含有最大链接数量的网络接口的路由器上放置副本服务器

存在问题 :

  • 计算复杂度高$> O(N^2) $
  • 而在瞬时拥塞(flash crowds)情况下,要求快速布置副本服务器

(3)基于单元的方法

  • 将m维空间划分成多个相同大小的单元
  • 选择K个密度最大的单元放置副本服务器
  • 计算复杂度: O ( N ∗ m a x { l o g ( N ) , K } ) O(N*max\{log(N),K\}) O(Nmax{log(N),K})

选择适当的单元大小

  • 太大:一个单元格中集群太多,而副本服务器太少;

  • 太小:一个集群被分成多个单元格,导致副本服务器太多

在这里插入图片描述

4.2 内容复制与放置

分布式数据仓的设计

  • 复制副本的类型:永久型、服务器发起型、客户发起型

在这里插入图片描述

(1)永久性副本

构成分布式数据仓的初始集合

  • 静态的、固定的
  • 副本数量较少

例1:Web场地的分布类型

  • 局域网:轮回策略型服务器
  • Internet:镜像服务器

例2:分布式数据库

  • 工作站集群(COW)

  • 联邦数据库

(2)服务器发起型副本

推送式缓存(push cache)

  • 由服务器,动态地设置新的副本

作用:

  • 当负载发生变化时,如突然增加。
  • 减少服务器负担
  • 减少客户的通信开销

问题?

  • 在何时、何地发起复制

实现方法

  • 访问计数: c n t ( S , F ) cnt(S,F) cnt(S,F), S为服务器,F为文 件
  • 复制阈值:$rep(S,F) $
  • 删除阈值:$del(S,F) $
  • 距离: d i s t ( S , C ) dist(S,C) dist(S,C), C为客户。该信息来自路由数据库

复制副本

  • 复制副本条件: c n t ( S , F ) > r e p ( S , F ) cnt(S,F) > rep(S,F) cnt(S,F)>rep(S,F)

删除副本

  • 删除副本条件: c n t ( S , F ) < d e l ( S , F ) cnt(S,F) < del(S,F) cnt(S,F)<del(S,F)

迁移副本

  • 迁移副本条件: d e l ( S , F ) < c n t ( S , F ) < r e p ( S , F ) del(S,F) < cnt(S,F) <rep(S,F) del(S,F)<cnt(S,F)<rep(S,F)

举例:计数来自不同客户的请求,将文件复 制到离客户附近的服务器上。

如果 c n t Q ( P , F ) > c n t ( Q , F ) / 2 cntQ(P,F) > cnt(Q,F)/2 cntQ(P,F)>cnt(Q,F)/2,将F从Q迁移到P

在这里插入图片描述

(3)客户端发起副本

客户缓存(cache) :客户端的本地存储

缓存命中率(cache hit):

  • 请求的数据可在缓存中取出的概率
  • 提高命中率:缓存可由多个客户共 享

客户缓存的设置场地

  1. 与客户相同的机器
  2. 局域网上多个客户共享的机器上
  3. 广域网上的代理服务器上

4.3 内容分发

当客户执行一个更新操作后,该操作将传播到所有副本

传播状态与传播操作策略

  1. 传播更新通告
  2. 传输数据拷贝
  3. 传播更新操作

(1)更新传播

通告无效协议(invalidation)

  • 只传输被修改的数据的位置信息
  • 数据量少,占用很少网络带宽
  • 适用于读/写比非常低的情况

数据传输(data shipping)

  • 传输被修改的数据

  • 数据量多,占用较多网络带宽

  • 适用于读/写比非常高的情况

操作传输(operation shipping)

  • 主动复制技术 - 每个副本有一个进程主动地进行更新

  • 占用最少网络带宽

  • 要求有较高处理能力

(2)推送式与拉取式协议

推送式协议:基于服务器的协议

  • 不需要请求,就将更新传播给副本
  • 可保持高度的一致性,通常用于永久性副本和服务器副本之间
  • 优点:适用于读/写比非常高的情况

拉取式协议:基于客户的协议

  • 由客户请求服务器发送更新
  • 优点:适用于读/写比非常低的情况
  • 缺点:当cache miss时,响应时间长

(3)推送式协议与拉取式协议的比较

项目推式协议拉式协议
服务器的状态客户端副本和Cache的清单
发送的消息更新(以及稍后读取数据)轮询和更新
客户端响应时间立即(或读取被更新数据时间)读取被更新数据时间

(4)推拉混合式方法

  • 基于租期的更新传播方法
  • 租期(lease) : 服务器承诺在租期时间内向客户传播更新(推送式)。
  • 当租期过期后, 客户申请新的租期, 或自己取修改数据(拉取式)

设置租期的准则

  • 基于年龄的租期: 对年龄大(不经常修改)的数据, 租期长。
    • 年龄: 数据项最后一次修改后的延续时间。
    • 假设长时间未被修改的数据,今后也不打可能修改
  • 基于刷新频率的租期: 对经常被刷新的缓存中(经常使用的)数据, 租期长。
  • 基于状态空间开销的租期: 当服务器负载小时, 租期长。

4.4 单播方式与多播方式

多播 :一对多通信;适用于从服务器到客户的推送式协议

单播:一对一通信;适用于从客户到服务器的抽拉式协议

在这里插入图片描述

5.一致性协议

一致性协议: 对一致性模型的实现方法的描述

基于主副本的协议

  • 主副本: 在数据的所有复制副本中, 写操作必须先在主副本上进行。
  • 实现了顺序一致性
  • 远程写协议: 所有写操作由远程服务器执行
  • 本地写协议: 将主副本读到执行写操作的本地上执行

5.1 远程写协议

(1)单个主副本服务器

读操作在本地执行,写操作在远地执行

在这里插入图片描述

(2)带有备份的主副本服务器

在这里插入图片描述

5.2 本地写协议

(1)单个主副本服务器

主副本迁移到当前写操作的场地上

在这里插入图片描述

(2)带有备份的主副本服务器

在这里插入图片描述

5.3 复制式写协议

写操作可在多个副本上执行

主动复制协议:将各更新操作发给各个副本上的进程

问题1: 更新顺序问题

解决方案:

  • 全序多播机制: 如Lamport时间戳向量
  • 顺序管理器(sequencer) : 集中式协调器, 负责为每个操作赋予唯一的顺 序号, 转发给各个副本

问题2:重复调用问题

  • 对象副本的重复调用
  • 服务器的重复调用

在这里插入图片描述

解决方案: 设置了解副本的通信层

  • 基于发送者模式: 由协调者决定发送调用/响应

在这里插入图片描述

5.4 基于合法数的协议

基于多数表决的复制写协议

  • 与主副本协议的区别: 多个副本同时执行写操作

基本算法:

  • 设有N个副本
  • 设置读合法数 N R N_R NR, 写合法数 N w N_w Nw
  • 要求: N R + N w > N N_R + N_w> N NR+Nw>N N w > N / 2 N_w> N/2 Nw>N/2

在这里插入图片描述

5.5 以客户为中心一致性的实现技术

(1)基本方法

写操作: 全局唯一标识符。

  • 服务器ID:执行位置
  • 序号:执行顺序

读集合Rset©: 与客户c读操作相关的写操作标识符

写集合Wset©: 客户c执行的写操作的标识符

在这里插入图片描述

(2)实现技术:单调读一致性

  • 当客户c执行读操作r;
  • c的服务器s检查c的读集合Rset©, 是否所有写操作已在c的本地更新;
  • 如果c的本地没有更新, 则请求更新;
  • 执行读操作r;
  • 将与r有关的写操作标识符加入Rset ©。

在这里插入图片描述

(3)实现技术:单调写一致性

  • 当客户c执行写操作w;
  • 它的服务器s检查c的写集合Wset ©, 是否所有写操作已在c的本地执行;
  • 如果在c的本地没有执行, 则请求执行;
  • 执行写操作w;
  • 将w的标识符加入Wset ©。

在这里插入图片描述

(3)实现技术:读自己写一致性

  • 当客户c执行读操作r;
  • c的服务器s检查c的写集合Wset ©, 是否所有写操作已在c的本地执行;
  • 如果在c的本地没有执行, 则请求执行;
  • 执行读操作r;

(4)写跟随读一致性

  • 当客户c执行写操作w时,
  • c的服务器s检查c的读集合Rset ©, 是否所有写操作已在c的本地执行;
  • 如果在c的本地没有执行, 则请求执行;
  • 将这些写操作标识符加入Rset ©。

在这里插入图片描述

(5)优化方法

性能问题 :Wset©和Rset©将非常大, 造成性能降低

基于会话(session)的优化方法

  • 减少写集和读集中的元素个数
  • 定义session: 打开, 关闭操作。 对应一个应用程序的开始和结束。
  • WS©和RS©在session打开时建立, 关闭时清除。

基于时间戳向量的优化方法

  • 减小写集和读集表示形式的大小
  • 对一个写操作WID,赋予时间戳ts(WID)
  • 服务器Si维持一个时间戳向量 R C V D ( i ) RCVD(i) RCVD(i) R C V D ( i ) [ j ] = S i RCVD(i) [j]= Si RCVD(i)[j]=Si收到的来自Sj的最近写操作的时间戳。
  • 对写集或读集A维持一个时间戳向量VT(A)。 VT(A)[i]为在Si上的最大时间戳
  • 并操作: $VT(A+B)[i]=max{VT(A)[i], VT(B)[i]} $
  • 包含关系:$ VT(A)≤VT(B)\leftrightarrow VT(A)[i] ≤VT(B)[i]$

例: 单调读一致性

  • 设客户c在服务器Si上执行读操作r;
  • c的读集为VT(Rset) , Si有RCVD(i)
  • 如果RCVD(i)[j] ≤VT(Rset)[j], 则在Si进行更新
  • 执行后, VT(Rest)[j]=max{VT(Rest)[j], RCVD(i)[j]}

5.6 连续一致性协议

(1)数值误差限制实现

记号:

  • 服务器 S i S_i Si; 日志 L i L_i Li
  • 写操作 W ( x ) W(x) W(x)
  • weight(W),W的权重值
  • Orign(W),W的源站点
  • T W [ i , j ] TW[i,j] TW[i,j]源自 S j S_j Sj,传输至 S i S_i Si的写操作; T W [ i , j ] = ∑ { w e i g h t ( W ) ∣ o r g i n ( W ) = S j & W ∈ L i } TW[i,j]=\sum \{weight(W) | orgin(W)=S_j \& W \in L_i\} TW[i,j]={weight(W)orgin(W)=Sj&WLi}
  • v(t)为实际值,vi:S_i的当前值

当不满足 v ( t ) − v i ≤ δ i v(t)-vi ≤ \delta_i v(t)viδi时,进行更新传播,执行感染协议。

在这里插入图片描述

(2)陈旧度限制的实现

记号:

  • RVCi[] :服务器Si实时向量时钟
  • T(i): 服务器Si的本地时间
  • RVCk[j]: 已接受的Sj写操作时间戳
  • di: 允许的最大陈旧度
  • 当不满足 T [ i ] − R V C i [ j ] ≤ d i T[i]-RVCi[j]≤di T[i]RVCi[j]di 时, 进行更新传播, 拉取Sj的写操作

在这里插入图片描述

(3)次序误差限制的实现

记号:

  • Q i Q_i Qi:服务器Si的暂时写操作队列
  • length(Qi): Qi的长度

当不满足 l e n g t h ( Q i ) ≤ l i length(Q_i)≤l_i length(Qi)li 时, 提交本地的暂时写操作

提交操作

  • 要进行一致性检验。 如不通过, 需回滚Si的暂时写操作
  • 要保证全局次序

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/83854.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis框架(五):大众点评项目 商品目录 添加Redis缓存

大众点评项目 商品目录 添加Redis缓存需求&#xff1a;基于Redis查询商品信息业务实现给商品添加缓存给店铺类型添加缓存总结和业务流程SpringCloud章节复习已经过去&#xff0c;新的章节Redis开始了&#xff0c;这个章节中将会回顾Redis实战项目 大众点评 主要依照以下几个原则…

Vue Demi是如何让你的库同时支持Vue2和Vue3的

Vue Demi是什么 如果你想开发一个同时支持Vue2和Vue3的库可能想到以下两种方式&#xff1a; 1.创建两个分支&#xff0c;分别支持Vue2和Vue3 2.只使用Vue2和Vue3都支持的API 这两种方式都有缺点&#xff0c;第一种很麻烦&#xff0c;第二种无法使用Vue3新增的组合式 API&am…

【Redis】Redis跳表与实现源码解析(Redis专栏启动)

&#x1f4eb;作者简介&#xff1a;小明java问道之路&#xff0c;专注于研究 Java/ Liunx内核/ C及汇编/计算机底层原理/源码&#xff0c;就职于大型金融公司后端高级工程师&#xff0c;擅长交易领域的高安全/可用/并发/性能的架构设计与演进、系统优化与稳定性建设。 &#x1…

Tomcat下载和安装

下载 Tomcat官网网址 我选择的是8&#xff0c;根据自己需要选择不同版本 选择64位下载 下载有点慢&#xff0c;等一会儿就行 安装 首先确认安装了JDK&#xff1a;命令行窗口输入java -version 配置Tomcat环境变量 配完之后验证是否成功。 winR->cmd->输入startup.bat…

什么是社交新零售?社交新零售的底层商业又是逻辑是什么?

一千个品牌商心中&#xff0c;有一千个新零售——自从马云2016年10月提出新零售的概念后&#xff0c;电商平台、传统商超、电商品牌、线下品牌&#xff0c;汹涌而至&#xff0c;都想搭上“新零售快车”。 新零售模式是依靠于大数据的开发应用&#xff0c;国内新零售模式发展多年…

Node.js快速入门

一、简介 1、什么是Node.js 简单的说 Node.js 就是运行在服务端的 JavaScript。 Node.js是一个事件驱动I/O服务端JavaScript环境&#xff0c;基于Google的V8引擎&#xff0c;V8引擎执行Javascript的速度非常快&#xff0c;性能非常好。 2、Node.js有什么用 如果你是一个前端程序…

【有料c++题目周刊 | 第一期】希腊诸神

文章目录第一题&#xff1a;珀耳修斯点金题目描述输入描述输入示例输出描述输出示例解题思路&C题解第二题&#xff1a;女神赫拉题目描述输入描述输入示例输出描述输出示例解题思路&C题解第一题&#xff1a;珀耳修斯点金 题目描述 某希腊神话故事中&#xff0c;有一个…

物联网通信技术|课堂笔记week2-2|9月7日·21日

sudo ifconfig bridge101 hw ether 9e:3e:53:38:45:66 目录 Linux网络管理命令 (1)route (2)ip (3)netstat (4)ping ​​​​​​两台电脑连起来后ping不通? (5)telnet (6)ssh (7)wget Linux网络管理命令 (1)route 路由为互联网的中转站 静态路由 动态路由 rout…

Go代码审计学习(一)

文章目录Vulnerability-goapp/assets// 根目录/login/new/top/profile/profile/edit/upload/post /timeline/timeline/searchpost/adminconfirm /adminlogin /adminusersCSRF网上有关Go的代码审计好少哇&#xff0c;能找到的文章也不多&#xff0c;害&#xff0c;没办法也得学 …

网络协议—应用层的HTTP协议

URL&#xff0c;叫作统一资源定位符。之所以叫统一&#xff0c;是因为它是有格式的。HTTP 称为协议&#xff0c;www.163.com 是一个域名&#xff0c;表示互联网上的一个位置。正是因为这个东西是统一的&#xff0c;所以当你把这样一个字符串输入到浏览器的框里的时候&#xff0…

软件测试是要学习什么技能?

推荐阅读&#xff1a; 2022年简历石沉大海&#xff0c;软件测试行业当前找工作有多难&#xff1f; [内部资源] 想拿年薪30W的软件测试人员&#xff0c;这份资料必须领取~ 在确定软件开发可行的状态下&#xff0c;对软件是要实现的各个功能做到详细分析。要求分析阶段是一个很…

两起并购!深兰科技完成自动驾驶新能源车产业生态链布局

近日&#xff0c;深兰科技集团全资控股的熊猫汽车(上海)有限公司分别与一汽凌源、湖南加立减新能源科技正式签约&#xff0c;完成了对这两家公司的并购&#xff0c;为企业自动驾驶新能源汽车产业生态链的建设蓝图添上了浓重的一笔。 此次被深兰科技并购的一汽凌源汽车制造有限公…

Java二维数组拓展练习

例 1 对角线输出&#xff1a; 已知一个n*n的矩阵&#xff08;n<20&#xff09;&#xff0c;把矩阵二条对角线上的元素值加上10&#xff0c;然后输出这两条新对角线上的所有元素之和。 注意当n为奇数时两条对角线交叉的那个元素改变时只需要改变一次&#xff0c;累加的时候…

46.for循环嵌套之九九乘法表

46.for循环嵌套之九九乘法表 文章目录46.for循环嵌套之九九乘法表1. 目标任务2. 完成第1行输出2. 分析前3行规律3. 编写第1行代码4. 编写前2行代码5. 调整输出格式6. 完成总代码1. 目标任务 本节的任务是利用for循环嵌套编写九九乘法表。 1*11 1*22 2*24 1*33 2*36 3*39 1…

语音识别之语音激活(VAD)检测(一)

导读 语音激活检测(Vioce Activation Detection)简称VAD&#xff0c;用来检测语音信号是否存在。VAD技术在语音领域中应用非常的广泛&#xff0c;在语音识别中我们可以对长语音通过VAD来检测出语音信号的空隙&#xff0c;通过这个空隙来分割语音&#xff0c;将长语音切分成短语…

正大国际期货:如何摆脱炒黄金期货被套单?

投资失败无非两点&#xff1a;一是自身原因&#xff0c;自己没有经验&#xff0c;盲目的操作肯定会造成亏损&#xff1b;二是指导老师的实力问题&#xff0c;指导老师对行情的方向把握不准&#xff0c;经常喊反弹&#xff0c;造成你的亏损。想要走得快&#xff0c;就独自上路&a…

Python每日一练 09——多文件操作

Python每日一练 09——多文件操作 文章目录Python每日一练 09——多文件操作一、单文件拆分为多个文件二、多文件合并为单文件1、获取数据文件名2、获取股票名列表3、读单支股票数据4、读多支股票数据5、多文件中数据合并到一个文件一、单文件拆分为多个文件 我们写一个txt文件…

数字图像处理(入门篇)九 图像数据预处理之滤波

目录 1 模板运算 &#xff08;1&#xff09;模板卷积 &#xff08;2&#xff09;模板排序 2 均值滤波 &#xff08;1&#xff09;代码 &#xff08;2&#xff09;结果图 3 高斯滤波 &#xff08;1&#xff09;代码 &#xff08;2&#xff09;结果图 4 中值滤波 &#…

IB数学HL/SL考试大纲简单介绍

IB数学难度怎么样&#xff1f;IB数学内部评估和外部评估是怎么评分的&#xff0c;IB数学HL和SL的考试大纲&#xff1f; 下面介绍IB数学框架体系IB数学SL考试大纲 SL数学为必修课 考试内容相对比较基础 代数&#xff08;Algebra&#xff09;&#xff1a;涉及数列问题&#xff…

CentOS虚拟机搭建Hive环境

注&#xff1a;本文是对 https://www.bilibili.com/video/BV1CU4y1N7Sh 的实践。 关于如何搭建Hadoop集群&#xff0c;请参考我另一篇文档。 环境 CentOS 7.7JDK 8Hadoop 3.3.0Hive 3.1.2 准备 确认Hadoop的 etc/hadoop/core-site.xml 文件包含如下配置&#xff1a; <…