分布式系统概念和设计——分布式共享内存

news2024/9/21 2:44:27

分布式系统概念和设计

分布式共享内存

分布式共享内存是在不共享物理内存的计算机之间实现数据的共享的一个抽象。

有一个底层运行的系统保证其透明性,但是进程还是根据内存的分布处理物理内存的分布式能力

DMS最关键点:

  • 不需要关心数据的通信,消息传递能力是巨大的底层支持。
  • 生存周期比访问的任意进程都长,并且不同进程组能够长期的访问和共享

在这里插入图片描述

  • 缓存策略和处理器——内存快速互联的方法,目标是获得较快的内存访问和较大的吞吐量的同时,增加处理器数目。
  • 在处理器和内存模块通过普通总线链接的系统,因为处理器需要竞争总线的原因,处理器数目限制在10-20之间,否则系统的执行性能会明显下降。
  • 共享内存的处理器通常是4个一组,通过一个电路板上的总线共享内存。
  • 在非一致内存访问(NUMA)结构的主板上,系统可以支持多达64个处理器。
  • 是一种层次结构,其中系统使用高性能的开关或高一级的总线将多个拥有4个处理器的主板链接起来。
  • 但是其中处理器访问本主板上内存的延迟时间比访问其他主板上内存的延迟时间少——体系结构名称的来源
    • 不同节点之间内存访问延迟的不同导致了内存访问的非一致性。因此,如果处理器访问本主板上的内存,访问的延迟时间就会比访问其他主板上的内存的延迟时间短,因为本地内存的延迟时间更短。这种设计方式的好处是可以在一定程度上提高系统的可伸缩性,同时减少节点间的通信,避免节点争用共享总线的瓶颈问题。但也要注意处理器访问的内存是否在同一节点,需要优化处理器访问内存的局部性,避免访问不必要的内存数据,提高计算效率。

在分布式内存的多处理器结构中,处理器不共享内存,但是通过高速网络链接起来。

DSM和多处理器结构所面临的一个核心问题是:

  • 共享内存算法和其相关软件知识能否直接应用于更大规模的分布式共享内存系统

需要开发新的算法和协议来维护分布式系统中的数据一致性和协同计算任务。例如,需要设计新的分布式共享内存结构和分布式锁机制来确保各个节点之间的数据状态一致。此外,还需要研究分布式共享内存系统的调度策略,以优化任务分配和处理器间的通信,提高计算效率。

消息传递机制和DSM比较

  • 编程模型

    • 使用消息传递模型的时候,当一个进程向另一个进程发送数据的时候,发送方必须对数据变量进行编码,接收进程对数据变量解码。使用共享内存的系统可以直接共享变量而无需编解码。不需要单独的通信操作。
    • 大多数DSM系统可以以访问非共享变量的方式对存储在DSM中的变量进行命名和访问
    • 使用消息传递的好处
      • 通过进程的私有地址区域,使通信进程的数据得到保护
    • 在共享内存中可能会因为某个进程修改了共享数据导致其他进程崩溃
    • 在异构通信中,通信可以在不同的系统中不同的处理方式,共享内存无法达到这一点
    • 在DSM中进程的同步是通过通常内存共享内存程序使用的同步机制实现,其中包括锁和信号量
    • 分布式需要不同的同步机制
    • 因为DSM是可以持久的,通过DSM通信的进程的生命周期并不能重叠,一个进程可以在随意的节点上的进程留下数据
    • 而另一个进程可以在自己的运行时读取到该数据
    • 通过消息传递机制进行通信的进程必须同时运行
  • 效率

    • 关于实现的方式可以有效的减少通信的时间但也有很多挑战

DSM的实现

  • 硬件
    • 基于NUMA体系结构的共享内存处理器依赖于特殊的硬件能提供一致性共享内存怒
    • 通过与远程的内存模块和缓存模块通信来处理LOAD和STORE,这些内存和缓存存储有所需的数据
    • 这种通信建立在一种与网络通信类似的高速连接上进行
  • 分页虚拟内存
    • 许多系统将DSM实现为一个虚拟分页内存,这个虚拟内存区域在每个参与进程内占据同样的范围(内存预规划技术)
  • 中间件
    • 通过在客户和服务器上的用户级支持层之间的通信来实现共享的内存的机制。
    • 当进程发出数据访问DSM,对支持层发出调用,通过相互通信维持一致性多进程之间。

NUMA

共享内存在处理器间共享数据时,通常会使用共享总线来实现。这样的设计可以大大简化通信协议和数据一致性的维护。一般而言,将处理器组成4个一组共享内存更适合于中小型的计算任务。因此,当需要在多个处理器间共享数据时,这种设计方式可以提高计算效率。

但是,当系统需要支持更多处理器时,使用共享总线进行内存访问会变得非常复杂和慢。为了解决这一问题,非一致性内存访问架构(NUMA)被提出。在NUMA中,处理器被分成多个节点,每个节点拥有自己的本地内存和I/O总线。与共享内存不同的是,NUMA允许节点之间的内存访问是非一致性的,也就是说,不同节点的内存访问速度可能不同。

使用NUMA的好处是可以处理更大规模的计算任务,并提高系统的可伸缩性。由于每个节点拥有自己的本地内存,节点之间的内存访问瓶颈被大大减少,同时可以通过在各节点之间移动内存数据来优化访问速度。因此,NUMA通常用于高性能计算领域和大型服务器系统。

设计问题和实现问题

一致性模型是指DSM系统中的各种数据模型应该在特定的条件下遵从一致性规则,以确保数据的正确性和一致性。一致性模型的设计思想主要是通过事务处理、锁定机制和版本控制来防止多个用户同时对数据进行修改和访问,并确保数据在不同节点之间的传输和存储是一致的。在具体的实现过程中,一致性模型可以采用多种技术,例如分布式事务、分布式锁、多版本并发控制等。在设计和实现一致性模型时,需要考虑系统的复杂性、性能、可扩展性、容错性等因素,以满足不同用户的需求。同时,还需要使用适当的工具和技术来测试和验证系统的正确性和可靠性。

主要面临问题
  • DSM中的数据和结构问题
  • 应用层一致访问DSM的同步模型
  • DSM的一致性模型,一致性模型管理不同计算机访问的数据的一致性
  • 计算机之间交互所写信息的更新选项
  • DSM实现中的共享粒度以及颠簸问题
结构
  • 每一个应用程序进程都拥有一些抽象的对象集合,集合内存概念。可以被不同的访问方式访问。
面向字节的

访问虚拟内存一样访问数据类型,DSM是一组连续的字节。

应用程序在共享内存上实现所需的数据结构。

这些共享是直接可寻址的内存位置。

LOAD,STROE(读写操作)

面向对象的
  • 由一系列语言级的对象如栈,字典等组成。
  • 应用程序只能通过调用对象才能改变这些对象的内存共享值
  • 不能通过直接访问对象的共享内存地址直接改变
  • 利用对象的语义能够加强一致性
对象共享方式

共享对象的方式:

有几种方式可以实现对象共享:

  1. 静态变量:

静态变量是类级别的变量,多个对象可以共享同一个静态变量。可以在类的任何地方访问静态变量,并且只有一个副本在内存中被创建。

Java中使用static关键字来定义静态变量。

  1. 单例模式:

单例模式是一种设计模式,它确保一个类只有一个对象实例,并提供全局访问点。

单例对象可以通过静态方法访问,在这个方法内可以控制对象的创建并确保只创建一个对象。

  1. 共享内存:

共享内存是一种进程间通信方式,多个进程可以共享同一块内存。这种方式需要特殊的加锁机制来控制并发访问,以及确保数据一致性。

  1. 引用计数:

引用计数是一种内存管理技术,它跟踪内存中对象的引用次数。当一个对象被多个其他对象引用时,只需要创建一个对象实例,并记录每个引用的计数。当所有引用计数都变为零时,对象就可以被释放。

一致性语义设计在编程语言层面

一致性语义是编程语言中非常重要的一部分,它确保程序在不同的线程或进程之间保持一致的状态,并且数据应该按照特定的顺序进行读写,以免出现竞争条件、死锁或者原子性问题。

以下是编程语言级别上的一致性语义的设计说明:

  1. 范式设计:

范式是一种编程语言设计模式,它包含数据结构和一组操作数据的函数。这种设计模式可以统一并简化程序的逻辑,使其易于理解和维护。

在保证一致性语义的设计中,采用范式设计可以使得程序的状态变化更加可控,对于不同的线程或进程之间的并发访问,可以更容易地保证其正确性。

  1. 内存管理:

内存管理是一项关键的任务,它包括分配和释放内存,管理内存的使用方式,以及在多线程或多进程环境下保证内存的一致性和正确性。

为了保证内存的一致性,编程语言通常会提供一些机制,例如内存模型、锁、信号量、条件变量等,以允许并发访问和防止访问冲突。

  1. 原子操作:

在多线程或者多进程环境下,确保数据的原子性是非常重要的,数据的原子性就是指一组相关的操作是无法被其他线程或进程中断的,从而保证了数据的一致性。

编程语言通常提供一些原子操作,例如原子变量、原子锁、原子信号量等,以支持原子操作。在一些语言中,原子操作还可以包含类似于自旋锁、读写锁等的机制,用于控制对共享资源的并发访问。

  1. 事务:

在保证一致性的设计中,事务是一种非常有用的机制。通过对一组相关的操作进行封装,事务可以保证这些操作要么全部执行成功,要么全部失败。一旦遇到任何失败情况,整个事务都会被回滚,以保持数据的一致性和正确性。

  1. 同步机制:

同步机制是一种有效的方法,用于控制对共享资源的访问。编程语言通常会提供一些同步机制,例如锁、信号量、条件变量、屏障等,用于协调线程或进程之间的操作。

在保证一致性的设计中,同步机制可以确保线程或进程按照指定的顺序访问共享资源,从而避免出现竞争条件、死锁和其他并发问题。

不变数据

不变数据项的集合,进程可以读取,删除,增加数据项,但不能更改。

元组空间设计

  • 通过一个元组空间方式共享元组数据
  • 当从元组中读取一个元组数据,进程提供一个元组规约
  • 系统从元组规约中获取符合规约的元组,这种规范是一种联合寻址
同步模型

许多应用程序会在共享内存存储的值上加上某些限制。

解决方法:

  • 将这一段代码设置为临界区
  • 这样可以保证在某一个时刻只有一个进程可以执行
内存临界区

内存临界区是指一段程序代码,在这段代码中访问共享内存的操作会导致数据竞争问题。当多个线程或进程同时访问同一片共享内存时,需要设计合理的临界区来保证数据的正确性。

下面是几种常见的内存临界区设计方式:

  1. 锁机制:采用锁机制来控制对共享内存的访问。在进入临界区之前,线程/进程必须先获取锁,执行完访问共享内存的操作后再释放锁。
  2. 信号量:通过信号量来控制对共享内存的访问。当需要访问共享内存时,线程/进程必须首先获取信号量,执行完访问操作后再释放信号量。
  3. 读写锁:当许多线程需要从共享内存读取数据而只有少量线程需要写入数据时,可以采用读写锁机制,允许多个线程同时读取共享内存,但只能有一个线程写入共享内存。
  4. 原子操作:某些编程语言提供了一些原子操作,可以将多个操作合并为一个原子操作,从而避免在共享内存上的数据竞争问题。
  5. 消息队列:通过消息队列来传递访问共享内存的请求和数据,在实际访问共享内存时只允许一个线程/进程进行访问,从而避免数据竞争问题。
一致性模型

内存一致性模型是指在共享内存环境中,多个处理器或线程之间的内存访问所遵循的规则。这些规则规定了对共享内存的访问顺序,保证了多个处理器或线程之间的内存访问是有序的,而不是随机的。

在多核处理器或者多线程应用中,存在多个处理器或线程同时访问共享内存的情况。如果这些处理器或线程之间的内存操作没有按照规定的顺序执行,就会导致数据一致性问题,例如数据竞争、死锁等等。

为了避免这种问题,需要建立一种内存一致性模型,规范处理器或线程之间的内存读写操作。这个模型通常由处理器架构或操作系统制定,并且在硬件上实现。

常见的内存一致性模型包括:

1.顺序一致性模型:所有的内存读写操作都是串行执行的,且所有的处理器或线程看到的内存访问顺序都是一致的。

2.弱一致性模型:内存读写操作可以乱序执行,但是一定会保证最终的结果是正确的。

3.松散一致性模型:内存读写操作可以乱序执行,并且不一定要保证最终结果是正确的,但是会保证最终结果是相对一致的,也就是说每个处理器或线程看到的内存访问顺序是不同的,但是最终结果是相对一致的。

不同的处理器架构或操作系统会选择不同的内存一致性模型,应用开发者需要了解并遵循所选的模型规范,以确保程序正确性。

更新选项

一个进程向其它进程传递更新数据有两种方式

  • 写-更新

    • 进程进行的更新将改变本地数据并会组播其他具有此数据项的拷贝的副本管理器上,副本管理器收到通知后会立即更新本地进程的所读数据,进程可以读取本地副本数据而无需进行通信。
    • 在这里插入图片描述
  • 写-失效

    • 它通常用于多个读进程/单个写进程的共享环境中。
    • 通常一个进或多个进程以只读的方式来访问一个数据项,或者这一个数据项由唯一一个进程进行读写
    • 当前被只读方式访问的数据可以有多个副本。
    • 当有一个进程试图写这一数据项时,系统首先向这一数据的所有副本组播一个失效的消息
    • 并且在写操作执行之前收到来自副本的失效确认消息
    • 此时系统阻止其他进程读取这一数据项的过时数据——这一数据项不是最新的
    • 如果有一个其它进程正在写数据,那么系统将阻止其他进程对这一数据项的读取操作直到写入完成
粒度

在DSM中应该实现怎样粒度的共享单元?

当一个进程对DSM进行写操作后,为了保持其他地点的一致性,DSM运行时应该发送什么样的数据?

  • 硬件进行页为单位的地址交换
  • 主要是在页面中更新新的页面指针
  • 页面的大小最大8KB,当发生更新时,需要传输大量的数据
  • 在默认情况下,不管是整页更新,还是只更新了页的一个字节,整页都必须进行传输,页是最小单位
  • 当页很大的时候会大概率发生页数据竞争的情况
系统颠簸

写失效的一个潜在问题是系统颠簸?

  • 相对于DSM的正常工作时间而言,写失效和通信传输数据的时间可能更多。此时就会发生系统抖动
  • 当多个进程共享一个数据项,或者错误的共享数据时也会发生,

一致性模型

Zab协议(ZooKeeper Atomic Broadcast Protocol)是ZooKeeper使用的一种基于Paxos算法的原子广播协议,用于保证分布式环境下的一致性和可靠性。Zab协议实现了分布式系统中的原子广播,使得ZooKeeper集群中的所有节点都可以达成一致的状态,从而保证了系统的可靠性和一致性。

Zab协议将ZooKeeper集群中的所有节点分为两类:Leader和Follower。Leader节点负责接收客户端请求,并将请求广播给所有Follower节点。Follower节点接收请求并将其复制到本地存储中。当多数节点都成功复制请求后,Leader节点将请求标记为已提交,并将其广播给所有Follower节点。Follower节点接收提交请求并将其应用到本地存储中。

Zab协议的设计目标是保证原子性、顺序性、可靠性和高效性。它通过将ZooKeeper集群中的所有节点分为Leader和Follower两类,实现了分布式系统中的原子广播,使得ZooKeeper集群中的所有节点都可以达成一致的状态,从而保证了系统的可靠性和一致性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/659920.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

百家号热议排名代发

百家号热议排名代发,百度排名怎么做,有什么技巧或者方式方法吗#百度首页关键词排名#百度推广#百度竞价推广#百度关键词排名#百度首页关键词排名方法# 其实百度推广并不赚钱,也没有你想象中的那么好做。 我说三点, 99% 的用户都遇…

C语言之动态内存分配讲解(2)

动态内存函数的介绍 在开始本章节之前,我们来复习一下动态内存分配(1)中所讲到的知识,看下面目录一和目录二 为什么存在动态内存分配 我们已经掌握的内存开辟方式有 int val 20;//在栈空间上开辟四个字节 char arr[10] {0};/…

Go语言并发之扇入和扇出

1、Go语言并发之扇入和扇出 编程中经常遇到扇入和扇出两个概念,所谓的扇入是指将多路通道聚合到一条通道中处理,Go 语言最简单的扇入 就是使用 select 聚合多条通道服务;所谓的扇出是指将一条通道发散到多条通道中处理,在Go语言…

揭开视频识别(动作识别)的神秘面纱(附代码和demo)!

PaddleDetection 在计算机视觉中,视频识别和检测是一个重要的方向。历年来CVPR和ICCV等顶会文章中这类论文是最多的。视频识别和检测也是最有落地场景前景的,像人脸识别、动作检测、异常检测、行人重识别、行人计数等都是很有落地前景的应用方向。本文介…

shardingsphere第三课各种功能点及核心源码

一、功能点 1.审计功能 分片审计功能是针对数据库分片场景下对执行的 SQL 语句进行审计操作。分片审计既可以进行拦截操作,拦截系统配置的非法 SQL 语句,也可以是对 SQL 语句进行统计操作。 目前ShardingSphere内置的分片审计算法只有一个,…

C语言指针初进阶知识汇总

目录 1 指针 1.1 指针是乜嘢 1.2 指针的声明 1.3 运算符 1.4 简单的小例子们 1.5 指针的运算 1.5.1 指针加减运算 1.5.2 间址运算 1.5.3 指针的相减 两个地址之间的偏移量 2 指针与数组 2.1 指针和一维数组 2.1.1 定义数组及指针变量 2.1.2 能动手就不要瞎扯 2.…

当 Rokid 遇上函数计算

作者:王彬(阿里云解决方案架构师)、姚兰天(Rokid 技术专家)、聂大鹏(阿里云高级技术专家 ) 公司背景和业务 Rokid 创立于2014年,是一家专注于人机交互技术的产品平台公司。Rokid 通…

2023/6/18周报

目录 摘要 论文阅读 1、题目和现有问题 2、工作流程 3、图神经网络模块 4、注意力网络 5、实验结果和分析 深度学习 1、GNN和GRU的融合 2、相关公式推导 总结 摘要 本周在论文阅读上,对基于图神经网络和改进自注意网络的会话推荐的论文进行了学习&#…

DPdisPCA算法原理笔记

概要 本文简单理顺《Differentially Private Distributed Principal Component Analysis》论文中的算法原理,它主要提出了一种基于差分隐私的分布式PCA算法,研究了该算法在实验数据以及真实数据中的表现,在参数相同的情况下本算法取得了和没…

OpenGL之深度测试

文章目录 深度测试深度测试函数源代码 深度测试 深度缓冲就像颜色缓冲(Color Buffer)(储存所有的片段颜色:视觉输出)一样,在每个片段中储存了信息,并且(通常)和颜色缓冲有着一样的宽度和高度。深…

Python3 条件控制与循环语句 | 菜鸟教程(八)

目录 一、Python3 条件控制 (一)Python 条件语句是通过一条或多条语句的执行结果(True 或者 False)来决定执行的代码块。 (二)if 语句 1、Python中if语句的一般形式如下所示: 2、注意&#…

<Linux开发>驱动开发 -之-platform 驱动

<Linux开发>驱动开发 -之-platform 驱动 交叉编译环境搭建: <Linux开发> linux开发工具-之-交叉编译环境搭建 uboot移植可参考以下: <Linux开发> -之-系统移植 uboot移植过程详细记…

基于SpringBoot+Vue的民宿管理平台系统设计与实现

博主介绍: 大家好,我是一名在Java圈混迹十余年的程序员,精通Java编程语言,同时也熟练掌握微信小程序、Python和Android等技术,能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架下…

某音短视频评论采集翻页(移动安全篇)

本章测试一个作品的评论及翻页: 以及前面的抓x包方式,在专栏里也有很多,xposed抓包过sslping,通用版本等; https://codeooo.blog.csdn.net/category_11500477.html 翻页通过页码来控制: # -*- coding:…

Docker部署(1)——将jar包打成docker镜像并启动容器

在代码编写完成即将部署的时候,如果采用docker容器的方法,需要将jar包打成docker镜像并通过镜像将容器启动起来。具体的步骤如下。 一、首先下载java镜像 先使用docker search java命令进行搜索。 然而在拉取镜像的时候要注意不能直接去选择pull java ,…

kubernetes(k8s)理论篇

注意:kubeadm与docker是有版本要求的。 如果版本不兼容,初始化 kubeadm是会出现以下问题。 学习k8s掌握知识 基础概念 什么是 Pod 控制器类型 K8S 网络通讯模式 Kubernetes 构建 K8S 集群 资源清单 资源 掌握资源清单的语法 编写 Pod 掌握 Pod 的…

C国演义 [第四章]

第四章 全排列题目理解步骤树形图递归函数递归结束条件单层逻辑 代码 全排列II题目理解步骤递归函数递归结束条件单层逻辑 代码 全排列 力扣链接 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1: 输…

简要介绍 | 深度学习中的自注意力机制:原理与挑战

注1:本文系“简要介绍”系列之一,仅从概念上对深度学习中的自注意力机制进行非常简要的介绍,不适合用于深入和详细的了解。 注2:"简要介绍"系列的所有创作均使用了AIGC工具辅助 深度学习中的自注意力机制:原…

android jetpack databinding的基本使用(java)

目录 databing的基本使用二级页面的绑定自定义BindingAdapter自定义BinddingAdapter的可选旧值双向绑定使用ObservableField来进行双向绑定 在recycleview中使用databinding databing的基本使用 开启databing android {........dataBinding{enable true} }修改布局文件 为布…

Unity UGUI6——UGUI进阶

一、UI 事件监听接口 ​ 目前所有的控件都只提供了常用的事件监听列表 ​ 如果想做一些类似长按,双击,拖拽等功能是无法制作的,或者想让 Image 和 Text,RawImage 三大基础控件能够响应玩家输入也是无法制作的 ​ 而事件接口就是…