【MIT 6.5840(6.824)学习笔记】分布式系统介绍

news2025/1/15 13:12:40

1 概念

当我们谈论分布式系统时,我们指的是一组通过网络连接的计算机,它们协同工作以完成某种共同的任务或目标。

在分布式系统中,通信是通过消息传递进行的。这意味着各个计算节点之间通过发送和接收消息来进行通信,而不是通过共享内存。这种消息传递模型使得分布式系统的设计和实现更为灵活,因为每个节点可以独立地运行,并通过消息传递来进行协作。

尽管消息传递模型具有很多优点,但也需要注意到它引入了一些复杂性。例如,需要考虑消息的传递延迟、顺序和可靠性等问题。因此,在设计分布式系统时,需要仔细考虑如何有效地管理消息传递,以确保系统的正确性和性能。

TIP:在设计系统或解决问题时,应该始终优先考虑在单台计算机上解决。只有在问题规模超出单台计算机的处理能力,或者需要满足高可用性、容错性等需求时,才需要考虑采用分布式系统。因此,深入了解问题的性质和需求,以及权衡利弊,是设计分布式系统的关键。

2 驱动力和挑战

当人们构建分布式系统时,驱动力主要包括以下几个方面:

  1. 追求更高的计算性能:分布式系统能够利用大量的计算资源,实现并行运算,充分利用多个CPU、大容量内存和磁盘资源。
  2. 实现容错性:即使在其中一台计算机发生故障时,系统仍然能够保持正常运行。
  3. 解决空间分布性问题:某些问题天然具有空间分布性,需要跨越不同地理位置的计算资源和数据进行协同处理。例如,银行跨地域的资金转移需要协调不同地点的数据和操作,这就需要分布式系统来实现数据的同步和协调,以确保交易的准确性和可靠性。
  4. 提高安全性:分布式系统可以通过将系统分散在多个计算机上来提高安全性。不信任的代码或系统可能存在潜在的安全风险,通过在分布式环境中运行代码并采用加密通信等安全措施,可以有效降低风险,并限制错误和攻击的影响范围。

分布式系统的挑战源自其驱动力:

  1. 并发执行和复杂交互:分布式系统中存在大量并发执行的部分,以及复杂的交互关系。这导致了在并发编程中遇到各种问题,例如同步、异步操作的管理以及处理时间依赖性。
  2. 意外故障:分布式系统由多个组成部分和计算机网络组成,因此容易受到意外故障的影响。与单个计算机不同,这些组件可能在工作或停止状态之间切换,同时还受到网络中断或不稳定性的影响。
  3. 性能预期:分布式系统的设计旨在实现更高的性能,例如利用大量计算资源实现并行处理。但实际评估多台计算机或磁盘臂的性能存在一定挑战,需要仔细的设计和调整以实现预期的性能水平。

3 抽象和实现工具

分布式系统基础架构主要包括存储、通信(网络)和计算这三种类型。我们的目标是设计简单的接口,使第三方应用程序能够轻松使用这些分布式存储和计算功能,这样才能简单的在这些基础架构之上,构建第三方应用程序。

通过这种抽象接口,我们可以将分布式系统的复杂性隐藏在系统内部,使用户专注于应用程序的开发。举例来说,在存储方面,用户可以将整个系统视为非分布式系统,类似于一个文件系统或者常规的编程模型,而不必担心分布式系统的细节。我们的目标是构建一个接口,使其看起来像一个非分布式存储和计算系统,但实际上却具备了分布式系统的高性能和容错性。

但实际上,很难能找到一个抽象来描述分布式的存储或者计算,使得它们能够像非分布式系统一样有简单易懂的接口。

抽象的实际实现是我们首先要考虑的问题。在构建分布式系统时,人们使用了许多工具:

  • RPC(Remote Procedure Call):RPC旨在掩盖在不可靠网络上通信的复杂性,使得远程调用过程更为简单直接。
  • 线程:线程是一种重要的编程技术,可用于充分利用多核心计算机。它不仅仅是为了提高计算机的利用率,更重要的是提供了结构化的并发操作方式,简化了程序员对并发操作的处理。
  • 分布式文件系统:分布式文件系统是分布式系统中常用的存储工具之一,它提供了分布式的数据存储和访问接口。通过分布式文件系统,可以实现数据的分布式存储和管理,从而支持大规模数据处理和分布式计算任务的执行。

4 分布式系统特性

4.1 可扩展性

分布式系统的主要特性是可扩展性(Scalability)。可扩展性指的是,增加计算资源后系统能够以相应的方式提高性能或吞吐量。举例来说,如果一台计算机能够解决一定量的问题,那么增加第二台计算机后,系统能够以更快的速度解决相同数量的问题,或者在相同时间内处理更多的问题。如果由两台计算机组成的系统能够实现两倍的性能或吞吐量,那就达到了可扩展性的标准。

这是一个极为强大的特性,因为只需花钱就可以购买计算机。如果构建的系统能够通过增加计算机数量来提高性能或吞吐量,那将是一个巨大的成就。相比之下,通过雇佣程序员来优化系统或应用更优的算法通常是一种昂贵的方法。我们希望通过增加计算机数量,从十台提升到一千台,来应对一百倍的流量。

例如在构建一个常规网站时,通常会有一个HTTP服务器、一些用户和浏览器以及基于Python或PHP的Web服务器,它们与数据库进行交互。

在初始阶段,一台计算机可以运行Web服务器和数据库,或者将Web服务器和数据库分别部署在两台计算机上。但是,当网站突然迎来数以亿计的用户登录请求时,单一服务器显然无法满足需求。

image-20240513103410005

为了应对高流量,第一步是购买更多的Web服务器,并将用户分配到不同的服务器上。这样,不同的用户可以访问不同的Web服务器,但它们需要访问相同的数据,因此所有的Web服务器都需要与后端数据库通信。在这个阶段,通过添加更多的Web服务器来提高代码效率是一个有效的方法,前提是单个服务器不会给数据库带来过大的压力。

然而,可扩展性并非无限的。随着Web服务器数量的增加,数据库很可能成为性能的瓶颈。即使增加更多的Web服务器也无法解决问题。在某个临界点,系统中添加更多计算机将不再有效,而瓶颈将转移到其他地方,比如从Web服务器转移到数据库。

在这种情况下,必须进行一些重构工作。然而,重构一个单一的数据库是困难的,尽管可以将数据库拆分为多个来提高性能,但这需要大量的工作。

4.2 可用性

在构建系统时,使用单台计算机往往具有较高的可靠性。单台计算机通常可以长时间稳定运行,这是因为计算机和操作系统都很可靠,而且电源也很稳定。然而,如果系统由数千台计算机构成,即使每台计算机都能稳定运行一年,每天也会有多台计算机发生故障。

因此,大型分布式系统面临的一个主要问题是放大一些罕见问题的影响。在这样的系统中,总会有一些机器故障、运行错误、执行缓慢或执行错误任务的情况发生。网络问题也是一个常见的挑战,比如网线踩断或交换机故障。这些小问题在大规模系统中会变成持续不断的问题。

因此,在设计系统时必须考虑系统的容错性,即使发生错误也要能够继续运行。同时,为了简化应用开发人员的工作,需要构建一个基础架构,能够尽可能屏蔽和掩盖错误。

容错有多种概念和表述方式,其中一个重要思想是可用性(Availability)。通过精心设计,系统可以在特定类型的错误发生时继续提供服务,就像没有错误一样。某些系统通过多副本的方式实现可用性。比如,构建一个有两个拷贝的多副本系统,其中一个故障了,另一个仍然可以正常运行。可用性意味着在特定的故障范围内,系统仍能提供服务。

另一种容错特性是自我可恢复性(Recoverability),即在出现问题后系统停止工作,不再响应请求,等待修复,然后恢复正常运行。

可恢复性是一个重要的需求,尽管它比可用性更弱。在故障发生到修复期间,系统将完全停止工作。但修复后,系统应能正确运行,因此可恢复性至关重要。对于可恢复的系统,通常需要采取一些措施,如将最新数据存储在磁盘中,以便在供电恢复后检索。甚至对于具备可用性的系统,在实际应用中,也需要具备可恢复性。

为了实现这些特性,有两个关键工具。

  • 一个是非易失存储(Non-volatile storage),如硬盘或闪存,用于存储系统状态的checkpoint或日志。这样,即使出现电源故障,系统也能从存储中读取最新状态,并继续运行。
  • 另一个重要工具是复制(Replication),即通过多副本系统实现容错。管理复制的多副本系统可能会面临同步偏移等问题,这在容错系统中是一个挑战。

4.3 一致性

最后一个很重要的特性是一致性(Consistency)。一致性定义了操作的行为,特别是在分布式系统中。在分布式存储系统中,例如键值(KV)服务,put操作将一个值存储到一个键中,而get操作从键中获取值。在分布式系统中,多个副本可能存在不同版本的数据,因此一致性变得至关重要。

强一致性(Strong Consistency)要求get请求总是返回最近一次完成的put请求写入的值,这确保了数据的完全一致。然而,实现强一致性需要大量的通信和延迟。弱一致性(Weak Consistency)不保证get请求获取到最新的数据,但通常可以提供更高的性能。

因此,为了尽可能减少通信,特别是当副本相距很远时,人们会构建弱一致性系统,只需要更新最近的数据副本,并且只需要从最近的副本获取数据,并允许读取旧数据。当然,为了使弱一致性更具实际意义,人们会定义更多的规则。

5 MapReduce论文阅读笔记

MapReduce论文阅读笔记

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1677815.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

系统思考—团队学习

结束昨日435期JSTO“探索学习的新视界:硬核工具分享”,有伙伴分享的提升效率的AI工具,也有自我发现团队问题解决的工具,伙伴们都在各自的领域实践、吸收、反馈、复盘。这次的团队学习不仅是知识的传递,更是一场脑力激荡…

Linux修炼之路之gcc/g++,动静态链接及动静态库

目录 一:Linux编译器-gcc/g 预处理-编译-汇编-链接 1.预处理 2.编译 (生成汇编) 3.汇编(生成机器可识别代码) 4.链接(生成可执行文件或库文件) 三:动静态链接和动静态库 动静态库 动静态链接 1.动态链接 2.静态链接 3.注意点 4.各自优缺点 5.ldd和fil…

20240514基于深度学习的弹性超材料色散关系预测与结构逆设计

论文:Dispersion relation prediction and structure inverse design of elastic metamaterials via deep learning DOI:https://doi.org/10.1016/j.mtphys.2022.100616 1、摘要 精心设计的超材料结构给予前所未有的性能,保证了各种各样的具…

安防视频汇聚/智能分析云平台EasyCVR调用localfile接口会返回日志的问题该如何解决?

视频汇聚/安防视频融合云平台EasyCVR视频监控系统支持多协议接入、兼容多类型设备,平台能在复杂的网络环境中(专网、局域网、广域网、VPN、公网等)将前端海量的设备进行统一集中接入与视频汇聚管理。视频监控/集中存储系统EasyCVR平台可支持国…

QCustomPlot - 柱状堆积图

参考链接 显示柱状图的值 QCustomPlot下载 下载地址:https://www.qcustomplot.com/index.php/download选择版本2.1.0 QCustomPlot.tar.gzQCustomPlot 的使用 解压下载的文件 把qcustomplot.h和qcustomplot.cpp放到自己的项目工程(复制文件并qt 的目录…

linux系统介绍和安装教程(含安装链接放在最下面了)

一、linux系统简介 在Linux和C语言的发展历程中,有几位关键人物为它们的诞生和推广做出了重要贡献。 首先,肯汤姆森(Ken Thompson)是一位在AT&T公司工作的员工,他不仅发明了B语言,还创造了Unix系统。…

Window下安装kettle并配置MySQL驱动,实现表输入输出

一. 安装并配置Java环境 1、JDK下载地址:Archived OpenJDK GA Releases 2、根据自己的需求选择版本进行下载并解压,我这里安装的是JDK21。 然后解压出来放到指定文件夹,我的地址是:C:\Program Files\Java 3、配置环境变量 Win菜…

怎么看电脑是固态还是机械硬盘?数据丢失怎么办

在数字化时代,电脑硬盘作为数据存储的核心部件,其类型直接关系到数据读写速度和存储效率。固态硬盘(SSD)与机械硬盘(HDD)作为目前市场上主流的两种硬盘类型,各有其优缺点。然而,对于…

Vue3 - 项目配置多环境配置文件

最常见的多环境配置,就是开发环境配置,和生产环境配置(也就是上线的配置),很多情况下我们开发环境下的域名,和一些配置项,和我们生产模式下的不同,这个时候就需要我们进行多环境配置,不然每次发版都要改一波数据多麻烦。 另一种情况就是你两个项目是用的一套代码,但是最…

青岛东软载波子公司东软载波微电子授权世强硬创代理,出货量累计超20亿颗

凭借业内独特的互联网推新模式,世强先进(深圳)科技股份有限公司(下称“世强先进”) 获得本土工业MCU企业——上海东软载波微电子有限公司(下称“东软载波微电子”,英文:essemi&#…

【Kubernetes】污点、容忍度、亲和性、调度和重启策略

标签、污点、容忍度、亲和性 一、标签1、定义2、给资源打标签【1】给Pod打标签【2】给Service打标签【3】给Node打标签 3、查看资源标签 二、节点选择器1、nodeName2、nodeSelector 三、污点、容忍度、亲和性1、node节点亲和性【1】硬亲和性【2】软亲和性 2、pod节点亲和性【1】…

直播用什么领夹麦比较好?多款音质出色的无线领夹麦克风推荐

近年来,随着网络直播、短视频、网课等新兴行业的蓬勃发展,大家对领夹麦克风的需求量也在不断增加,因为一款优质的领夹麦克风不仅方便携带,而且能够带来更清晰、更真实的录音效果,让我们在各种场景下都能获得满意的录音…

第二证券股市策略:股票st连续跌停卖不出怎么办啊?

对于接连跌停的st股票买不出,投资者只能早早地挂出跌停托付单等着成交,在当天没有成交,其托付单会被撤销,投资者能够挑选进行隔夜托付卖出时,最好在证券公司清算之后,再进行托付卖出,否则&#…

ORACLE ODAX9-2的一个误告警Affects: /SYS/MB的分析处理

在运维的多套ORACLE ODAX9-2版本,都遇到了一个计算节点的告警:Description: The service Processor poweron selftest has deteced a problem. Probabity;:100, UulD:cd1ebbdf-f099-61de-ca44-ef646defe034, Resource:/SYS/MB,;此告警从描述上…

哪个牌子的超声波清洗机好?四大质量出众超声波清洗机汇众

由于科技的进步,超声波清洗机已经成为了家庭和专业场所不可或缺的高效清洁工具。它利用超声波波动产生的微小气泡来清洁物品表面及细缝中的污渍,实现深层次的清洁效果。特别是对于眼镜这样的精密物品,定期进行深度清洁不仅能够确保视觉的清晰…

【解决】Unity Build 应用程序运行即崩溃问题

开发平台:Unity 2021.3.7f1c1   一、问题描述 编辑器 Build 工程结束,但控制台 未显示 Build completed with a result of Succeeded [时间长度] 信息。该情况下打包流程正常,但应用程序包打开即崩溃。   二、问题测试记录 测试1&#xf…

必背!!2024年软考中级——网络工程师考前冲刺几页纸

距离软考考试的时间越来越近了,趁着这两周赶紧准备起来 今天给大家整理了——软考网络工程师考前冲刺几页纸,都是核心重点,有PDF版,可打印下来,每天背一点。 计算机总线分类 ①总线的分类:数据总线、地址总…

商城免费搭建之java商城 java电子商务Spring Cloud+Spring Boot+mybatis+MQ+VR全景

1. 涉及平台 平台管理、商家端(PC端、手机端)、买家平台(H5/公众号、小程序、APP端(IOS/Android)、微服务平台(业务服务) 2. 核心架构 Spring Cloud、Spring Boot、Mybatis、Redis 3. 前端框架…

【js刷题:数据结构链表之设计链表】

设计链表 一、题目二、题解 一、题目 二、题解 // 定义节点类,每个节点都有一个值和一个指向下一个节点的引用 class LinkNode{constructor(val,next){ // 构造函数,接收节点值和下一个节点的引用this.valval // 节点的值this.nextnext // 指…

班组建设门道多,企业管理咨询公司助你轻松上手!

班组作为企业的基本单元,其建设水平直接关系到企业的整体运营效率和员工的工作积极性。那么,如何有效地进行班组建设?班组建设又有啥门道呢?本文,深圳天行健企业管理咨询公司将从多个角度探讨这一问题,以期…