Elasticsearch集群管理原理

news2024/11/19 8:23:23

Elasticsearch 是一个开源的、基于 Lucene 的分布式搜索和分析引擎,设计用于云计算环境中,能够实现实时的、可扩展的搜索、分析和探索全文和结构化数据。它具有高度的可扩展性,可以在短时间内搜索和分析大量数据。

Elasticsearch 不仅仅是一个全文搜索引擎,它还提供了分布式的多用户能力,实时的分析,以及对复杂搜索语句的处理能力,使其在众多场景下,如企业搜索,日志和事件数据分析等,都有广泛的应用。

本文将向你详细介绍 Elasticsearch 集群的基本概念、以及 Elasticsearch 集群 节点、分片、副本的工作原理和 Elasticsearch 涉及到相关节点的相关原理。


文章目录

        • 1、Elasticsearch集群的基本概念
          • 1.1、节点
          • 1.2、分片
        • 2、Elasticsearch集群节点工作原理
          • 2.1、选举过程
          • 2.2、状态监测和管理过程
          • 2.3、节点发现
        • 3、Elasticsearch集群数据工作原理
          • 3.1、数据分布
          • 3.2、关于分片管理
          • 3.3、关于副本管理
          • 3.4、数据恢复
        • 4、Elasticsearch其他工作节点及原理
          • 4.1、协调节点
          • 4.2、数据处理节点
          • 4.3、机器学习节点


1、Elasticsearch集群的基本概念
1.1、节点

在 Elasticsearch 集群中,节点(Node)是最基本的工作单元,每个节点都属于一个集群,并且拥有一个全局唯一的节点 ID 和一个可以自定义的节点名称。Elasticsearch 节点设计支持多种角色,这个是实现集群最重要的前提,节点角色各司其职,也可以任意组合,职责重合。

image-20231013174749654

Elasticsearch 的节点可以分为以下几种类型:

  1. 候选主节点(Master-eligible Node):也被称作选举节点(Voting Node),是指在集群中,可以被选为主节点的节点;
  2. 主节点(Master Node):主节点负责集群级别的操作,如创建或删除索引,跟踪哪些节点是集群的一部分,并决定哪些分片分配给相关节点。主节点被选举产生,一个集群中只有一个主节点;
  3. 数据节点(Data Node):数据节点存储数据,执行数据相关的 CRUD 操作和搜索聚合等;
  4. 协调节点(Coordinating Node):协调节点主要负责分发搜索请求、聚合搜索结果等,它不存储数据,也不参与集群的主节点选举;
  5. 数据处理节点(Ingest Node):数据处理节点负责预处理文档,比如解析日志行并将其转换为 JSON 文档;
  6. 机器学习节点(Machine Learning Node):机器学习节点用于运行机器学习作业,这是 X-Pack 插件提供的功能。

每个节点都可以通过配置来设定其角色,一个节点也可以同时担任多个角色。例如,一个节点可以同时是主节点和数据节点。

1.2、分片

在 Elasticsearch 中,“分片” 是数据存储和处理的基本单位。一个索引可以分为多个分片,每个分片是索引数据的一个子集。

分片有两种类型:主分片和副本分片。

  1. 主分片:创建索引时确定,用于存储索引的原始数据。每个索引至少有一个主分片。一个索引的数据会被分散在多个主分片上,但是每个主分片上的数据是不同的,不会出现冗余。每个主分片都存储索引数据的一部分,所有的主分片 together 存储了索引的全部数据;

  2. 副本分片:主分片的复制品,主要作用是提供数据冗余和增加查询容量。每个主分片可以有一个或多个副本分片。值得注意的是,Elasticsearch 会自动将主分片和副本分片分布在不同的节点上,以防止单个节点故障导致数据丢失。同时,Elasticsearch 也会自动处理副本的创建和同步等工作,无需用户手动干预。

分片的数量在创建索引时设定,并且主分片的数量在索引创建后不能更改。副本分片的数量可以在索引创建后动态更改。

分片可以分布在集群中的任何节点上,Elasticsearch 会自动处理分片的分布和负载均衡。当一个节点失败时,Elasticsearch 会自动将该节点上的分片迁移到其他节点上,以保证数据的可用性。


2、Elasticsearch集群节点工作原理
2.1、选举过程

Elasticsearch 集群的主节点选举过程主要涉及到两种节点角色:主节点和候选主节点。

  1. 主节点:负责处理集群级别的操作,如创建或删除索引,跟踪哪些节点是集群的一部分,以及决定哪些分片分配给相关节点等;
  2. 候选主节点:可以被选为主节点的节点。在 elasticsearch.yml 配置文件中,通过 node.master: true 设置节点为主-eligible 节点。

主节点选举过程如下:

  1. 当一个候选主节点发现主节点失效或者集群启动时,会发起选举;
  2. 发起选举的节点会将自己的节点 ID 和集群状态版本号发送给集群中的候选主节点。
  3. 其他候选主节点收到选举请求后,会比较自己的集群状态版本号和请求中的版本号。如果自己的版本号更高,就拒绝投票;如果版本号相同或者更低,就投票给请求节点。
  4. 发起选举的节点收集投票结果。如果得到了集群中半数以上的候选主节点的投票,就成为新的主节点。
  5. 新的主节点会向集群中的其他节点发送新的集群状态。

这种投票机制可以确保集群在主节点失效时,能够快速选举出新的主节点,保证集群的高可用性。同时,通过比较集群状态版本号,可以确保新的主节点拥有最新的集群状态。

2.2、状态监测和管理过程

Elasticsearch 集群的状态监测和管理主要涉及到两种节点角色:主节点和数据节点。

  1. 主节点:负责处理集群级别的操作,如创建或删除索引,跟踪哪些节点是集群的一部分,以及决定哪些分片分配给相关节点等。
  2. 数据节点:存储数据,执行数据相关的 CRUD 操作和搜索聚合等。

状态监测和管理过程如下:

  1. 主节点定期向集群中的所有节点发送心跳消息,检查节点的健康状态。
  2. 如果主节点在一定时间内没有收到某个节点的响应,会认为该节点失效,然后将其从集群状态中移除。
  3. 当有新节点加入集群,或者已经移除的节点重新恢复,主节点会更新集群状态,并将新的集群状态广播给所有节点。
  4. 数据节点会定期向主节点发送其上的分片信息,主节点根据这些信息决定是否需要重新分配分片。
  5. 主节点还会根据集群的负载情况,动态调整分片的分配,以保证集群的负载均衡。

对于主节点自身,如果主节点因为某种原因无法继续提供服务,例如进程崩溃或者网络故障,那么集群中的其他节点在一定时间内没有收到主节点的心跳消息,就会认为主节点已经下线,并开始主节点的选举过程。

2.3、节点发现

Elasticsearch 的节点发现主要依赖于其内置的 Zen Discovery 模块。这个模块负责节点之间的通信,以及主节点的选举。

节点发现的过程如下:

  1. 当一个新节点启动并加入到集群时,它会向集群中已知的节点发送 ping 请求。这些已知的节点可以是在配置文件中静态定义的,也可以是通过其他发现插件获取的。

  2. 收到 ping 请求的节点会回复自己的集群名称和当前的主节点信息。

  3. 新节点收到回复后,会检查集群名称是否和自己的一致。如果一致,就将回复中的主节点信息添加到自己的已知节点列表中,并尝试与主节点建立连接。

  4. 新节点成功连接到主节点后,主节点会将新节点添加到集群状态中,并将更新后的集群状态广播给所有节点。

  5. 其他节点收到新的集群状态后,也会尝试与新节点建立连接。


3、Elasticsearch集群数据工作原理
3.1、数据分布

Elasticsearch 集群的数据分布主要依赖于其分片(Shard)机制。每个索引的数据被分成多个分片,这些分片被分布在集群的各个节点上。每个分片都可以有一个或多个副本,副本也被分布在集群的各个节点上。

以下是 Elasticsearch 数据分布的主要原理:

  1. 分片分布:当创建索引时,你可以指定主分片的数量。Elasticsearch 会将这些主分片均匀地分布在集群的所有节点上。如果后续增加了节点,Elasticsearch 也会自动重新分布分片,以保持分片在各个节点上的均衡。

  2. 副本分布:你可以为每个索引设置一个或多个副本。Elasticsearch 会将副本分布在不存储对应主分片的节点上,以提供数据冗余。如果后续增加了节点或者增加了副本数量,Elasticsearch 也会自动重新分布副本。

  3. 数据平衡:Elasticsearch 会持续监控集群的状态,如果发现分片在节点间的分布不均,或者某个节点的负载过高,它会自动迁移分片,以达到负载均衡。

  4. 故障恢复:如果某个节点发生故障,Elasticsearch 会将该节点上的所有主分片和副本分片重新分配到其他健康的节点上,以保证数据的可用性。

通过这种方式,Elasticsearch 可以有效地管理大量数据的存储和查询,同时提供高可用性和良好的性能。

3.2、关于分片管理

Elasticsearch 集群的分片管理主要包括分片分配、分片平衡和分片恢复。

分片分配:在创建索引时,可以指定主分片的数量。每个主分片都会存储索引数据的一部分,所有的主分片 together 存储了索引的全部数据。主节点负责跟踪集群中的所有分片,并决定将哪些分片分配给哪些节点(一致性哈希算法)。主节点会根据集群的状态和负载情况,动态地进行分片分配和重新分配。

分片平衡:主节点会根据集群的负载情况,动态调整分片的分配,以保证集群的负载均衡。当新的节点加入集群时,主节点会将一部分分片分配给新节点。当节点失效或移除时,主节点会将其上的分片重新分配给其他节点。

分片恢复:当节点失效或移除时,主节点会将其上的分片重新分配给其他节点,以保证数据的可用性和冗余。同时,Elasticsearch 也支持手动恢复分片。例如,如果一个分片因为某种原因无法使用,可以使用 _recovery API 来手动恢复分片。

通过这种方式,Elasticsearch 能够实时监测和管理集群的状态,确保集群的高可用性和性能。同时,分片的冗余和自动分配机制也保证了数据的可靠性和容错能力。

3.3、关于副本管理

Elasticsearch 集群的副本管理主要包括副本分配、副本同步和副本恢复。

副本分为两种类型:主副本和从副本。

  1. 主副本:创建索引时生成的原始副本,负责处理写操作(如:增、删、改)。

  2. 从副本:主副本的复制品,可以处理读操作(如:查询和聚合)。

副本分配:在创建索引时,可以指定副本的数量。每个副本都是主分片的一个完整复制品,存储的数据和对应的主分片完全相同。主节点负责跟踪集群中的所有副本,并决定将哪些副本分配给哪些节点。主节点会根据集群的状态和负载情况,动态地进行副本分配和重新分配。

副本同步:当主分片的数据发生变化时,对应的副本也需要进行同步。Elasticsearch 会自动将主分片的变化同步到所有的副本。副本同步是异步进行的,不会阻塞主分片的写操作。

副本同步/数据复制流程如下:

  1. 客户端发送写请求到集群。

  2. 集群中的协调节点将请求路由到对应的主副本。

  3. 主副本执行写操作,并将操作记录到 translog(事务日志)。

  4. 主副本将操作同步到所有从副本。

  5. 从副本执行操作,并将操作记录到各自的 translog。

  6. 所有从副本都确认操作成功后,主副本向协调节点发送成功响应。

  7. 协调节点向客户端返回操作成功。

副本恢复:当主分片失效时,Elasticsearch 会自动从副本中选取一个提升为新的主分片。同时,Elasticsearch 也会创建新的副本,以替代提升为主分片的副本。副本恢复是自动进行的,无需人工干预。

通过这种方式,Elasticsearch 能够实现数据的高可用性和容错能力。即使某个主分片失效,也可以通过副本快速恢复,保证服务的连续性。同时,副本也可以提高查询性能,因为查询请求可以在多个副本之间进行负载均衡。

3.4、数据恢复

Elasticsearch 集群的数据恢复主要包括两个方面:节点恢复和快照恢复。

  1. 节点恢复:当 Elasticsearch 集群中的某个节点因为故障停止服务,然后又重新加入到集群中时,该节点上的数据需要进行恢复。Elasticsearch 会自动将该节点上的分片复制到其他健康的节点上,以保证数据的完整性和可用性。当故障节点恢复后,Elasticsearch 会将这些分片再复制回来,完成数据恢复。
  2. 快照恢复:Elasticsearch 支持创建索引的快照,并存储在外部存储系统中。当需要恢复数据时,可以从快照中恢复。恢复过程包括两个步骤:首先,从快照中恢复索引的元数据;然后,将数据分片恢复到集群中的节点上。

这两种恢复方式都是自动进行的,无需人工干预。通过这种方式,Elasticsearch 能够在节点故障或数据丢失的情况下,快速恢复数据,保证服务的可用性。


4、Elasticsearch其他工作节点及原理
4.1、协调节点

在 Elasticsearch 中,协调节点(Coordinating Node)主要负责接收客户端的请求,将请求路由到对应的节点,并收集各个节点的响应,最后将结果返回给客户端。协调节点不存储数据,也不参与数据处理,主要负责请求的协调和结果的汇总。

协调节点的工作过程如下:

  1. 客户端发送请求到协调节点。
  2. 协调节点根据请求类型和目标数据,将请求路由到对应的主节点或数据节点。
  3. 主节点或数据节点处理请求,并将结果返回给协调节点。
  4. 协调节点收集所有结果,进行汇总或处理,然后将最终结果返回给客户端。
4.2、数据处理节点

在 Elasticsearch 中,数据处理节点(Data Node)主要负责存储数据,执行数据相关的 CRUD 操作和搜索聚合等。

数据处理节点的工作过程如下:

  1. 数据处理节点接收来自协调节点或客户端的请求。

  2. 根据请求类型,数据处理节点执行相应的操作。例如,如果是写入请求,数据处理节点会将数据写入到对应的分片中;如果是查询请求,数据处理节点会在本地分片中执行查询,并返回结果。

  3. 数据处理节点将操作结果返回给协调节点或客户端。

在这个过程中,涉及到的其他角色节点主要有:

  1. 主节点:负责处理集群级别的操作,如创建或删除索引,跟踪哪些节点是集群的一部分,以及决定哪些分片分配给相关节点等。

  2. 协调节点:接收客户端的请求,将请求路由到对应的节点,并收集各个节点的响应,最后将结果返回给客户端。

数据处理节点是 Elasticsearch 集群中最重要的角色之一,它直接负责数据的存储和处理。在大规模集群中,通常会有大量的数据处理节点,以提供足够的存储空间和处理能力。

4.3、机器学习节点

在 Elasticsearch 中,机器学习节点(Machine Learning Node)主要负责执行机器学习相关的任务,如数据分析和模型训练等。

机器学习节点的工作过程如下:

  1. 机器学习节点接收来自协调节点或客户端的请求。

  2. 根据请求类型,机器学习节点执行相应的操作。例如,如果是数据分析请求,机器学习节点会对数据进行分析,并返回结果;如果是模型训练请求,机器学习节点会使用数据训练模型,并保存模型。

  3. 机器学习节点将操作结果返回给协调节点或客户端。

在这个过程中,涉及到的其他角色节点主要有:

  1. 主节点:负责处理集群级别的操作,如创建或删除索引,跟踪哪些节点是集群的一部分,以及决定哪些分片分配给相关节点等。

  2. 协调节点:接收客户端的请求,将请求路由到对应的节点,并收集各个节点的响应,最后将结果返回给客户端。

  3. 数据节点:存储数据,执行数据相关的 CRUD 操作和搜索聚合等。

机器学习节点是 Elasticsearch X-Pack 插件提供的功能,它可以帮助用户在 Elasticsearch 中直接进行复杂的数据分析和机器学习任务,无需将数据导出到其他系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1088947.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Element-plus】如何让滚动条永远在最底部(支持在线演示)

如何让滚动条永远在最底部 一、适用场景二、实现思路三、效果图四、在线演示五、完整代码 一、适用场景 在某些场景下,你可能希望滚动条保持在最底部,以确保用户始终看到最新的内容或信息。如:在实时聊天应用程序中,当新消息到达…

跳动的爱心源码

话不多说直接上源码 关闭程序请按 AIt + F4 import random from math import sin, cos, pi, log from tkinter import * import ctypesuser32 = ctypes.windll.user32 CANVAS_WIDTH = user32.GetSystemMetrics(0

【java学习—七】面向对象特征之二:继承的基础知识(29)

文章目录 1. 为什么要有继承?2. 案例理解3. 继承的作用4. 总结 1. 为什么要有继承? 问题:为什么要有继承? 答:多个类中存在相同属性和行为时,将这些内容抽取到单独一个类中,那么多个类无需再定…

鹅厂练习 13 年 Coding 后,我悟了

点击链接了解详情 导读 本文主要受《程序员修炼之道: 通向务实的最高境界》、《架构整洁之道》、《Unix 编程艺术》启发。我不是第一个发明这些原则的人,甚至不是第一个总结出来的人,别人都已经写成书了!务实的程序员对于方法的总结&#xf…

动态盘转换为基本盘

问题描述 不小心将磁盘0(C和D是基本盘,蓝颜色)改成了动态盘(C和D是动态盘,橘黄色)?如何修改回来呢? 解决方案: 使用DiskGenius将动态磁盘转换为基本磁盘 操作之前一定…

【Java题】将char类型的值转化为int类型的值

字符变量charVar的值是“我”字。程序中输出了该字符的Unicode值以及Unicode值对应的十进制数值,并打印输出了charVar与一个int型变量做加法运算后的值 public class Test {public static void main(String[] args) {int intResult,intVar10;char charVar我;intRe…

记录--纯CSS实现骚气红丝带

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 在本文中,我们将探讨如何使用 CSS 以最少的代码创造出精美的 CSS 丝带形状,并最终实现下面这个效果: 下面我们使用html和css来实现这个效果。我们使用内容自适应方式布局&#…

基于java的图书馆预约座位系统的设计与实现(部署+源码+LW)

项目描述 临近学期结束,还是毕业设计,你还在做java程序网络编程,期末作业,老师的作业要求觉得大了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等。今天给大家介绍一篇基于java的图书馆预约座…

【TA 工具积累】参考图展示 PureRef | 截图 Snipaste

贴两个平常看图和截图比较方便的工具: PureRef 官网指路:PureRef 油管简单的使用教程视频:Free Download | PureRef 知乎上大佬总结的快捷键: PureRef 快捷键 提炼总结 - 知乎 (zhihu.com) b站大佬总结的快捷键:…

C语言重点突破(3)字符串函数与内存函数的介绍

本章重点 重点介绍处理字符和字符串的库函数的使用和注意事项 前言 C语言里对字符串函数使用的特别频繁,但却没有规定字符串类型,那它在字符串里是如何存储的呢? 字符串通常放在常量字符串 中或者 字符数组 中,字符串常量适用…

03在命令行环境中创建Maven版的Java工程,了解pom.xml文件的结构,了解Java工程的目录结构并编写代码,执行Maven相关的构建命令

创建Maven版的Java工程 Maven工程的坐标 数学中使用x、y、z三个向量可以在空间中唯一的定位一个点, Maven中也可以使用groupId,artifactId,version三个向量在Maven的仓库中唯一的定位到一个jar包 groupId: 公司或组织域名的倒序, 通常也会加上项目名称代表公司或组织开发的一…

android 固定进度环形刷新效果

android 固定进度无限旋转的环形效果 效果图 Activity 中使用 val rotation: ObjectAnimator ObjectAnimator.ofFloat(progressBar, "rotation", 0f, 360f) rotation.duration 000 // 旋转持续时间为2秒 rotation.repeatCount ObjectAnimator.INFINITE // 设置为…

Mybatis 实现简单增删改查

目录 前言 一、Mybatis是什么 二、配置Mybatis环境 三、创建数据库和表 四、添加业务代码 4.1、添加实体类 4.2、添加mapper接口 4.3、添加实现接口方法的xml文件 五、简单的增删改查操作及单元测试 5.1、单元测试 单元测试具体步骤: 单元测试如何才能不污…

Everest Group发布《2023年RPA供应商评估报告》:2家中国厂商持续上榜

近日,全球知名信息咨询机构Everest Group发布了《2023年RPA供应商评估报告》,分析了全球 RPA 格局和 25 家技术提供商在几个关键维度上的动态变化,包括客户数量、同比增长、客户对价值和满意度的反馈以及公司的行业和企业规模细分覆盖范围等。…

SAP MM学习笔记35 - 请求书照合中的差额处理(发票扣减,受入)

SAP中,请求书照合之后,发现不一致,就会支付保留。 支付保留,可以参考如下文章。 SAP MM学习笔记34 - 请求书照合中的支付保留(发票冻结)_东京老树根的博客-CSDN博客 即使支付保留之后暂时不付钱&#xff…

消防建筑防火3d实景漫游展示方案及特点

随着科技的不断发展,3D线上展厅已经成为了展示产品和宣传品牌的重要方式之一。在火灾隐患排查领域,3D线上展厅也有着广泛的应用。相比于传统的火灾隐患排查方式,3D线上展厅突破了许多局限,具有以下优势: 众所周知&…

微调Yolov8动物姿势估计模型

本文主要以狗的姿势估计为例,展示如何对当下流行的YOLOv8姿势模型进行Fine-tuning,并附录完整代码。 动物姿势估计是计算机视觉领域的一个研究方向,它是人工智能的一个子领域,专注于自动检测和分析图像或视频中动物的姿势和位置。其目标是确定一个或多个动物身体部位的空间…

EMNLP 2023 录用论文公布,速看NLP各领域最新SOTA方案

EMNLP 2023 近日公布了录用论文。 开始前以防有同学不了解这个会议,先简单介绍介绍:EMNLP 是NLP 四大顶会之一,ACL大家应该都很熟吧,EMNLP就是由 ACL 下属的SIGDAT小组主办的NLP领域顶级国际会议,一年举办一次。相较于…

高德地图选择点位改变图标

一.循环渲染点位 如图所示,紫色点位为动态循环点位 首先,我们请求完接口,返回点位 这里是全部代码 下方有拆分讲解 this.map.remove(this.marks) this.marks [] this.map.plugin([AMap.PlaceSearch], () > {var PlaceSearchOptions …

echarts一些配置项的使用

前言:我是自己最近写项目用到的,我做个整理; 一. 基本使用 1.具有大小(宽高)的div ,id唯一; 例如: <div id"crewEchart"></div> 2.在项目中引入: import * as echarts from "echarts"; 3.写一个关于他的方法,在mounted的时候调用: moun…