目录
- 一、数据写流程概述
- 二、数据写流程步骤
- 2.1、数据写流程图
- 2.2、数据写流程步骤(新建索引和删除文档所需要的步骤顺序)
- 2.3、数据写流程的请求参数
一、数据写流程概述
- 新建、删除索引和新建、删除文档的请求都是写操作, 必须在主分片上面完成之后才能被复制到相关的副本分片
二、数据写流程步骤
2.1、数据写流程图
2.2、数据写流程步骤(新建索引和删除文档所需要的步骤顺序)
- 客户端请求集群节点(任意)-协调节点
- 协调节点将请求转换到指定的节点
- 主分片需要将数据发送个副本
- 副本保存后,进行反馈
- 主分片进行反馈
- 客户端获取反馈
2.3、数据写流程的请求参数
- 在客户端收到成功响应时,文档变更已经在主分片和所有副本分片执行完成,变更是安全的有一些可选的请求参数允许您影响这个过程,可能以数据安全为代价提升性能。这些选项很少使用,因为 Elasticsearch 已经很快,但是为了完整起见,请参考下面表格:
参数 含义 consistency consistency,即一致性。在默认设置下,即使仅仅是在试图执行一个_写_操作之 前,主分片都会要求 必须要有 规定数量(quorum)(或者换种说法,也即必须要 有大多数)的分片副本处于活跃可用状态,才会去执行_写_操作(其中分片副本 可以是主分片或者副本分片)。这是为了避免在发生网络分区故障(network partition)的时候进行_写_操作,进而导致数据不一致。_规定数量_即: int( (primary + number_of_replicas) / 2 ) + 1 consistency 参数的值可以设为 one (只要主分片状态 ok 就允许执行_写_操 作),all(必须要主分片和所有副本分片的状态没问题才允许执行_写_操作), 或 quorum 。默认值为 quorum , 即大多数的分片副本状态没问题就允许执行_写_ 操作。 注意,规定数量 的计算公式中 number_of_replicas 指的是在索引设置中的设定 副本分片数,而不是指当前处理活动状态的副本分片数。如果你的索引设置中指定了当前索引拥有三个副本分片,那规定数量的计算结果即:int( (primary + 3 replicas) / 2 ) + 1 = 3 如果此时你只启动两个节点,那么处于活跃状态的分片副本数量就达不到规定数 量,也因此您将无法索引和删除任何文档。 timeout 如果没有足够的副本分片会发生什么? Elasticsearch 会等待,希望更多的分片出 现。默认情况下,它最多等待 1 分钟。 如果你需要,你可以使用 timeout 参数 使它更早终止: 100 100 毫秒,30s 是 30 秒。 - 注:新索引默认有 1 个副本分片,这意味着为满足规定数量应该需要两个活动的分片副本。 但是,这些默认的设置会阻止我们在单一节点上做任何事情。为了避免这个问题,要求只有当 number_of_replicas 大于 1 的时候,规定数量才会执行。