Kafka 副本机制（包含AR、ISR、OSR、HW 和 LEO 介绍）

Kafka 的副本机制是其高可用性和容错性的核心之一，它确保在发生故障时数据不会丢失，同时允许系统继续提供服务。副本机制通过将每个分区的数据复制到多个 Broker 上，保证了即使某个 Broker 宕机，数据仍然可以通过其他 Broker 访问。

1. 副本的基本概念

副本（Replica）：每个 Kafka 分区都会有多个副本，这些副本分布在不同的 Broker 上。副本包括：
- 领导者副本（Leader Replica）：每个分区只能有一个领导者副本，负责处理生产者的写入请求和消费者的读取请求。领导者副本是所有客户端请求的入口。
- 追随者副本（Follower Replica）：其他副本是追随者副本，追随者副本的任务是从领导者副本同步数据。追随者副本不直接处理客户端的读写请求，它们仅用于数据的备份。

在这里插入图片描述

Kafka 在数据存储和分布式消息传递中使用了多个概念和指标来描述消息的状态、副本的同步情况，以及如何处理消费者的读取。以下是这些概念和指标的详细介绍：

定义：

AR（Assigned Replicas） 代表的是 Kafka 分区的 所有副本，包括领导者副本（Leader Replica）和所有追随者副本（Follower Replicas）。

作用：

举例：
假设 Kafka 分区有 3 个副本：

那么，AR 列表就是 [r1, r2, r3]。无论 r2 和 r3 是否与领导者同步，都会包含在 AR 列表中。

定义：

ISR（In-Sync Replicas） 代表的是与 Kafka 分区 领导者副本同步 的副本。只有同步副本才被认为是与领导者保持一致的副本，并且能够承载新的写入操作。

作用：

举例：
假设分区有 3 个副本：r1（领导者）、r2 和 r3。如果 r1 和 r2 保持同步，而 r3 延迟了很长时间并未同步，它会被从 ISR 中移除。此时，ISR 列表是 [r1, r2]。

定义：

作用：

举例：
如果 r3 因网络问题滞后于 r1，它会被认为是 OSR，并从 ISR 中移除。直到它追赶上领导者副本，才会重新加入 ISR。

定义：

HW（High Watermark） 是 Kafka 中的一个关键指标，它表示 Kafka 分区中所有副本（特别是 ISR 中的副本）已经 确认并同步 的 最高偏移量。简单来说，HW 是 Kafka 中最新已被写入的、所有副本均已同步的消息偏移量。

作用：

举例：
假设 Kafka 分区的领导者副本 r1 写入了偏移量 1000，并且此时该消息已同步到 ISR 中的所有副本（例如 r2 和 r3）。此时，HW 为 1000，意味着所有副本都已经确认并能够读取该消息。

定义：

作用：

举例：
假设 Kafka 分区的日志写入了 1500 条消息，那么 LEO 就是 1500，表示这是该分区最新写入的偏移量。如果一个消费者的偏移量是 1499，那么它会尝试消费 1500 之后的消息。

开始分区存在3个副本，此时HW和LEO的值都为3；
生产者将消息写入Leader副本后，follower副本进行消息同步；

3.同步过程中，leader副本的LEO为8，follower0的LEO为6，follower1的LEO为5；当前分区的HW最小值为5；

4.等待同步完成，LEO和HW的值为8。

生产者写入数据：
- 生产者将消息发送到分区的领导者副本。领导者副本接收并写入数据。
- 领导者副本将写入的数据同步到所有的追随者副本。同步方式是异步的，即领导者副本会先处理生产者的请求，而不是等待所有追随者副本完成同步。
消费者读取数据：
- 消费者只能从领导者副本读取数据。领导者副本确保它的数据是最新的且与其他副本同步一致。
副本同步过程：
- 每个追随者副本定期从领导者副本拉取日志数据。追随者副本会确保其存储的数据与领导者副本的数据一致。
- 追随者副本会记录日志的偏移量，每次同步时，更新其当前的偏移量。

replication.factor：每个分区的副本数量，通常设置为 3，表示每个分区有 3 个副本（1 个领导者副本，2 个追随者副本）。
min.insync.replicas：指定一个分区在进行生产者写入时，必须有多少个副本是同步的。若少于这个数量，写入请求将被拒绝。这个配置确保了数据的一致性和高可用性。
unclean.leader.election.enable：是否允许未同步副本作为领导者进行选举。通常该配置为 false，表示只有 ISR 中的副本才能被选为新的领导者。
replica.lag.time.max.ms：副本同步最大容忍延迟时间。如果副本的同步延迟超过该时间，它将被移出 ISR。