MongoDB高可用和分片集群知识

news2026/3/26 4:52:10

一、MongoDB实现高可用

1. MongoDB复制集(Replication Set)

在实际生产中，MongoDB要实现高可用，以免MongoDB单实例挂了，服务不可用。MongoDB实现高可用是以MongoDB复制集的形式实现，和集群部署概念相同，MongoDB复制集有多个MongDB实例，其中包含一个主节点和多个从节点组成。所有对MongoDB的写操作都写入到主节点，从节点通过数据同步从主节点中复制数据(备节点不只是从主节点上同步数据，还可以选择一个离自己最近（心跳延时最小）的节点来复制数据)，以保证数据的高可用。

复制集高可用依赖于两个功能实现: 1.数据被写入后，数据迅速的同步到另一个节点上。2.主节点发生故障后其他节点实例能自动的选取出一个新的替代节点。

在实现MongoDB复制集的同时，也实现了以下几个功能:

读写分离: 不同类型的压力分别在不同的节点上执行
异步容灾: 在数据中心故障时候快速切换到异地
数据分发: 将数据从一个区域复制到另一个区域，减少另一个区域的读延迟

2.复制集模式

通常复制集由三个节点组成，来保障数据的高可用，其中复制集模式可以分为PSS模型、PSA模式。

2.1 PSS模型（官方推荐）

PSS为一个primary节点和两个secondary节点，既一主两从。
在这里插入图片描述

一旦主节点出现故障，从节点会自动选举出一个新的主节点。

2.2 PSA模型

PSA为一个primary节点和一个secondary节点以及一Arbiter(仲裁)节点，既一主一从一仲裁。

在这里插入图片描述

Arbiter节点不存储数据副本，也不提供业务的读写操作。Arbiter节点发生故障不影响业务，仅影响选举投票

3.复制集高可用依据

3.1 复制集选举方面

选举的过程中会进行投票选举，选举中为避免平票的情况，MongoDB的实例节点数要为奇数，主要措施有两个:

为选举定时器增加少量的随机时间偏差，这样避免各个节点在同一时刻发起选举，提高成功率。
2 .使用仲裁者角色，该角色不做数据复制，也不承担读写业务，仅仅用来投票。

3.2 自动故障转移

MongoDB节点之间会通过心跳机制进行通信，复制集建立好之后，就开启定时器，实现心跳检测功能，选举心跳检测失败后，不会立即触发重新选举，直到electionTimeout被触发。
electionTimeout触发选举需要满足的条件有: （1）当前节点是备节点 (2)当前节点具备选举条件 (3)在心跳检测期间主节点还没能进行通信

3.3复制集同步数据

3.3.1 同步数据原理

主节点和备节点之间是通过opLog进行同步数据的，opLog是一个固定集合的结构，其中主节点向opLog写入数据，备节点在opLog中读取数据，以达到同步。
在这里插入图片描述
其中opLog保证节点有序，备节点通过轮询的方式进行拉取数据。每个备节点都维护了一个offset,也就是从主节点拉取的最后一条日志的optime，在执行同步时就通过这个optime向主节点的oplog集合发起查询。