学习 MPP 与 SMP 的区别，终于有人讲明白了

news2025/2/21 20:38:33

文章目录

01 SMP
- SMP 的典型特征如下：
- SMP 的缺点如下。
02 分布式MPP计算架构
- MPP 架构核心原理如下。

导读：当今数据计算领域主要的应用程序和模型可大致分为在线事务处理（On-line Transaction Processing ，OLTP）、决策支持系统（Decision-making Support System ，DSS）和企业信息通信（Business Communication）三大类。计算平台的体系结构通常有小型独立服务器、SMP （Symmetrical Multi-Processing，对称多处理）、MPP（大规模并行处理）和 NUMA（Non Uniform Memory Access，非均匀存储器存取）结构。
.
这里，本篇文章重点讲一下 SMP 与 MPP。

01 SMP

SMP 是指在一个计算机上汇集了一组处理器（多核 CPU），各 CPU 之间共享内存子系统以及总线结构。代表数据库有 Oracle 、MySQL 。SMP 架构原理图如图1所示。
▲图1 SMP 架构原理图

$▲ 图 1 SMP 架构原理图$

SMP 的典型特征如下：

每个处理器共享操作系统的一个副本。
支持共享架构。
多任务并行架构，是一个紧耦合的多处理器系统。
多个处理器之间共享整个工作。
没有单独的缓存池或锁表，全部共享。
通过购买更大的系统来实现扩展。
容易出现资源争用等问题。
创建分布式架构需要复杂的设计，并且只能部分实现。
软件提供的内存可用量完全取决于 RAM 和负载的数量。

在 SMP 中，每个 CPU 都有自己的缓存，无论双核还是四核，其余资源都是共享的。SMP 的优点如下。

1. 共享单一操作系统副本。

2. 应用程序编程模式简便。

3. 管理成本低，易于维护管理。

SMP 的缺点如下。

伸缩扩展能力非常有限。对 SMP 服务器进行扩展的方式包括增加内存、使用更快的 CPU、增加 CPU、扩充 I/O（槽口数与总线数）以及添加更多的外部设备（通常是磁盘存储设备）。这样的架构模式直接导致内存上线受限制。
CPU 利用率低。由于每个 CPU 必须通过相同的内存总线访问相同的内存资源，因此随着 CPU 数量的增加，内存访问冲突将迅速增加，最终造成 CPU 资源的浪费，大大降低 CPU 性能的有效性。
总线有瓶颈。当大型程序的处理要求大于共享总线时，总线就没有能力进行处理了，这时共享的总线就成为性能瓶颈。
容错性和效率较低。

SMP 的典型应用场景是托管小型网站和电子邮件服务器等。

02 分布式MPP计算架构

MPP（Massively Parallel Processing，大规模并行分析处理）架构模式，是典型的分布式计算模式。MPP 的各节点不共享资源，每个执行节点可以独自完成数据的读取和计算。

MPP 架构核心原理如下。

1 ）将数据集分布在许多机器或节点上，以处理大量数据。

2 ）每个节点都有独立的磁盘存储系统和内存系统。

3 ）业务数据根据数据库模型和应用特点划分到各个节点上。

4 ）每个数据节点通过专用网络或者商业通用网络互相连接，彼此协同计算，作为整体提供数据库服务。

在 MPP 架构中，各节点都包含自己的存储和计算功能，可以独立执行查询的一部分。最后，在内存里进行数据合并，并将结果返回客户端。MPP 具有可伸缩、高可用、高性能、资源共享等优势。

MPP 由许多松耦合的处理单元组成。注意，这里是指处理单元而不是处理器。每个单元内的 CPU 都有自己私有的资源，如总线、内存、硬盘等。每个单元内都有操作系统和管理数据库实例。这种结构最大的特点在于不共享资源。代表数据库有 ClickHouse 、Snowflake 、Azure Synapse Analytics 、Impala 、Greenplum 、Elasticsearch、 Presto 。MPP 架构原理图如图2所示。

▲图2 MPP架构原理图
$▲ 图 2 MPP 架构原理图$
MPP 典型特征如下：