超级计算机
- 概述
- 主要特点
- 处理能力
- 并行处理
- 大规模存储
- 应用领域
- 能耗
- 云超算
- 中国超算
- 流行体系结构
- 片内异构
- 节点内异构
概述
当谈到超级计算机时,我们指的是性能超高、处理能力强大的计算机系统。
它们通常由数以千计的处理器核心组成,并具备大规模的内存和高速的存储系统。
超级计算机被设计用于处理极其复杂和计算密集的任务,这些任务在传统计算机上可能需要花费数天或数周的时间来完成。
超级计算机的运算速度发展趋势
主要特点
处理能力
超级计算机拥有极高的处理能力,通常以浮点运算速度来衡量。
其性能通常以每秒浮点运算次数(FLOPS)来衡量,可以达到百万亿级(petaflops)或者更高。
现代的超级计算机甚至可以达到百万亿亿级(exaflops)的性能。
常见单位如下:
- MFlops — 百万( 1 0 6 10^6 106)次浮点运算每秒 M级别
- GFlops — ⼗亿( 1 0 9 10^9 109)次浮点运算每秒 G级别
- TFlops — 万亿( 1 0 12 10^{12} 1012)次浮点运算每秒 T级别
- PFlops — 千万亿( 1 0 15 10^{15} 1015)次浮点运算每秒 P级别
- EFlops — 百万万亿( 1 0 18 10^{18} 1018)次浮点运算每秒 E级别 ⭐️⭐️ 目前人类所处位置
2023年的Top500,美国🇺🇸的超级计算机Frontier的浮点运算速度已经达到了 1.194 E F l o p s 1.194EFlops 1.194EFlops
并行处理
超级计算机通过将任务划分为多个并行的子任务,并同时在多个处理器核心上执行这些子任务,从而实现高效的并行处理。
这种并行处理方式使得超级计算机能够处理复杂的问题,如气候模拟、天体物理学、基因组学、核物理学等领域。
大规模存储
超级计算机通常配备大规模的存储系统,用于存储海量的数据和计算结果。
这些存储系统可以包括高速磁盘阵列、固态存储器等技术,以确保计算过程中的数据读取和写入能够高效进行。
应用领域
超级计算机在科学研究、工程模拟和其他领域中发挥着至关重要的作用。
它们被用于模拟天气和气候变化、研究宇宙起源和演化、开发新药物、优化交通运输、设计更高效的能源系统等。
能耗
由于超级计算机的巨大处理能力和复杂性,其能耗也非常高。
因此,研究人员和工程师在设计超级计算机时也会关注能效问题,力求在性能和能耗之间取得平衡。
云超算
近年来,超级计算机也逐渐向云计算领域发展。
云超算提供了超级计算机的性能和资源作为云服务,使更多的用户可以灵活地使用超级计算机的计算能力,而无需购买和维护实际的物理设备。
中国超算
Rank | System | Cores | Rmax (PFlop/s) | Rpeak (PFlop/s) | Power (kW) |
---|---|---|---|---|---|
1 | Frontier - HPE Cray EX235a, AMD Optimized 3rd Generation EPYC 64C 2GHz, AMD Instinct MI250X, Slingshot-11, HPE DOE/SC/Oak Ridge National Laboratory United States | 8,699,904 | 1,194.00 | 1,679.82 | 22,703 |
2 | Supercomputer Fugaku - Supercomputer Fugaku, A64FX 48C 2.2GHz, Tofu interconnect D, Fujitsu RIKEN Center for Computational Science Japan | 7,630,848 | 442.01 | 537.21 | 29,899 |
3 | LUMI - HPE Cray EX235a, AMD Optimized 3rd Generation EPYC 64C 2GHz, AMD Instinct MI250X, Slingshot-11, HPE EuroHPC/CSC Finland | 2,220,288 | 309.10 | 428.70 | 6,016 |
4 | Leonardo - BullSequana XH2000, Xeon Platinum 8358 32C 2.6GHz, NVIDIA A100 SXM4 64 GB, Quad-rail NVIDIA HDR100 Infiniband, Atos EuroHPC/CINECA Italy | 1,824,768 | 238.70 | 304.47 | 7,404 |
5 | Summit - IBM Power System AC922, IBM POWER9 22C 3.07GHz, NVIDIA Volta GV100, Dual-rail Mellanox EDR Infiniband, IBM DOE/SC/Oak Ridge National Laboratory United States | 2,414,592 | 148.60 | 200.79 | 10,096 |
6 | Sierra - IBM Power System AC922, IBM POWER9 22C 3.1GHz, NVIDIA Volta GV100, Dual-rail Mellanox EDR Infiniband, IBM / NVIDIA / Mellanox DOE/NNSA/LLNL United States | 1,572,480 | 94.64 | 125.71 | 7,438 |
7 | Sunway TaihuLight - Sunway MPP, Sunway SW26010 260C 1.45GHz, Sunway, NRCPC National Supercomputing Center in Wuxi China 🇨🇳 | 10,649,600 | 93.01 | 125.44 | 15,371 |
8 | Perlmutter - HPE Cray EX235n, AMD EPYC 7763 64C 2.45GHz, NVIDIA A100 SXM4 40 GB, Slingshot-10, HPE DOE/SC/LBNL/NERSC United States | 761,856 | 70.87 | 93.75 | 2,589 |
9 | Selene - NVIDIA DGX A100, AMD EPYC 7742 64C 2.25GHz, NVIDIA A100, Mellanox HDR Infiniband, Nvidia NVIDIA Corporation United States | 555,520 | 63.46 | 79.22 | 2,646 |
10 | Tianhe-2A - TH-IVB-FEP Cluster, Intel Xeon E5-2692v2 12C 2.2GHz, TH Express-2, Matrix-2000, NUDT National Super Computer Center in Guangzhou China 🇨🇳 | 4,981,760 | 61.44 | 100.68 | 18,482 |
现在中国超算位列第7和第10,和同阶段的超级计算机相比,中国的超级计算机所需要的功耗还是比较高的,而且核心数量也很多。
流行体系结构
片内异构
神威太湖之光的体系结构
基于众核
一个主核带众多计算小核
节点内异构
天河二号的体系结构
CPU + 加速器 结构
一个节点上有一个CPU + 一个或几个加速器