CXL(Compute Express Link)联盟自成立以来一直是FMS闪存峰会的常客。在2022年的峰会上,CXL联盟宣布了CXL 3.0版本规范,随后在2023年的超级计算大会上推出了CXL 3.1版本。起初,CXL作为一种主机到设备的互联标准,逐渐吸收了其他竞争标准,如OpenCAPI和Gen-Z。通过在普遍存在的PCIe扩展总线上构建协议,CXL规范开始覆盖各种应用场景。
CXL联盟成员包括AMD、Intel等业界巨头,以及大量初创公司,这些公司在设备端扮演着不同的角色。在2024年的峰会上,CXL技术在众多厂商的展位演示中占据了显著位置。
CXL专题扩展阅读:
-
当CXL遇到NVMe,计算存储会发生什么?
-
CXL-GPU: 全球首款实现百ns以内的低延迟CXL解决方案
-
CXL:拯救NVMe SSD缓存不足设计难题
-
如何利用CXL技术突破内存墙?
-
CXL与PCIe世界的尽头|你相信光吗?
-
下一代分层存储方案:CXL SSD
-
是谁?阻止CXL在AI场景大展身手~
-
浅析CXL P2P DMA加速数据传输的原理
-
NVMe over CXL技术如何加速Host与SSD数据传输?
随着服务器平台从DDR4向DDR5过渡,以及对大容量RAM需求的增加(但对内存带宽或延迟要求不高),CXL内存扩展模块成为首批广泛应用的CXL设备之一。过去几年中,三星和海力士等公司在这一领域推出了相关产品。
1.SK海力士CXL内存模块与HMSDK
在2024 FMS上,SK海力士展示了其基于DDR5的CMM-DDR5 CXL内存模块,容量为128GB。该公司还详细介绍了与其配套的异构内存软件开发套件(HMSDK)——这是一组内核级和用户级的库和工具,旨在提高CXL内存的易用性。HMSDK通过考虑内存层次结构,并根据使用频率在服务器主内存(DRAM)和CXL设备之间重新定位数据,实现了这一点。
CMM-DDR5 CXL内存模块采用了E3.S 2T接口形式,配备了PCIe 5.0 x8主机接口。内部内存基于1α技术的DRAM,并承诺在一个NUMA范围内,提供与DDR5相当的带宽和延迟。鉴于这些内存模块主要用于数据中心和企业环境,固件中包含了RAS(可靠性、可用性和可服务性)特性以及安全启动等功能。
SK海力士还展示了Niagara 2.0——一个基于FPGA的硬件解决方案,用于实现内存池化和共享,即连接多个CXL内存模块,使不同的主机(CPU和GPU)能够最优化地共享其容量。与之前的版本相比,最新的版本不仅支持容量共享,还支持数据共享。
2.Microchip与美光CZ120 CXL内存扩展模块
去年,美光基于Microchip SMC 2000系列CXL内存控制器推出了CZ120 CXL内存扩展模块。在2024年的峰会上,美光和Microchip共同展示了该模块在Granite Rapids服务器上的应用。
SMC 2000控制器支持DRAM芯片故障处理,并提供了诊断和调试工具来分析故障模块。此外,该控制器支持ECC,这是SMC 2000系列企业级RAS功能集的一部分。其灵活性确保了基于SMC 2000的CXL内存模块可以与仅支持DDR5的主DRAM协同工作。
3.Marvell Structera CXL产品线
在2024 FMS开始前几天,Marvell宣布了全新的CXL产品线——Structera。与专注于内存池化和扩展的其他CXL设备解决方案不同,Structera产品线还包括计算加速器部分,除了内存扩展控制器之外。所有这些组件均基于TSMC的5nm工艺制造。
计算加速器部分——Structera A 2504(A代表Accelerator),是一款PCIe 5.0 x16 CXL 2.0设备,集成了16个运行在3.2GHz的Arm Neoverse V2(Demeter)核心。它支持四个DDR5-6400通道,每个通道最多支持两个DIMM,以及内联压缩和解压功能。集成高性能服务器级ARM CPU核心意味着CXL内存扩展部分不仅扩展了每核心的内存带宽,还增强了计算能力。
像Deep-Learning Recommendation Models(DLRM)这样的应用可以从CXL设备的计算能力中获益。带宽扩展的同时还伴随着工作负载能耗的降低。这种方法也有助于服务器内部的整体热设计优化。
Structera X 2404(X代表Expander)可作为PCIe 5.0(单x16或双x8)设备,支持四个DDR4-3200通道(每通道最多3个DIMM)。Structera X 2404同样具备内联(解)压缩、加密/解密以及硬件支持的安全启动等功能。与Structera X 2404的100W TDP相比,Marvell预计这部分功耗约为30W。该部件的主要目的是使超大规模数据中心能够回收DDR4 DIMM(每个扩展器最多6TB),同时增加服务器内存容量。
Marvell还有一款Structera X 2504,支持四个DDR5-6400通道(每个通道两个DIMM,最多4TB每扩展器)。其他方面与DDR4回收部分相同。
Marvell强调了Structera产品线的一些独特之处——内联压缩优化了可用的DRAM容量,DDR4扩展器每个通道支持3个DIMM,从而最大化了每个扩展器的DRAM容量。5nm工艺降低了功耗,并且这些部件支持来自多个主机的访问。Arm Neoverse V2核心的集成似乎是CXL加速器的首次尝试,它使得计算任务成为可能,从而提升了系统的整体性能。尽管Marvell公布了Structera部件的规格,但样品至少还需要几个季度才能推出。
4.XConn与MemVerge CXL内存共享
XConn Technologies 和 MemVerge, Inc. 将在2024年的Future of Memory and Storage (FMS)大会上展示业界首个可扩展的CXL内存共享解决方案。该解决方案利用CXL技术来提高性能并降低AI应用程序和内存数据库的总体拥有成本(TCO)。通过结合MemVerge的智能分层软件与XConn的高性能CXL互联交换机,双方展示了CXL在加速高需求应用方面的有效性。
XConn的“Apollo”CXL 2.0交换机是业界首个支持CXL 2.0标准的交换机,同时也兼容Intel和AMD现有的CXL 1.1服务器处理器。Apollo CXL 2.0交换机专为加速AI计算系统的开发过程而设计,支持构建CXL内存池以打破传统的内存限制,并推动内存架构的革命。Apollo交换机支持PCIe 5.0标准,能够在单个设计中同时支持PCIe和CXL,提供高达2,048GB/s的总带宽和256条通道,为希望利用JBOG(一堆GPU)和JBOA(一堆加速器)配置的系统设计者提供了灵活性。
MemVerge Memory Machine for CXL 是一个管理内存-存储层次结构的大内存平台,支持敏捷的服务器内存扩展和基于结构的内存。MemVerge软件通过允许应用程序共享内存,解锁了结构连接内存的性能潜力,从而加速了CXL技术的采用。
XConn Technologies和MemVerge的合作展示了CXL技术在AI和内存数据库领域的巨大潜力,通过实现可扩展的内存共享,该解决方案不仅提高了性能,还降低了总体拥有成本。XConn Apollo CXL 2.0交换机和MemVerge Memory Machine for CXL的结合为AI和高性能计算应用提供了强大的基础设施支持,有望推动下一代计算架构的发展。
5.MSI与MemVerge
MSI在FMS 2024展示了其基于CXL(Compute Express Link)技术的服务器平台。该平台采用了第四代AMD EPYC处理器,并在三星和MemVerge的展位上展出。该服务器旨在通过增加内存容量和带宽来提升内存数据库、EDA(电子设计自动化)和HPC(高性能计算)应用的性能。服务器采用了最新的AMD EPYC处理器,支持CXL 2.0内存扩展标准。MemVerge提供的软件可以智能地管理多层内存,优化AI和其他内存密集型工作负载的成本和性能。
MSI的S2301 CXL内存扩展服务器结合了三星的256GB CXL2.0内存模块和MemVerge的Memory Machine X软件,通过智能管理内存层级来优化AI和其他内存密集型工作负载的成本和性能,根据带宽或延迟QoS策略自动将数据放置在合适的内存层级,以达到最优性能。
6.Fadu
Fadu, Inc. 将在FMS 2024大会上推出针对AI数据中心优化的企业级SSD控制器和CXL(Compute Express Link)解决方案。Fadu将推出针对AI优化的下一代企业级SSD解决方案,并展示其在Gen5和Gen6控制器领域的领先地位。Fadu推广FDP (Flexible Data Placement)技术,这是一种针对下一代数据中心的标准讨论。Fadu还将推出一种新的系统,通过CXL开关优化GPU、HBM和SSD之间的连接,以增强性能。
7.Wolley
Wolley之前已在FMS 2023上展示了其PCI-SIG 5.0认证的CXL控制器IP核心。此后,该公司继续将其CXL技术扩展至数据中心之外的应用领域,例如AI PC和汽车。Wolley在FMS 2024上提供NVMe Over CXL和FleX解决方案的现场演示。NVMe Over CXL提供了一种高性能虚拟化架构,以满足AI对大量内存容量的需求。FleX技术则将CXL内存引入主板。
NVMe Over CXL: 虚拟化内存与存储的整合:Wolley开发了一种解决方案,利用CXL并在相同的PCIe物理接口上使用CXL.mem协议实现高效的内存访问,而CXL.io协议则支持所有NVMe的传统特性,无需重写应用程序。通过在同一设备上集成存储和内存,解决了资源分配中的竞争条件。
8.Teledyne LeCroy与Cadence展示CXL 3.x技术
Teledyne LeCroy, Inc.与Cadence Design Systems, Inc.合作,在2024 FMS大会上展示了Compute Express Link (CXL) 3.x技术。这是两家公司第二次公开演示高速CXL 3.x技术。
Teledyne LeCroy的Summit M616是一款支持PCIe 6.0协议的分析仪/测试仪,它是Teledyne LeCroy一系列PCIe和CXL协议测试解决方案中的最新成员。Summit M616支持设计工程师创建、捕获、解码和分析CXL 3.x流量,帮助他们验证和确认最新的高速内存和加速器设备。
Summit M616能够以高达64GT/s的速度运行,提供强大的CXL 3.x分析和测试能力。适用于CXL 3.x设备的设计验证、调试以及性能优化。作为一款协议分析仪/测试仪,Summit M616不仅能够分析CXL 3.x流量,还可以用于测试PCIe和NVMe协议,为工程师提供全面的支持。
虽然,各个厂商都在CXL大力投入,但是CXL正处于缓慢增长阶段,短期内不太可能出现急剧增长。业内都在摸索中前进,保持技术观望。
如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!
精彩推荐:
-
存储正式迈入超大容量SSD时代!
-
FMS 2024: 带来哪些存储技术亮点?
-
IEEE报告解读:存储技术发展趋势分析
-
什么?陶瓷也可以用来存储数据了?
-
都说固态硬盘寿命短,那么谁把使用寿命用完了吗?
-
内存原生CRAM技术将会颠覆计算存储的未来?
-
浅析SSD性能与NAND速率的关联
-
MCR DIMM如何解决内存带宽瓶颈?
-
浅析MPS对PCIe系统稳定性的影响
-
CXL-GPU: 全球首款实现百ns以内的低延迟CXL解决方案
-
万字长文|下一代系统内存数据加速接口SDXI解读
-
数据中心:AI范式下的内存挑战与机遇
-
WDC西部数据闪存业务救赎之路,会成功吗?
-
属于PCIe 7.0的那道光来了~
-
深度剖析:AI存储架构的挑战与解决方案
-
CXL崛起:2024启航,2025年开启新时代
-
NVMe SSD:ZNS与FDP对决,你选谁?
-
浅析PCI配置空间
-
浅析PCIe系统性能
-
存储随笔《NVMe专题》大合集及PDF版正式发布!