CXL终将在2025年走向成熟

CXL是我们翘首以盼的技术。平心而论,CXL已然存在,并在部分产品中有所应用。然而,我认为大多数业内人士,回溯至2019年,都曾预期它会在2024年成为技术领域的重要组成部分。展望2025年,CXL有望从一项相对小众的技术,发展成为我们开始频繁接触并使用的技术。

2019年,当时CXL正从英特尔的内部技术转型为一个技术联盟。在2019年第一季度,AMD尚未发布AMD EPYC 7002系列“Rome”处理器,NVIDIA也尚未凭借AI芯片颠覆整个市场,而英特尔当时仍处于行业的主导地位,有能力向业界推广此类技术。一个有趣的插曲是,在2019年4月的英特尔互连日(Interconnect Day)上,英特尔的互连技术路线图中包含大量以太网技术。这恰逢英特尔收购Mellanox失败的时期。另一个值得关注的点是,当时CXL/PCIe受到了优先重视,而像NVLink、UALink等可扩展的UPI替代方案则未成为焦点。

Stephen Van Doren(Intel)- CXL互连技术的适用场景

然而,到2021年,CXL的技术方向已经明确,产品化进程也在加速。

此后,发生了一些有趣的变化。首先,AMD EPYC Genoa于2022年推出,支持CXL Type-3内存扩展设备。就英特尔而言,虽然其第四代英特尔至强可扩展处理器“Sapphire Rapids”在发布时并未支持CXL Type-3设备,但这些芯片本身已经支持CXL。正式支持直到大约一年前发布的第五代英特尔至强处理器“Emerald Rapids”才得以实现。通过这种方式,英特尔在支持内存扩展设备方面比AMD晚了一年。

美光CZ120 CXL内存扩展模块(在FMS 2023展出)

如今,最新的服务器已经支持CXL,而其中一个主要驱动力将是内存扩展。对于不熟悉Type-3设备的人来说,简单来说,CXL Type-3设备通过CXL或PCIe通道实现内存扩展,连接一个带有DRAM的CXL内存控制器。部分内存供应商正在开发类似SSD的CXL驱动器,最终这些驱动器将像SSD一样插入E3.S或E3.L EDSFF硬盘位。

另一种常见形式是看起来像带有内存或DIMM的PCIe卡,例如Astera Labs的Leo CXL内存扩展卡。

Astera Labs Leo CXL内存扩展卡(配备DIMM,在STH Studio展出)

在服务器中进行规模扩展时,我们会看到类似联想CXL内存扩展解决方案的设备,该设备搭载128个128GB DDR5 DIMM模块,我们最近在Astera Labs的展台上看到了这个设备。联想ThinkSystem SR860 V3旨在处理像SAP HANA这样的内存密集型工作负载,其需求是尽可能多的内存。

联想ThinkSystem SR860 V3 CXL(采用Astera Labs技术)

我们还看到了像Montage和华硕(ASUS)这样的定制模块,这些模块在华硕的AMD EPYC CXL内存使能服务器中得到了展示,该服务器拥有四个服务器节点和多个内存扩展模块,所有模块都安装在同一个机箱内。

华硕RS520QA E13 RS8U(在OCP 2024展出)

可能更具创新性的变体是像Inventec的96 DIMM CXL扩展盒这样的设备,它能够在专用机箱中容纳数TB的内存。而且,这个机箱可以连接到一个或多个服务器。

Inventec CXL扩展盒(在OCP峰会2024展出)

随着CXL 2.0的发展,就有了切换路径(switching path)。我们认为,CXL交换技术,尤其是在未来的PCIe Gen6/CXL 3.x时代,将成为一个重要的应用场景。想象一下,像上面提到的那种设备,通过将内存扩展架接入机架,利用交换架构进行动态内存分配。

XConn SC50256 CXL 2.0交换芯片(在FMS 2022展出)

其中一个重要的优势,尤其是在超大规模数据中心集中精力延迟通用计算刷新周期的背景下,是CXL控制器不需要依赖DDR5。例如,使用像Marvell Structura这样的控制器,以重新利用大量的DDR4 DIMM,这不仅节省了内存采购成本,还减少了生产新模块所产生的排放。实际上,超大规模的数据中心可以将旧的DDR4内存提取出来,将它们安装到基于DDR4 CXL控制器的机架中,然后动态地分配给不同的节点,这带来了巨大的成本节省。

Marvell Structera 2504 DDR4 CXL扩展

除了DDR5和DDR4,还有其他选择,比如Kioxia在FMS 2023展会上展示的CXL和BiCS Flash SSD,这也为内存扩展提供了一个非常好的选择。

Kioxia CXL与BiCS Flash(在FMS 2023展出)

我们对所有厂商的请求是,CXL Type-3设备需要具备即插即用的体验。2023年初,如果尝试使用CXL控制器,往往只能在一些特定系统中验证,且两端的固件必须是特定版本。它需要像插入SSD那样简单。我们正在逐步接近这一目标,还未完全实现这一点。

然而,到2025年,预计将有更多的CXL服务器设计推出,特别是针对那些对内存和内存带宽有更高需求的通用计算任务。随着技术的逐步可部署,CXL将在更多领域得到应用。它面临的一个主要挑战是,CXL通常并不是AI构建的一部分。2027年可能是大规模采用和一些更具创新性应用场景的最佳预测,但无论如何,它终将到来!

留下回复

您的邮箱地址不会被公开。 必填项已用 * 标注