Marvell 公司最新的 1.6T AEC DSP芯片

Marvell 公司最近推出了一款芯片:Alaska 1.6T AEC DSP 芯片,这款芯片能够使数据中心内的设备通过铜缆以每秒 1.6T 的速率传输数据。

这里所说的铜缆,也就是我们的直连铜缆方案,至少目前是构建大型计算系统时服务器之间互连的标准选择。

早期,数据中心运营商因为各种原因比较偏爱无源铜缆。但在如今的大型数据中心中,可能需要使用数以万计的铜缆,因此,成本不得不成为运营商必须考量的一个重要因素。

另外,随着计算服务器开始采用最新的处理器和AI加速器芯片,对输入输出(I/O)的需求日益增长。这导致了服务器之间以及服务器与交换机之间的接口速率不断翻倍,从 400G 增至 800G,并即将达到 1.6T。

然而,随着速率的提升,铜缆的有效传输距离却在不断的缩短。例如,传输25G数据的铜缆可以达到7米的传输距离,但在 100G 时降至 2 米,在 200G 时则只有 1 米。

为了解决这个问题,Marvell 给出的解决方案是在无源铜缆中加入 DSP 芯片,这就是有源的 AEC 电缆。配合这种芯片的电缆能够增强信号,从而延长传输距离,具体相比 DAC 电缆的性能对比在文章后面有数据对比。

我们知道,在数据中心互联中,其网络主要由前端网络 Frontend network 和后端网络 Backend network 构成,共同支撑着人工智能的负载。

前端网络采用传统的 Clos 网络结构,通过以太网交换机的层级结构,将服务器连接至外部 WAN/DCI 以及 Internet 。后端网络则针对 AI 的需求进行了优化,以保持 AI 加速器的高利用率,同时确保数据交换时的延迟降到最低。

下图展示的是连接机架内计算节点以及机架与机架之间的典型连接范围。

从上图可以看出,就目前来说,铜缆连接是所有可及范围内链路的首选。这些包括机架内的点对点链路,以及服务器与机架顶部交换机之间的连接。相邻机架或交换机之间的链路也在铜缆的覆盖范围内。

Marvell 的这款 Alaska 芯片采用 5nm CMOS 工艺制造,支持 8 个 200G 的通道,每个通道都采用了 PAM-4 调制。通过 DSP 器件对信号进行放大、均衡和整形,以实现更长的链路距离。

Alaska 芯片还具备”gearbox”功能,能够在不同信号速率之间进行转换,使得最终用户可以使用新型AI服务器,同时继续使用现有交换机。

Alaska 芯片还包括遥测和调试功能,使数据中心运营商能够记录流量状态和检测任何网络问题。这款芯片的尺寸为 12mm x 14mm,尽可能少地占用 QSFP-DD 或 OSFP 模块的内部空间。

使用Alaska设备进行有源电缆布线,意味着 50G 信号可以覆盖 7 米,100G 信号可以覆盖 5 米,200G 信号可以覆盖 3 米。

同时,Marvell 正在与 Amphenol、Molex 和 TE Connectivity 等有源电缆厂家合作,推动数据中心网络的发展。

随着 AI 服务器变得越来越分散,对铜互连的需求也在增加。Marvell 预计,数据中心将采用无源和有源铜缆的组合,随着速率的提升,基于无源电缆布线的业务链路的比例将逐渐减少。

据了解,Marvell 通常为每种速率开发两代芯片,第 2 代芯片比第 1 代晚两年发布。

下一代芯片可能会支持1.6T的速率,但通道数减半,这意味着 200G serdes 和PAM-4 可以实现 4x400Gbps 的链路。400G 的目标是实现 2 米的覆盖范围,但目前还不确定这是否可行。