科技巨头和人工智能初创公司为了在AI竞赛中保持竞争力,正在消耗巨大的电力,这为全球数据中心脱碳目标带来了新的挑战。
如今,功耗极高的AI芯片,例如NVIDIA的“Hopper”GPU,每块功耗高达700瓦,显著提高了训练和运行大型语言模型(LLM)所需的单台服务器的电力需求。NVIDIA进一步推出“Blackwell”系列GPU,功耗将提升至1200瓦,产生大量热量,需通过液冷技术散热。不排除到本世纪末,单台服务器GPU功耗可能超过2000瓦的可能性。
这使得数据中心每机架的电力需求从目前的15-30千瓦激增至超过100千瓦。英飞凌(Infineon)正试图通过全新电源供应单元(PSU)路线图保持领先,这些单元专为应对当前及未来搭载AI芯片的服务器机架的电力需求而设计。这些单元总计提供3至12千瓦的电力,结合英飞凌的三大功率半导体技术——硅(Si)、碳化硅(SiC)和氮化镓(GaN),以提高能效并节省空间。
英飞凌并未直接向AI及其他科技公司出售开关模式电源(SMPS),而是推出了基于其功率FET、微控制器(MCU)、栅极驱动IC、高压隔离及其他IC的参考设计。除了当前可输出高达3千瓦或3.3千瓦的电源外,英飞凌还推出了一个先进的8千瓦PSU参考设计。
这款电源效率高达97.5%,功率密度达每立方英寸100瓦,据称是市场上现有3千瓦电源单元的三倍。
碳化硅与氮化镓:AI未来的功率半导体
该电源供应单元(PSU)采用混合架构,充分利用英飞凌的每一种功率开关技术,在效率和功率密度提升最大的环节使用碳化硅(SiC)、氮化镓(GaN)和硅(Si)功率FET。
这款8千瓦电源包括前端交错无桥图腾柱和后端隔离全桥LLC设计,其体积比基于开放计算项目(OCP)标准的5.5千瓦PSU更加紧凑(见图1)。

图腾柱功率因数校正(PFC)采用碳化硅(SiC),因为其在高温下具有更高的效率。650伏SiC MOSFET的一个优势是其较低的温度系数,这意味着器件的导通电阻(RDS(on))受热影响较小。
高频全桥LLC阶段的核心是氮化镓(GaN)。650伏GaN FET因其较低的电容而受到青睐,这使得开关过程中的开启和关闭时间更快。因此,LLC阶段的开关频率范围从350兆赫兹到1.5吉赫兹。
更快的开关速度减少了功率损耗,为使用更小的电容器、其他被动元件以及变压器和其他磁性元件创造了条件,从而提升了功率密度。硅MOSFET用于电源的整流阶段(包括PFC和DC-DC转换器),此时开关损耗的影响较小。这些器件因其低RDS(on)而成为最合适的选择。
这款8千瓦电源还采用基于英飞凌微控制器(MCU)的全数字控制,覆盖图腾柱PFC和全桥LLC阶段,为更精确和灵活的电源管理铺平了道路。此外,公司表示,数字控制回路能在不同负载条件下提供最佳性能。新单元还加入了专有磁性器件,进一步提升了其高效率和功率密度。
另一项创新涉及电源中的储能电容器。储能电容器是一种靠近电源输入端的能量存储单元,充满电后可为系统提供电流安全网。该器件能在输入电流断开时防止电源输出电压下降过大,平滑电力传输过程中的任何中断。
除了为服务器提供备用电源外,这些储能电容器还用于过滤和减少因浪涌电流或系统中其他瞬态现象引起的电源纹波。
在数据中心中,AC-DC电源转换器用于为搭载CPU、GPU和其他AI芯片的服务器提供稳定电压。通常,这些电源设计能够应对进入其中的高压交流电的短期中断。“保持时间”是指在电源短缺或关闭导致交流输入电压中断时,电源能够继续输出稳定直流电压的时间长度。
如果时间超过这个范围,电容器中储存的能量将被耗尽。随之而来,电源供应单元(PSU)的输出电压会下降甚至完全关闭。这可能导致服务器中的处理器关闭或重启,干扰AI训练这一耗电巨大的过程。训练最大的AI模型可能需要连续数天时间——在许多情况下甚至远超这个时长——因此,中断过程可能会带来巨大损失。
由于保持时间与电源在故障后能够继续供电的时间成正比,增加电容是一个优势。然而,权衡之处在于,增加电容意味着需要使用更大的电容器,这将在系统中占用更多空间,并且不可避免地增加成本。储能电容器已经是电源中最大的组件之一,在最新的高功率电源中往往体积更大。
英飞凌表示,其通过电源中的“辅助升压电路”解决了这一问题。该电路由600伏超结MOSFET和650伏碳化硅(SiC)二极管组成,能够延长8千瓦电源在不使用笨重电容器作为中间能量存储的情况下,持续提供稳定直流输出电压的时间,从而节省空间并提升可靠性。该电源在100%负载下支持20毫秒的保持时间。
电源单元是数据中心电力传输的重要组成部分
电源供应单元(PSU)的职责是将用于向服务器机架配电的高压交流电(AC)转换为服务器电路板所需的低压、直流电(DC)。在英飞凌的案例中,输入为单相高线电网(180至305伏交流电),输出范围为48至51伏直流电,电流高达160安培。虽然数据中心电源的标准直流输出过去是12伏,但整个科技行业正在将标准提升至48伏。

数据中心减少功率损耗的关键之一是以较高电压传输电力,然后在尽可能靠近AI加速器或其他芯片处理器核心使用的电压处进行降压。
根据欧姆定律,功率等于电流乘以电压(P = I × V),将电力传输从12伏提升至48伏意味着电流消耗减少4倍,使公司能够使用更小的母线和数据中心的电力传输线,从而节省空间并降低成本。根据欧姆定律的另一种形式,功率等于电阻乘以电流平方(P = R × I²),从48伏切换至12伏可将电阻功率损耗减少16倍。
电源供应单元将54伏或48伏直流电送入服务器后,电力会经过多个DC-DC转换器,将PSU的输入电压降至适合服务器中GPU或其他系统芯片(SoC)的正确电压。在许多情况下,中间母线转换器(IBC)将54伏或48伏直流电转换为12伏或更低电压,然后电力流入电压调节模块(VRM),将IBC的输出电压尽可能降至接近活跃硅片所需的电压。或者,这些DC-DC转换器可直接将PSU的54伏直流电转换为SoC的“核心”电压。
英飞凌还在努力解决数据中心AI电力传输网络的“最后一英寸”。在2024年APEC展会上,该公司推出了一系列多相电压调节器(VR),这些调节器紧邻服务器中的处理器或加速器。这些模块尽可能靠近AI硅片的负载点(POL)放置,并可围绕处理器集群部署,以超过90%的效率向其输送超过2000安培的电流。
随着AI工作负载在数据中心消耗越来越多的电力,电力电子公司不愿落后。未来,英飞凌计划推出其称为“全球首款”的12千瓦PSU参考设计。