最近,每当一家主要的科技行业公司举办大型活动时,它几乎不可避免地会讨论它们关注的生成式人工智能策略和最新产品。正如主要半导体供应商AMD在圣何塞举办的“Advancing AI”活动一样。公司正式推出了先前宣布的Instinct MI300系列基于GPU的数据中心AI加速器,讨论了该产品不断发展的软件生态系统,制定了AI加速PC芯片的路线图,并在此过程中介绍了一些有趣的技术进步。
这个活动还是让人感到印象深刻。AMD讲述了一个扎实而全面的产品和技术故事,强调了大量的客户/合作伙伴,并展示了公司在CEO 苏姿丰领导下的拼搏和竞争精神。这也让人更加确信,AMD将成为英伟达在人工智能训练和推理领域的有力竞争对手。
活动的大部分焦点都集中在新的Instinct MI300X上,该产品显然是英伟达市场主导的基于GPU的AI加速器(如H100)的竞争对手。尽管科技世界大部分已经迷恋上了英伟达硬件和CUDA软件组合实现的GenAI性能,但人们也越来越认识到,他们对市场的绝对垄断不利于长期的健康发展。因此,AMD面临着很大的压力,需要拿出一个合理的替代方案,特别是因为AMD通常被视为英伟达在GPU领域唯一的有力竞争对手。
值得庆幸的是,MI300X无疑让全世界都松了一口气,因为最初的基准测试表明,AMD实现了许多人的期望。具体来说,AMD吹嘘他们可以在人工智能模型训练上与英伟达的H100相媲美,并在人工智能推理工作负载上提供高达60%的提升。此外,AMD还宣称,将8张MI300X卡整合到一个系统中,将成为世界上最快的生成式人工智能计算机,并提供比目前英伟达替代产品更快的高速内存。公平地说,英伟达已经宣布了GH200(代号为“Grace Hopper”),它将提供更好的性能,这注定是一场性能跨越式的游戏。不管人们如何选择接受或挑战基准,关键是AMD现在已经准备好参与这个游戏了。
考虑到这种性能水平,AMD将一长串合作伙伴列上舞台并不奇怪。从微软Azure、Oracle cloud和Meta等主要云提供商到戴尔科技、联想和超微电脑等企业服务器合作伙伴,这些合作伙伴都对此表示赞扬和兴奋。当然,这是可以理解的,因为这些公司都需要一家能够替代英伟达的公司,来满足他们对于生成式AI的巨大需求。
除了MI300X,AMD还讨论了他们的Instinct MI300A,这是该公司专为数据中心设计的第一个APU。MI300A利用与MI300X相同类型的GPU XCD(加速器复杂芯片)元素,但包括六个而不是八个,并利用额外的芯片空间来包含八个Zen4 CPU核心。此外,通过使用AMD的Infinity Fabric芯片对芯片互连技术,它为整个系统提供了对大型、共享的高带宽内存(HBM)的共享和同时访问。
在这次活动中,一个有趣的技术批注是AMD宣布计划向有限的合作伙伴开放之前专有的Infinity Fabric技术。虽然目前还不知道细节,但可以想象,未来可能会出现一些新的多厂商芯片设计。
这种同时访问CPU和GPU内存的能力对于HPC类型的应用程序至关重要,而且这个能力显然是劝说劳伦斯利物浦国家实验室选择MI300A作为其与HPE合作建造的新一代超级计算机El Capitan核心的一个原因。据预计,El Capitan将是世界上最快且最节能的超级计算机之一。
在软件方面,AMD还在围绕其用于GenAI的ROCm软件平台做了许多宣传,该平台现已升级到第6版。与新硬件一样,他们讨论了几个关键的合作伙伴关系,这些合作伙伴关系建立在之前的新闻基础上(例如与开源模型提供商Hugging Face和PyTorch AI开发平台的合作),并首次亮相了一些关键的新闻。其中最重要的是OpenAI表示将为其自己的Triton开发平台的3.0版本带来对AMD最新硬件的本地支持。这将使许多渴望加入OpenAI阵营的程序员和组织可以轻松利用AMD的最新硬件(并为他们提供了一个到目前为止他们只能选择Nvidia的替代方案)。
AMD公告的最后一部分介绍了他们在人工智能PC电脑方面的进展。虽然该公司没有得到太多的赞誉或认可,但他们实际上是第一个将专用NPU集成到PC芯片中的公司,去年推出了Ryzen 7040。它包含的XDNA AI加速模块利用了AMD通过收购赛灵思获得的技术。在今年的活动中,该公司宣布了新的Ryzen 8040,其中包括升级的NPU, AI性能提高了60%。有趣的是,他们还预览了代号为“Strix Point”的下一代,预计要到2024年底才会推出。与7040相比,它将包含的XDNA2架构有望提供令人印象深刻的3倍提升。考虑到该公司在此期间仍需要销售基于8040的系统,你可能会认为新芯片的“预告”有点不寻常。然而,作者认为AMD想要做的,是在预览中强调这是一个令人难以置信的快速发展的市场,他们已经准备好竞争。当然,这也是对竞争对手英特尔和高通的一次打击,这两家公司都将在未来几个月推出NPU加速的PC芯片。
再次强调,除了硬件,AMD还讨论了一些有趣的PC AI软件的进步,包括官方发布的Ryzen AI 1.0软件,用于简化和加速基于生成式AI的模型和应用程序在个人电脑上的使用。AMD还邀请了微软新任Windows业务负责人Pavan Davuluri上台,介绍了他们在未来版本Windows中为AMD的XDNA加速器提供原生支持的工作,并讨论了混合人工智能(hybrid AI)这一日益热门的话题,公司希望能够在云和客户端PC之间分割某些类型的人工智能工作负载。在这个领域以及整个AI PC领域,还有很多工作要做,但在2024年肯定将是一个有趣的观察领域。
总而言之,AMD的人工智能故事令人印象深刻,毫无疑问,人们对它充满了热情。从行业的角度来看,看到更多的竞争是件好事,因为这将让这个新领域更快地发展。然而,为了真正有所作为,AMD需要继续执行好自己的愿景,他们还有很多工作要做。
译者案
可以说,这次Instinct MI300X给市场打了一剂强心剂,无论后续市场买单与否,就显得不那么重要了。因为Instinct MI300X确实证明了AMD有参与AI游戏的能力。但是英伟达的新芯片也不可忽视,这注定是一场追逐赛。而AMD只要不掉队,随着技术的发展,以后AI的框架对底层硬件支持会越来越弹性,不太需要特定硬件生态,那英伟达的护城河也会越来越弱。AMD关于AI的故事,就可以一直讲下去。