在GTC 2021上,有很多与GPU相关的公告,我们的测评还没有涵盖最新的NVIDIA A30,我们发现A30是我们特别感兴趣的产品,本文我们来讨论一下NVIDIA A30。
NVIDIA A30数据中心GPU
使NVIDIA A30如此有趣的原因是它实际上是一个性能较低的NVIDIA A100的版本,NVIDIA A100是该公司的旗舰产品,但是,并非每个数据中心都可以处理好或者需要250-500W的GPU(从A100 PCIe到80GB的SXM4)。通过诸如NVIDIA A16等其他卡一样,该公司的目标是提供各式各样的GPU卡,有了NVIDIA A30,我们就拥有了一张与A100比较相似而没有那么多功能的一张显卡。
下面是NVIDIA A30 GPU的关键规格:
Peak FP64 | 5.2TF |
Peak FP64 Tensor Core | 10.3 TF |
Peak FP32 | 10.3 TF |
TF32 Tensor Core | 82 TF | 165 TF* |
BFLOAT16 Tensor Core | 165 TF | 330 TF* |
Peak FP16 Tensor Core | 165 TF | 330 TF* |
Peak INT8 Tensor Core | 330 TOPS | 661 TOPS* |
Peak INT4 Tensor Core | 661 TOPS | 1321 TOPS* |
Media engines | 1 optical flow accelerator (OFA) 1 JPEG decoder (NVJPEG) 4 Video decoders (NVDEC) |
GPU Memory | 24GB HBM2 |
GPU Memory Bandwidth | 933GB/s |
Interconnect | PCIe Gen4: 64GB/s Third-gen NVIDIA® NVLINK® 200GB/s** |
Form Factor | 2-slot, full height, full length (FHFL) |
Max thermal design power (TDP) | 165W |
Multi-Instance GPU (MIG) | 4 MIGs @ 6GB each 2 MIGs @ 12GB each 1 MIGs @ 24GB |
Virtual GPU (vGPU) software support | NVIDIA AI Enterprise for VMware NVIDIA Virtual Compute Server |
与新的A4000和A5000 GPU不同,NVIDIA A30卡没有显示输出;与A10不同,此卡是一张双插槽型号的卡,TDP只有165W,这意味着系统实际上仅需要提供每个插槽82.5W TDP的冷却方案。
就单插槽GPU的功耗而言,从T4至A10有了一个跃升,A30并不一张低配置的单插槽卡,其每个插槽的TDP都与T4那一代很相似。
此外,这是具有HBM2内存的Ampere这一代的部件,这让它在频谱上的性能会更高。对于那些想要用更新的一张卡来替换T4,或者用新的两张卡来进行渲染的用户,A30的另一个有趣的功能是我们获得了MIG或多实例GPU的支持,每个A30可以是单个24GB的GPU,也可以被配置成四个6GB GPU或两个12GB GPU。在我们最近的ASUS RS720A-E11-RS24U测评中,我们展示了MIG功能正在起作用,在这里,我们将A100分为两个20GB的实例。
较低的TDP有助于将这项技术以及带有HBM2的Ampere降低到较低的功耗水平。
小结
NVIDIA A30的主要影响在于,通过以较低的TDP级别提供许多高端功能,这样可以在更多的系统中使用。与250W TDP卡相比,在系统上为165W TDP的双插槽PCIe卡散热会更容易,因此,这扩展了潜在的市场,新的GPU可以在系统中使用,从而打开新的应用实例,从而将GPU推广到新的应用环境中。