NVIDIA推出用于数据中心的GPU A30

在GTC 2021上，有很多与GPU相关的公告，我们的测评还没有涵盖最新的NVIDIA A30，我们发现A30是我们特别感兴趣的产品，本文我们来讨论一下NVIDIA A30。

NVIDIA A30数据中心GPU

使NVIDIA A30如此有趣的原因是它实际上是一个性能较低的NVIDIA A100的版本，NVIDIA A100是该公司的旗舰产品，但是，并非每个数据中心都可以处理好或者需要250-500W的GPU（从A100 PCIe到80GB的SXM4）。通过诸如NVIDIA A16等其他卡一样，该公司的目标是提供各式各样的GPU卡，有了NVIDIA A30，我们就拥有了一张与A100比较相似而没有那么多功能的一张显卡。

下面是NVIDIA A30 GPU的关键规格：

Peak FP64	5.2TF
Peak FP64 Tensor Core	10.3 TF
Peak FP32	10.3 TF
TF32 Tensor Core	82 TF \| 165 TF*
BFLOAT16 Tensor Core	165 TF \| 330 TF*
Peak FP16 Tensor Core	165 TF \| 330 TF*
Peak INT8 Tensor Core	330 TOPS \| 661 TOPS*
Peak INT4 Tensor Core	661 TOPS \| 1321 TOPS*
Media engines	1 optical flow accelerator (OFA) 1 JPEG decoder (NVJPEG) 4 Video decoders (NVDEC)
GPU Memory	24GB HBM2
GPU Memory Bandwidth	933GB/s
Interconnect	PCIe Gen4: 64GB/s Third-gen NVIDIA® NVLINK® 200GB/s**
Form Factor	2-slot, full height, full length (FHFL)
Max thermal design power (TDP)	165W
Multi-Instance GPU (MIG)	4 MIGs @ 6GB each 2 MIGs @ 12GB each 1 MIGs @ 24GB
Virtual GPU (vGPU) software support	NVIDIA AI Enterprise for VMware NVIDIA Virtual Compute Server

A30的规格

与新的A4000和A5000 GPU不同，NVIDIA A30卡没有显示输出；与A10不同，此卡是一张双插槽型号的卡，TDP只有165W，这意味着系统实际上仅需要提供每个插槽82.5W TDP的冷却方案。

就单插槽GPU的功耗而言，从T4至A10有了一个跃升，A30并不一张低配置的单插槽卡，其每个插槽的TDP都与T4那一代很相似。

此外，这是具有HBM2内存的Ampere这一代的部件，这让它在频谱上的性能会更高。对于那些想要用更新的一张卡来替换T4，或者用新的两张卡来进行渲染的用户，A30的另一个有趣的功能是我们获得了MIG或多实例GPU的支持，每个A30可以是单个24GB的GPU，也可以被配置成四个6GB GPU或两个12GB GPU。在我们最近的ASUS RS720A-E11-RS24U测评中，我们展示了MIG功能正在起作用，在这里，我们将A100分为两个20GB的实例。