在规格参数方面,A100核心采用的是台积电7N工艺,也就是定制版的7nm工艺,核心面积为826mm²,拥有542亿个晶体管,108组SM单元、SXM4架构,6912个CUDA核心。Tensor Core数量虽然相比Volta的640个减少到了432个,但性能却有大幅增强,支持全新的TF32运算,浮点性能为156TFLOPS,同时INT8浮点性能为624TOPS,FP16性能为312TFLOPS,常规FP32和FP64性能提升到了19.5、9.7TFLOPS。
A100核心在频率方面有所降低,仅为1410MHz,相比上一代V100的1530MHz降低了不少,毕竟核心规模实在太大了,功耗已经飙到了400W,比V100的300/350W功耗高出不少。
显存方面A100配备的也是HBM2显存,频率为2.4Gbps,位宽5120bit,相比V100有了全面提升,容量也增加到了40GB。而HBM2显存位宽和频率双双提升的结果就是,A100核心的显存带宽达到了1.6TB/s,远高于V100的900GB/s和AMD Radeon VII的1TB/s。
NVLink3.0带宽为600GB/s,相比2.0的300GB/s直接提升了一倍,以满足服务器领域多卡互联的需求。
虽然黄仁勋在演讲中并没有提及到PCIe4.0,但在官方资料中,我们却可以在安培的架构图上看到“PCIe4.0主控界面”的字样,同时在A100计算卡的规格表中也列有“PCIe4.0 64GB/s”。至于未来的RTX 30系列游戏卡是否也支持PCIe4.0,目前还没有确切消息,但从最近NVIDIA和AMD的“亲密”互动中,不难猜想RTX 30系列游戏显卡也将会全面支持PCIe4.0。至于事实如何,不妨让我们等到今年9月份新一代游戏显卡发布后再见分晓。