其次,“Anaconda”主机的目标是达到12 teraflops(每秒12万亿次浮点运算)的性能。而普通版主机“Lockhart”的目标是达到4 teraflops(每秒4万亿次浮点运算)。这两款主机都有8个CPU核心,CPU主频计划设定在3.5 GHz。当然了“Anaconda”主机的CPU主频肯定要比“Lockhart”高一点。
以上的参数非常重要,尽管外媒并没有透露“Anaconda”主机的“12万亿次浮点运算”到底是双精度浮点单元还是单精度浮点单元,但无论是双精度浮点单元还是单精度浮点单元,“12万亿次浮点运算”这个数字都是很恐怖的。
让我们来做一个假设,先保守一点,如果12 teraflops是指单精度浮点单元,这意味着什么呢?
我们知道,英伟达的RTX系列显卡采用了图灵架构,帕斯卡架构每个SM阵列集成128个FP32浮点单元,图灵架构则改成了2个FP64双精度浮点单元、64个FP32单精度浮点单元、64个INT32整数单元、8个Tensor核心、一个RT核心。支持浮点和整数并发操作,并有新的执行数据路径,类似伏特架构汇总的独立线程调度。
整体而言,图灵核心的CUDA阵列可以每秒执行14万亿次FP32浮点操作、14万亿次INT32整数操作。