按照社交软件上的网友 Greymon55 的爆料,NVIDIA 的下一代 GPU 旗舰芯片 AD102 频率将达到 2.2 GHz,结合之前传闻该芯片的 CUDA Core 数量高达 18432,按照每个 CUDA Core 可以跑一条相当于两个浮点操作的 FMA 指令,这将意味着 AD102 的完全体单精度浮点会高达 81TFLOPS。 这是什么概念? 让我们重温一下目前 NVIDIA 的旗舰游戏 GPU GA102,GA102 的 CUDA Core 数量是 10752 个,基于该 GPU 的 RTX 3090 采用削减版的 GA102-300 版,拥有 10496 个 CUDA Core,加速模式时的频率为 1695MHz,此时的单精度浮点性能是 35.6 TFLOPS,可以预期,AD102 单凭浮点性能就可以做到 GA102 的两倍以上。 需要注意的是,单纯凭底层浮点性能是无法真正了解芯片的实际表现,例如 NVIDIA 安培架构的 CUDA Core 算法是依照浮点单元来计算的,浮点单元数量是整数单元的两倍,而在之前的图灵架构里,浮点单元数量和整数单元数量是对等的,这意味着如果游戏的整数指令较多的话,安培的每 CUDA Core 性能摊分其实是要低一些的。 这次 Greymon55 除了爆料频率外,还透露了 AD102 的内存型号依然是 GDDR6X,这就有点奇怪了,不过考虑到目前的 GPU 越来越倾向于集成更大的高速缓存来改善内存带宽的做法,GDDR6X 其实也是一个合理的选择。 让我们拭目以待吧。