IT之家 2 月 1 日音书,现已公布 Blackwell GPU 架构白皮书,裸露了 GeForce RTX 50 系列显卡的广泛时刻细节,其中特地值得贵重的极少是 Blackwell 架构的一起单精度 CUDA 中枢同期复旧 FP32 / INT32 数据开yun体育网,这点上牵挂了九年前的 Pascal 架构。

▲Blackwell 架构 SM 算计打算

▲Pascal 架构 SM 算计打算
英伟达在 GeForce 10 \"Pascal\" 世代仍聘用单精度 CUDA 单位兼顾 FP32 / INT32 的算计打算,而在 Volta 和 Turing 两代上换用了两组 1:1 比例的 CUDA 中枢分辨承担 INT32 和 FP32 的决策。

▲ Volta(左)、Turing(右)两代架构 SM 算计打算
来到 Ampere 架构,英伟达则为每个 SM 流式科罚器的四个科罚块(IT之家注:Processing Block)之一提供了 1 组 16 个 FP32 / INT32 单位和 1 组 16 个纯 FP32 单位;而在 Ada GPU 上,这一算计打算获得持续。

▲ Ampere(左)、Ada(右)两代架构 SM 算计打算
Blackwell 架构上的斡旋 CUDA 使得每 SM 可能的 INT32 整数运算智力较 Ada 翻倍。不外在职何给定的时钟周期内,Blackwell 斡旋内核只不错 FP32 或 INT32 步地中的一种起初。
英伟达提到,Ada 架构 SM 是为圭臬着色器算计打算和优化的,而 Blackwell SM 则是为神经着色器算计打算和优化的。