英偉達發佈最強 AI 加速卡:性能提升約5到30倍!

3 月 19 日消息,英偉達最強 AI 加速卡--Blackwell GB200,正式發佈,今年發貨!

【1】Blackwell GPU,具體配置參數,彙總如下:

◆ 製程工藝:採用第二代臺積電的 4 納米(4NP)工藝,共有 2080 億個晶體管!

◆ AI 性能:可達20 petaflops,約H100(4 petaflops)5倍!

◆ 浮點算力:Blackwell Die領先Hopper Die約25%;

——每個封裝中配兩顆Blackwell 芯片,綜合性能提升約250%。

◆ FP4 八精度浮點算力:性能領先約400%;

——受內存容量和帶寬配置影響,實際性能將進一步提高。

【2】Blackwell GB200,具體配置參數,彙總如下:

◆ 規格架構:2*B200 Blackwell GPU+Grace CPU(Arm架構)

◆ 推理大語言模型性能:相較H100提升約30 倍,成本和能耗降至約4%!❷註釋

【3】企業服務

◆ 英偉達稱,其系統可擴展至數萬 GB200 超級芯片,並通過其新型 Quantum-X800 InfiniBand(最多 144 個連接)或 Spectrum-X800 以太網(最多 64 個連接)與 800Gbps 網絡連接在一起。

◆ 英偉達表示,亞馬遜、谷歌、微軟和甲骨文都已計劃在其雲服務產品中提供 NVL72 機架。

——亞馬遜 AWS 已計劃採購由 2 萬片 GB200 芯片組建的服務器集羣,可以部署 27 萬億個參數的模型。

❶註釋:英偉達使用 10 TB / sec NVLink 5.0 連接每塊 Die,官方稱該鏈路爲 NV-HBI。Blackwell complex 的 NVLink 5.0 端口可提供 1.8 TB / 秒的帶寬,是 Hopper GPU 上 NVLink 4.0 端口速度的兩倍。

❷註釋:在此之前,訓練一個 1.8 萬億個參數的模型,需要 8000 個 Hopper GPU 和 15 兆瓦的電力。Nvidia 首席執行官表示,如今2000 個 Blackwell GPU 就能完成這項工作,耗電量僅爲 4 兆瓦。在參數爲 1,750 億的 GPT-3 LLM 基準測試中,Nvidia 稱 GB200 的性能是 H100 的 7 倍,而訓練速度是 H100 的 4 倍。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com