售價超25萬元 NVIDIA最強顯卡H100刷新AI跑分記錄:近30倍領先

本文來源於:快科技

點擊此處查看原文>>>

快科技6月28日消息,AI火爆之後,NVIDIA的顯卡成爲香餑餑,尤其是高端的H100加速卡,售價超過25萬元依然供不應求,而它的性能也非常誇張,最新的AI測試中全面刷新記錄,基於GPT-3的大語言模型訓練任務紀錄已經被刷至11分鐘。

機器學習及人工智能領域開放產業聯盟MLCommons公佈了最新的MLPerf基準評測,其中包括8個負載測試,LLM大語言模型中就有基於GPT-3開源模型的,很考驗平臺的AI性能。

參與測試的NVIDIA平臺由896個Intel至強8462Y+處理器和3584個H100加速卡組成,是所有平臺中唯一跑完所有測試的,而且刷新了記錄。

在關鍵的基於GPT-3的大語言模型訓練任務中,H100平臺只用了10.94分鐘,可以對比的是Intel平臺,由96個至強8380處理器和96個Habana Gaudi2 AI芯片構建的系統中,完成同樣測試的時間爲311.94分鐘。

H100平臺的性能幾乎是30倍於Intel平臺,當然兩套平臺的規模相差也很大,但只用768個H100加速卡的話,訓練時間也只要45.6分鐘,依然遠超Intel平臺的AI芯片。

H100基於GH100 GPU核心,定製版臺積電4nm工藝製造,800晶體管,集成18432個CUDA核心、576個張量核心、60MB二級緩存,支持6144-bit HBM高帶寬內存,支持PCIe 5.0。

H100計算卡有SXM、PCIe 5.0兩種樣式,其中SXM版本15872個CUDA核心、528個Tensor核心,PCIe 5.0版本14952個CUDA核心、456個Tensor核心,功耗最高達700W。

性能方面,FP64/FP32 60TFlops(每秒60萬億次),FP16 2000TFlops(每秒2000萬億次),TF32 1000TFlops(每秒1000萬億次),都三倍於A100,FP8 4000TFlops(每秒4000萬億次),六倍於A100。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com