老黃放大招!DLSS 5、新龍蝦發佈,一文彙總!

今天凌晨,老黃召開了一年一度的英偉達GTC技術大會,按照往年慣例一般是間隔兩年會同時發佈新架構和新顯卡,中間一年會發布Super/Ti系列以及甜品卡,40系是GTC 2022大會發布的,50系延期半年在CES 2025消費電子展發佈的,今年按照慣例本來會發布Super系列,但是因爲產能原因在今年Q3前不會發布,甚至是無限期推遲或者取消。

今天老黃一上來還是彌補遊戲玩家,發佈了最新的DLSS 5(P1和P2),即將在秋季推出,發佈會上顯示支持《星空》《生化危機9》和《霍格沃茨之遺》等多款遊戲,老黃將這代DLSS5比喻成圖形學的GPT時刻,遊戲會通過實時的神經網絡渲染,再加上幀生成技術,達到好萊塢電影級的可交互畫面!

接下來是英偉達的雲服務戰略,與全球三大公有云巨頭谷歌雲、AWS和Azure合作(P3-P6),英偉達提供最新的GPU和網絡設備、機架系統,不過老黃與三家合作各有側重,像谷歌偏重數據科學和開源生態比如JAX,與AWS合作側重AI基建和PaaS服務,與Azure主要是企業級生產力。

然後是英偉達達鏈公司(P7-P9),數據庫巨頭甲骨文是與英偉達綁定最深的大廠,主要是OCI雲服務,CoreWe**e上一篇文章講過他是老黃親兒子中的親兒子,目前是GPU專有云計算的新勢力巨頭,Palantir和Dell兩家一軟一硬,都是toB和toG端業務。

隨後爲英偉達接管九大垂直行業(P10),感覺老黃很喜歡Palantir這種打包一體式的方案,大會上重點講了AI提高金融服務、零售、電信、醫療、量子計算、汽車、工業、機器人這些行業,等到今天晚上我再用詳細文章來聊。

P11-P13是老黃介紹全新的推理時代和AI Natives概念,英偉達提供軟硬一體的服務,P12老黃列舉了GPT、o1和CC三個代表性的模型,老黃一方面給所有人提供硬件算力,另一方面想繞開谷歌、微軟和亞馬遜這些大廠的雲服務,直接讓親兒子CoreWe**e對接專有云服務,這個想象力確實很大(歐洲那邊也有個新的親兒子Nebius)。

P14是老黃引用的SemiAnalysis的跑分,英偉達全新的推理之王GB300 NVL72,以前老黃是賣A100、H100這種計算卡,現在是直接賣完整的機架系統,把72顆GPU組成一個超級GPU機架,裏面的芯片、內存、網絡交換機、液冷系統都是英偉達定製的,GB300 NVL72 能耗產生的Token數量是上一代H200 NVL8架構的50倍,成本降低35倍,邏輯是電力轉化爲Token的效率(這裏還有個小彩蛋,就是右下角有行極小的灰字DeepSeek R1 052B - FP4 - 1K/1K)。

P15是老黃的Vera Rubin新架構,60系顯卡應該是這個架構的消費級顯卡,這也是英偉達歷史上首次只發新架構,而不發佈新的消費級顯卡,老黃也玩起了小字黃氏對比法,介紹Rubin架構10年算力增長了4000萬倍,這個估計是對比以前的Pascal架構,其實十年前Pascal架構也非常強了,當年的10系消費級顯卡可能是歷史上性能提升最大的一代,1080對比980性能翻倍,1066性能可以打上代旗艦。

P16是機架內部結構,中間是8GPU的互聯基板陣列,右側托盤上半部分是佈滿管線的銅製散熱板,液冷這一塊主要是Vertiv供應,詳情可以看我上一篇文章,今天晚些我也會具體介紹這部分內容;P17左側中間的兩個銀色大方塊應該是Rubin GPU+Grace CPU的組合,右側是老黃用自家NVLink集成的背板,上面可以插滿整機櫃72顆GPU。

P18是幾家大模型的成本收入對比,裏面兩家都是國產大模型,一個是開源社區比較火的Qwen3,另一個是Kimi K2.5,最高階的是GPT的MoE專家推理大模型,每月收費45塊,可以面向不同級別的客戶,老黃也聊了爲啥現在遊戲顯卡和AI顯卡分家,Rubin架構的目標就是去跑那些參數量高達兩萬億的恐怖模型,追求的是極限,而消費級顯卡很難把功耗拉到這麼滿。

P19是老黃新收購的Groq3和自家的Rubin GPU,目前Rubin是288GB的HBM4內存、50 PFLOPs (FP4) 算力,Groq3偏向推理,SRAM只有500MB,但是帶寬達到了逆天的150TB/s。

最後壓軸的P20是英偉達的新龍蝦,Agent會接管操作系統,同時連接了英偉達的cuDF接口調用數據,LLM作爲大腦向下分發任務給子智能體,或者是調用cuOPT去做複雜的運籌優化計算,可能以後面向企業級用戶會更多一些。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com