老黃放大招！DLSS 5、新龍蝦發佈，一文彙總！

今天凌晨，老黃召開了一年一度的英偉達GTC技術大會，按照往年慣例一般是間隔兩年會同時發佈新架構和新顯卡，中間一年會發布Super/Ti系列以及甜品卡，40系是GTC 2022大會發布的，50系延期半年在CES 2025消費電子展發佈的，今年按照慣例本來會發布Super系列，但是因爲產能原因在今年Q3前不會發布，甚至是無限期推遲或者取消。

今天老黃一上來還是彌補遊戲玩家，發佈了最新的DLSS 5（P1和P2），即將在秋季推出，發佈會上顯示支持《星空》《生化危機9》和《霍格沃茨之遺》等多款遊戲，老黃將這代DLSS5比喻成圖形學的GPT時刻，遊戲會通過實時的神經網絡渲染，再加上幀生成技術，達到好萊塢電影級的可交互畫面！

接下來是英偉達的雲服務戰略，與全球三大公有云巨頭谷歌雲、AWS和Azure合作（P3-P6），英偉達提供最新的GPU和網絡設備、機架系統，不過老黃與三家合作各有側重，像谷歌偏重數據科學和開源生態比如JAX，與AWS合作側重AI基建和PaaS服務，與Azure主要是企業級生產力。

然後是英偉達達鏈公司（P7-P9），數據庫巨頭甲骨文是與英偉達綁定最深的大廠，主要是OCI雲服務，CoreWe**e上一篇文章講過他是老黃親兒子中的親兒子，目前是GPU專有云計算的新勢力巨頭，Palantir和Dell兩家一軟一硬，都是toB和toG端業務。

隨後爲英偉達接管九大垂直行業（P10），感覺老黃很喜歡Palantir這種打包一體式的方案，大會上重點講了AI提高金融服務、零售、電信、醫療、量子計算、汽車、工業、機器人這些行業，等到今天晚上我再用詳細文章來聊。

P11-P13是老黃介紹全新的推理時代和AI Natives概念，英偉達提供軟硬一體的服務，P12老黃列舉了GPT、o1和CC三個代表性的模型，老黃一方面給所有人提供硬件算力，另一方面想繞開谷歌、微軟和亞馬遜這些大廠的雲服務，直接讓親兒子CoreWe**e對接專有云服務，這個想象力確實很大（歐洲那邊也有個新的親兒子Nebius）。

P14是老黃引用的SemiAnalysis的跑分，英偉達全新的推理之王GB300 NVL72，以前老黃是賣A100、H100這種計算卡，現在是直接賣完整的機架系統，把72顆GPU組成一個超級GPU機架，裏面的芯片、內存、網絡交換機、液冷系統都是英偉達定製的，GB300 NVL72 能耗產生的Token數量是上一代H200 NVL8架構的50倍，成本降低35倍，邏輯是電力轉化爲Token的效率（這裏還有個小彩蛋，就是右下角有行極小的灰字DeepSeek R1 052B - FP4 - 1K/1K）。

P15是老黃的Vera Rubin新架構，60系顯卡應該是這個架構的消費級顯卡，這也是英偉達歷史上首次只發新架構，而不發佈新的消費級顯卡，老黃也玩起了小字黃氏對比法，介紹Rubin架構10年算力增長了4000萬倍，這個估計是對比以前的Pascal架構，其實十年前Pascal架構也非常強了，當年的10系消費級顯卡可能是歷史上性能提升最大的一代,1080對比980性能翻倍，1066性能可以打上代旗艦。

P16是機架內部結構，中間是8GPU的互聯基板陣列，右側托盤上半部分是佈滿管線的銅製散熱板，液冷這一塊主要是Vertiv供應，詳情可以看我上一篇文章，今天晚些我也會具體介紹這部分內容；P17左側中間的兩個銀色大方塊應該是Rubin GPU+Grace CPU的組合，右側是老黃用自家NVLink集成的背板，上面可以插滿整機櫃72顆GPU。

P18是幾家大模型的成本收入對比，裏面兩家都是國產大模型，一個是開源社區比較火的Qwen3，另一個是Kimi K2.5，最高階的是GPT的MoE專家推理大模型，每月收費45塊，可以面向不同級別的客戶，老黃也聊了爲啥現在遊戲顯卡和AI顯卡分家，Rubin架構的目標就是去跑那些參數量高達兩萬億的恐怖模型，追求的是極限，而消費級顯卡很難把功耗拉到這麼滿。

P19是老黃新收購的Groq3和自家的Rubin GPU，目前Rubin是288GB的HBM4內存、50 PFLOPs (FP4) 算力，Groq3偏向推理，SRAM只有500MB，但是帶寬達到了逆天的150TB/s。

最後壓軸的P20是英偉達的新龍蝦，Agent會接管操作系統，同時連接了英偉達的cuDF接口調用數據，LLM作爲大腦向下分發任務給子智能體，或者是調用cuOPT去做複雜的運籌優化計算，可能以後面向企業級用戶會更多一些。