老黄放大招！DLSS 5、新龙虾发布，一文汇总！

今天凌晨，老黄召开了一年一度的英伟达GTC技术大会，按照往年惯例一般是间隔两年会同时发布新架构和新显卡，中间一年会发布Super/Ti系列以及甜品卡，40系是GTC 2022大会发布的，50系延期半年在CES 2025消费电子展发布的，今年按照惯例本来会发布Super系列，但是因为产能原因在今年Q3前不会发布，甚至是无限期推迟或者取消。

今天老黄一上来还是弥补游戏玩家，发布了最新的DLSS 5（P1和P2），即将在秋季推出，发布会上显示支持《星空》《生化危机9》和《霍格沃茨之遗》等多款游戏，老黄将这代DLSS5比喻成图形学的GPT时刻，游戏会通过实时的神经网络渲染，再加上帧生成技术，达到好莱坞电影级的可交互画面！

接下来是英伟达的云服务战略，与全球三大公有云巨头谷歌云、AWS和Azure合作（P3-P6），英伟达提供最新的GPU和网络设备、机架系统，不过老黄与三家合作各有侧重，像谷歌偏重数据科学和开源生态比如JAX，与AWS合作侧重AI基建和PaaS服务，与Azure主要是企业级生产力。

然后是英伟达达链公司（P7-P9），数据库巨头甲骨文是与英伟达绑定最深的大厂，主要是OCI云服务，CoreWe**e上一篇文章讲过他是老黄亲儿子中的亲儿子，目前是GPU专有云计算的新势力巨头，Palantir和Dell两家一软一硬，都是toB和toG端业务。

随后为英伟达接管九大垂直行业（P10），感觉老黄很喜欢Palantir这种打包一体式的方案，大会上重点讲了AI提高金融服务、零售、电信、医疗、量子计算、汽车、工业、机器人这些行业，等到今天晚上我再用详细文章来聊。

P11-P13是老黄介绍全新的推理时代和AI Natives概念，英伟达提供软硬一体的服务，P12老黄列举了GPT、o1和CC三个代表性的模型，老黄一方面给所有人提供硬件算力，另一方面想绕开谷歌、微软和亚马逊这些大厂的云服务，直接让亲儿子CoreWe**e对接专有云服务，这个想象力确实很大（欧洲那边也有个新的亲儿子Nebius）。

P14是老黄引用的SemiAnalysis的跑分，英伟达全新的推理之王GB300 NVL72，以前老黄是卖A100、H100这种计算卡，现在是直接卖完整的机架系统，把72颗GPU组成一个超级GPU机架，里面的芯片、内存、网络交换机、液冷系统都是英伟达定制的，GB300 NVL72 能耗产生的Token数量是上一代H200 NVL8架构的50倍，成本降低35倍，逻辑是电力转化为Token的效率（这里还有个小彩蛋，就是右下角有行极小的灰字DeepSeek R1 052B - FP4 - 1K/1K）。

P15是老黄的Vera Rubin新架构，60系显卡应该是这个架构的消费级显卡，这也是英伟达历史上首次只发新架构，而不发布新的消费级显卡，老黄也玩起了小字黄氏对比法，介绍Rubin架构10年算力增长了4000万倍，这个估计是对比以前的Pascal架构，其实十年前Pascal架构也非常强了，当年的10系消费级显卡可能是历史上性能提升最大的一代,1080对比980性能翻倍，1066性能可以打上代旗舰。

P16是机架内部结构，中间是8GPU的互联基板阵列，右侧托盘上半部分是布满管线的铜制散热板，液冷这一块主要是Vertiv供应，详情可以看我上一篇文章，今天晚些我也会具体介绍这部分内容；P17左侧中间的两个银色大方块应该是Rubin GPU+Grace CPU的组合，右侧是老黄用自家NVLink集成的背板，上面可以插满整机柜72颗GPU。

P18是几家大模型的成本收入对比，里面两家都是国产大模型，一个是开源社区比较火的Qwen3，另一个是Kimi K2.5，最高阶的是GPT的MoE专家推理大模型，每月收费45块，可以面向不同级别的客户，老黄也聊了为啥现在游戏显卡和AI显卡分家，Rubin架构的目标就是去跑那些参数量高达两万亿的恐怖模型，追求的是极限，而消费级显卡很难把功耗拉到这么满。

P19是老黄新收购的Groq3和自家的Rubin GPU，目前Rubin是288GB的HBM4内存、50 PFLOPs (FP4) 算力，Groq3偏向推理，SRAM只有500MB，但是带宽达到了逆天的150TB/s。

最后压轴的P20是英伟达的新龙虾，Agent会接管操作系统，同时连接了英伟达的cuDF接口调用数据，LLM作为大脑向下分发任务给子智能体，或者是调用cuOPT去做复杂的运筹优化计算，可能以后面向企业级用户会更多一些。