今天凌晨,老黄召开了一年一度的英伟达GTC技术大会,按照往年惯例一般是间隔两年会同时发布新架构和新显卡,中间一年会发布Super/Ti系列以及甜品卡,40系是GTC 2022大会发布的,50系延期半年在CES 2025消费电子展发布的,今年按照惯例本来会发布Super系列,但是因为产能原因在今年Q3前不会发布,甚至是无限期推迟或者取消。
今天老黄一上来还是弥补游戏玩家,发布了最新的DLSS 5(P1和P2),即将在秋季推出,发布会上显示支持《星空》《生化危机9》和《霍格沃茨之遗》等多款游戏,老黄将这代DLSS5比喻成图形学的GPT时刻,游戏会通过实时的神经网络渲染,再加上帧生成技术,达到好莱坞电影级的可交互画面!
接下来是英伟达的云服务战略,与全球三大公有云巨头谷歌云、AWS和Azure合作(P3-P6),英伟达提供最新的GPU和网络设备、机架系统,不过老黄与三家合作各有侧重,像谷歌偏重数据科学和开源生态比如JAX,与AWS合作侧重AI基建和PaaS服务,与Azure主要是企业级生产力。
然后是英伟达达链公司(P7-P9),数据库巨头甲骨文是与英伟达绑定最深的大厂,主要是OCI云服务,CoreWe**e上一篇文章讲过他是老黄亲儿子中的亲儿子,目前是GPU专有云计算的新势力巨头,Palantir和Dell两家一软一硬,都是toB和toG端业务。
随后为英伟达接管九大垂直行业(P10),感觉老黄很喜欢Palantir这种打包一体式的方案,大会上重点讲了AI提高金融服务、零售、电信、医疗、量子计算、汽车、工业、机器人这些行业,等到今天晚上我再用详细文章来聊。
P11-P13是老黄介绍全新的推理时代和AI Natives概念,英伟达提供软硬一体的服务,P12老黄列举了GPT、o1和CC三个代表性的模型,老黄一方面给所有人提供硬件算力,另一方面想绕开谷歌、微软和亚马逊这些大厂的云服务,直接让亲儿子CoreWe**e对接专有云服务,这个想象力确实很大(欧洲那边也有个新的亲儿子Nebius)。
P14是老黄引用的SemiAnalysis的跑分,英伟达全新的推理之王GB300 NVL72,以前老黄是卖A100、H100这种计算卡,现在是直接卖完整的机架系统,把72颗GPU组成一个超级GPU机架,里面的芯片、内存、网络交换机、液冷系统都是英伟达定制的,GB300 NVL72 能耗产生的Token数量是上一代H200 NVL8架构的50倍,成本降低35倍,逻辑是电力转化为Token的效率(这里还有个小彩蛋,就是右下角有行极小的灰字DeepSeek R1 052B - FP4 - 1K/1K)。
P15是老黄的Vera Rubin新架构,60系显卡应该是这个架构的消费级显卡,这也是英伟达历史上首次只发新架构,而不发布新的消费级显卡,老黄也玩起了小字黄氏对比法,介绍Rubin架构10年算力增长了4000万倍,这个估计是对比以前的Pascal架构,其实十年前Pascal架构也非常强了,当年的10系消费级显卡可能是历史上性能提升最大的一代,1080对比980性能翻倍,1066性能可以打上代旗舰。
P16是机架内部结构,中间是8GPU的互联基板阵列,右侧托盘上半部分是布满管线的铜制散热板,液冷这一块主要是Vertiv供应,详情可以看我上一篇文章,今天晚些我也会具体介绍这部分内容;P17左侧中间的两个银色大方块应该是Rubin GPU+Grace CPU的组合,右侧是老黄用自家NVLink集成的背板,上面可以插满整机柜72颗GPU。
P18是几家大模型的成本收入对比,里面两家都是国产大模型,一个是开源社区比较火的Qwen3,另一个是Kimi K2.5,最高阶的是GPT的MoE专家推理大模型,每月收费45块,可以面向不同级别的客户,老黄也聊了为啥现在游戏显卡和AI显卡分家,Rubin架构的目标就是去跑那些参数量高达两万亿的恐怖模型,追求的是极限,而消费级显卡很难把功耗拉到这么满。
P19是老黄新收购的Groq3和自家的Rubin GPU,目前Rubin是288GB的HBM4内存、50 PFLOPs (FP4) 算力,Groq3偏向推理,SRAM只有500MB,但是带宽达到了逆天的150TB/s。
最后压轴的P20是英伟达的新龙虾,Agent会接管操作系统,同时连接了英伟达的cuDF接口调用数据,LLM作为大脑向下分发任务给子智能体,或者是调用cuOPT去做复杂的运筹优化计算,可能以后面向企业级用户会更多一些。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com
