4万小时“偷看”人类打游戏后，AI正在成为全网最强云玩家_电玩帮

各位早啊，我是强尼，欢迎收看最新一期威客日报！点赞充电收藏是我更新的最大动力！

引言：我们已经见识过AI下围棋、打星际争霸、写小说，但AI什么时候能自己学打游戏？

最近一篇由英伟达联合斯坦福大学、加州理工学院等机构研究人员发布的论文，把这个设想往前推了一大步。

NVIDIA已经不满足于只是卖游戏佬卡了，更是想要让AI自己学会打游戏，前不久推出了一个名为 NitroGen 的通用游戏智能体

——注意！它不是只会玩某一个游戏，而是几乎所有游戏在简单学习后都能够快速上手。

一、为什么通用的游戏智能那么难？

过去几年，游戏 AI 的发展一直面临一个困境：太专一，不通用。

比如 AlphaGo 只会下围棋，OpenAI Five 只会打 Dota 2，它们都是为单一游戏设计的。

训练这样一个 AI 需要大量时间和专门的模拟器，成本很高。

另一个方向是让 AI 通过看人玩游戏来学习，这叫行为克隆。

但问题在于：训练数据很难获取——你需要记录玩家每一刻的手柄操作，并和游戏画面一一对应。人工标注这样的数据几乎不可能大规模进行。

图片来源：CSDN

于是研究陷入了一个僵局：要么训练一个只会玩一个游戏的专家，要么因为数据不够而难以训练通才。

二、NitroGen的解法：从直播和视频里偷师

NitroGen的训练方法有点粗暴，但，很有效。

它通过观看互联网上4万小时的游戏视频，学会了玩1000多种不同的游戏。

图片来源：原文图1

NitroGe团队发现，互联网上其实早就存在大量带操作显示的游戏视频。

很多游戏主播或玩家在录制视频时，会用一种叫“输入覆盖层”的软件，在画面角落显示自己实时的按键和摇杆操作。比如你常看到直播画面一角有个半透明的手柄图，哪个键按下、摇杆往哪推，一目了然。

原文图2：输入覆盖层示例。玩家按下按键时，屏幕一角的手柄图示会高亮显示，相当于给 AI 提供了操作字幕。

NitroGen的第一个突破，就是自动从这些视频里提取玩家的操作。

他们收集了 7.1 万小时带手柄覆盖层的游戏视频，然后用计算机视觉技术定位、裁剪出手柄区域，再用一个训练好的分割模型识别摇杆位置和按键状态。最终，他们构建了一个包含4万小时视频、覆盖 1000 多款游戏的数据集。

原文图3：每场游戏的时长覆盖范围广泛，有 846 款游戏的时长数据超过 1 小时，91 款游戏超过 100 小时，15 款游戏每款的时长都超过 1000 小时。

这是目前规模最大、最多元的开源游戏操作数据集。

三、NitroGen都玩哪些游戏？

这些游戏类型分布很广：

动作角色扮演游戏（比如《黑暗之魂》《艾尔登法环》）占 34.9%
平台跳跃游戏（比如《空洞骑士》《蔚蓝》）占 18.4%
动作冒险游戏（比如《塞尔达传说》）占 9.2%
其余包括射击、体育、 Roguelike 等类型

原文图3：NitroGen 数据集中游戏类型的分布。动作RPG 占比最高，2D平台游戏次之。类型分布显示，动作角色扮演游戏占总时长的34.9%，平台游戏（18.4%）和动作冒险游戏（9.2%），其余则分布在七个类型中。

四、NitroGen的原理？

NitroGen 的模型结构并不复杂，它主要做一件事：

根据当前画面，预测接下来的一系列手柄操作。

它使用了一个基于 Transformer 的视觉-动作模型，输入是一张 256×256 的游戏截图，输出是未来 16 个时刻的手柄动作（包括按键和摇杆方向）。

这个模型不依赖语言指令，也不依赖游戏内部状态——它只看画面，然后模仿人类在类似画面下的操作。

五、它真的能玩吗？

研究人员在一个包含10款游戏、30个任务的测试集上评估了 NitroGen。

这些任务涵盖战斗、导航、解谜等多种类型。

例如在某个 3D 动作游戏中，任务可能是击败这个 Boss；在 2D 平台游戏中，任务可能是跳跃到达某个平台。

原文图4：In-game rollouts。NitroGen在各种2D和3D环境中执行任务的情况。这些任务的执行时间从几秒钟到几分钟不等。其中一些任务涉及记忆，而另一些则在程序生成的世界中进行，需要模型具备适应能力。

结果是：NitroGen 在不进行额外训练的情况下，就能在多个游戏中完成非平凡任务。

更令人印象深刻的是它的泛化能力。

如果在一个新游戏上对 NitroGen 进行少量微调（比如 30 小时数据），它的任务成功率相比“从零开始训练”的模型，平均能提升 10% ~ 52%。

原文图7：在新游戏上微调 NitroGen 能显著提升任务成功率，尤其是在战斗和导航任务上。（a）当改变数据量时，任务完成率会随着数据集大小而变化，微调平均能使任务完成率相对提高 10%。（b）在低数据量情况下（30 小时）改变任务类型时，微调能使任务完成率相对提高高达 52%。

尤其是在3D动作RPG游戏中，战斗任务的提升幅度最大，达到 52%。这说明它从其他游戏中学到的“战斗直觉”可以迁移到新游戏中。

当然，NitroGen 目前还有很多局限：

它只是一个快速反应系统，不会长期规划，也不能理解语言指令。
它主要依赖手柄操作，对键盘鼠标游戏的支持有限。
数据集中动作游戏占比高，策略类、模拟经营类游戏较少，因此在这些类型上泛化能力可能较弱。

七、省流时间

让AI打游戏只是娱乐，但这背后其实是一个更大的愿景：

训练能在未知环境中行动的通用具身智能体。

游戏是一个相对安全、可控、且复杂度极高的数字世界。如果AI能在游戏中学会适应各种场景、解决各种任务，那么未来它在现实世界（比如机器人控制、自动驾驶）中也可能具备类似的能力。

值得一提，NitroGen 团队已经开源了他们的数据集、模型和测试环境，大伙都能下载下来并安装到自己电脑上体验一下。

码字不易，求点赞！求收藏！求盒电！

关注我，一起学些没用的...

————————————————————

本期参考文献：

《NitroGen | A Foundation Model for Generalist Gaming Agents》https://nitrogen.minedojo.org/

————————————————————

更多游戏资讯请关注：电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com

相关资讯更多

29样小伙伴回购N次的宝藏好物！值得推荐！

2026-03-07 生活杂谈
慢讯：阿里通义千问Qwen核心负责人离职[cube_滑稽]

2026-03-07 生活杂谈
武器库大爆炸！美术老哥的脑洞已经关不住了 🔫🎸

2026-03-07 生活杂谈
【教程贴】快速融入新的城市之搭话篇（附万能开场白

2026-03-07 生活杂谈
兄弟们要的最实用证书（精英·顶级版·上）来了

2026-03-07 生活杂谈
一顿火锅吃出10万大奖？山西男子用113元发票“逆天改命”

2026-03-07 生活杂谈
官方举办《太平年》座谈会，点赞其引领历史正剧回归！

2026-03-07 生活杂谈
六大心理效应，你都知道吗

2026-03-07 生活杂谈
极品宅男相亲记·R（1）

2026-03-07 生活杂谈
AI周报：Qwen3.5小模型；GPT-5.4；Claude

2026-03-07 生活杂谈

热点资讯

见证历史！《杀戮尖塔2》在线破50万！大家觉得各角色强度如何？

2026-03-07
《杀戮尖塔2》新手攻略——首领篇，首领图鉴和打法思路

2026-03-07
三角洲行动：哈夫克回收平台还不会做？超详细攻略来了！

2026-03-07
开年太夸张了：蛋仔暴涨184%，三角洲日流水破纪录

2026-03-07
IGN最新评选出的18款最佳肉鸽游戏

2026-03-08
仅剩一天！多款史低+新史低游戏即将结束折扣！最低仅需2元！

2026-03-07
曝网易削减对《如龙》制作人新作《龙帮》项目投资

2026-03-07
慢讯：阿里通义千问Qwen核心负责人离职[cube_滑稽]

2026-03-07

热门游戏