GPT-5.5来了，真能干但也学会偷懒了

今天凌晨，OpenAI 正式推出 GPT-5.5。

这次更新被官方称为面向真实工作和Agent的新智能级别，是继 GPT-5.4 之后，又一次不小的跃升。（剧透：然后被DeepSeek狙击了）

官方Blog开篇就点明，这次升级不只是聊天问问题更直观，更多是让GPT真正成为能接手复杂任务、自主规划执行的Agent底座。

用户扔给它一个模糊目标，它能自己拆解步骤、调用工具、自我检查，直到把活干完。

能力上最明显的变化是Agentic部分。

在面对复杂多步骤工作流、在线研究、数据分析、生成文档表格、操作软件这些以前需要用户反复引导的任务，现在模型自己就能往前推。

显然，5.5 这次能力上的进步是较为可观的。

编码调试能力尤其强，跟 5.4 相比，在相同 Codex 任务的情况下， 5.5 消耗的token明显更少，在保证速度的同时，但输出质量更高。

上下文的处理也更加平稳，能扛住乱七八糟的多部分需求。

目前，OpenAI 已经向 Plus、Pro、Business、Enterprise用户开放了 5.5 的访问全系，GPT-5.5 Pro只给Pro以上订阅，同事的 Codex 也同步更新了 5.5 。

以上这些宣传把重点全放在“真实工作”和“Agent”上。

以前模型更像高级聊天工具，现在明显往能独立干活的方向走了，开发者圈反馈编码和多步任务确实顺畅很多，token省下来后跑长任务也更划算。

GPT-5.5 也不是完美的，吐槽的声音也有。

有网友在X上直接指出，GPT-5.5遇到复杂布局时有时会直接生成一张图片了事，不再像之前那样一步步码出来。处理图标需求时，它会从头硬写SVG，而不是调用现成库，在执行过程中还频繁暂停追问用户，执行力反而不如从前果断。

（这里有张动图，黑盒死活传不上来）

这些问题放在Agent场景就有大问题了。

用户让它独立跑完一个项目，结果它半路停下来问“你要不要这样改”，或者直接甩给你偷偷敷衍过去，这显然是不妥的。

从去年的 GPT-5发布，再到今天的 GPT-5.5，OpenAI 一路走来，可以看到其在模解决问题的能力上，花了不少心思。

当然，现在 Coding 能力不错（特别是前段时间，Claude降智抽风还变贵，CodeX只是一味地重置额度），Agent能力起来了，效率也上去了，这属实是不错的进步。

不过，执行力上偶尔露出的小毛病，也告诉我们现在的 5.5 并非完美，仍有进步的空间。

说起 OpenAI 这半年多的时间也是够命运多舛，自去年Sora2推出让大家惊艳了一下之后便问题不断......图片生成被谷歌香蕉系列压着打，本来看着还算不错的 Sora2 又被字节 Seedance2.0 直接完爆。。甚至在传统大模型方面，也被 Claude 和其他家先进版本模型压一头。

甚至本月初 OpenAI 还传出内部面临换帅消息，山姆奥特曼的位置似乎都变得都岌岌可危了起来。

结果短短一两周，OpenAI 直接连发 GPT Image V2 和 GPT-5.5，节奏一下子找回来了，真是攻守之势异也。

Tips：就在撰写本文的时候，DeepSeek V4 系列也发布了，精准狙击忙完这一切准备喘口气的奥特曼和他的 OpenAI，这下有好戏看了，有一种回到了25年初的感觉。

更多游戏资讯请关注：电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com

相关资讯 更多