GPT-5.5来了,真能干但也学会偷懒了

今天凌晨,OpenAI 正式推出 GPT-5.5。

这次更新被官方称为面向真实工作和Agent的新智能级别,是继 GPT-5.4 之后,又一次不小的跃升。(剧透:然后被DeepSeek狙击了)

官方Blog开篇就点明,这次升级不只是聊天问问题更直观,更多是让GPT真正成为能接手复杂任务、自主规划执行的Agent底座。

用户扔给它一个模糊目标,它能自己拆解步骤、调用工具、自我检查,直到把活干完。

能力上最明显的变化是Agentic部分。


在面对复杂多步骤工作流、在线研究、数据分析、生成文档表格、操作软件这些以前需要用户反复引导的任务,现在模型自己就能往前推。


显然,5.5 这次能力上的进步是较为可观的。

编码调试能力尤其强,跟 5.4 相比,在相同 Codex 任务的情况下, 5.5 消耗的token明显更少,在保证速度的同时,但输出质量更高。

上下文的处理也更加平稳,能扛住乱七八糟的多部分需求。

目前,OpenAI 已经向 Plus、Pro、Business、Enterprise用户开放了 5.5 的访问全系,GPT-5.5 Pro只给Pro以上订阅,同事的 Codex 也同步更新了 5.5 。

以上这些宣传把重点全放在“真实工作”和“Agent”上。


以前模型更像高级聊天工具,现在明显往能独立干活的方向走了,开发者圈反馈编码和多步任务确实顺畅很多,token省下来后跑长任务也更划算。

GPT-5.5 也不是完美的,吐槽的声音也有。


有网友在X上直接指出,GPT-5.5遇到复杂布局时有时会直接生成一张图片了事,不再像之前那样一步步码出来。处理图标需求时,它会从头硬写SVG,而不是调用现成库,在执行过程中还频繁暂停追问用户,执行力反而不如从前果断。

(这里有张动图,黑盒死活传不上来)

这些问题放在Agent场景就有大问题了。


用户让它独立跑完一个项目,结果它半路停下来问“你要不要这样改”,或者直接甩给你偷偷敷衍过去,这显然是不妥的。


从去年的 GPT-5发布,再到今天的 GPT-5.5,OpenAI 一路走来,可以看到其在模解决问题的能力上,花了不少心思。


当然,现在 Coding 能力不错(特别是前段时间,Claude降智抽风还变贵,CodeX只是一味地重置额度),Agent能力起来了,效率也上去了,这属实是不错的进步。


不过,执行力上偶尔露出的小毛病,也告诉我们现在的 5.5 并非完美,仍有进步的空间。


说起 OpenAI 这半年多的时间也是够命运多舛,自去年Sora2推出让大家惊艳了一下之后便问题不断......图片生成被谷歌香蕉系列压着打,本来看着还算不错的 Sora2 又被字节 Seedance2.0 直接完爆。。甚至在传统大模型方面,也被 Claude 和其他家先进版本模型压一头。


甚至本月初 OpenAI 还传出内部面临换帅消息,山姆奥特曼的位置似乎都变得都岌岌可危了起来。

结果短短一两周,OpenAI 直接连发 GPT Image V2 和 GPT-5.5,节奏一下子找回来了,真是攻守之势异也。


Tips:就在撰写本文的时候,DeepSeek V4 系列也发布了,精准狙击忙完这一切准备喘口气的奥特曼和他的 OpenAI,这下有好戏看了,有一种回到了25年初的感觉。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com