GPT-5.5來了,真能幹但也學會偷懶了

今天凌晨,OpenAI 正式推出 GPT-5.5。

這次更新被官方稱爲面向真實工作和Agent的新智能級別,是繼 GPT-5.4 之後,又一次不小的躍升。(劇透:然後被DeepSeek狙擊了)

官方Blog開篇就點明,這次升級不只是聊天問問題更直觀,更多是讓GPT真正成爲能接手複雜任務、自主規劃執行的Agent底座。

用戶扔給它一個模糊目標,它能自己拆解步驟、調用工具、自我檢查,直到把活幹完。

能力上最明顯的變化是Agentic部分。


在面對複雜多步驟工作流、在線研究、數據分析、生成文檔表格、操作軟件這些以前需要用戶反覆引導的任務,現在模型自己就能往前推。


顯然,5.5 這次能力上的進步是較爲可觀的。

編碼調試能力尤其強,跟 5.4 相比,在相同 Codex 任務的情況下, 5.5 消耗的token明顯更少,在保證速度的同時,但輸出質量更高。

上下文的處理也更加平穩,能扛住亂七八糟的多部分需求。

目前,OpenAI 已經向 Plus、Pro、Business、Enterprise用戶開放了 5.5 的訪問全系,GPT-5.5 Pro只給Pro以上訂閱,同事的 Codex 也同步更新了 5.5 。

以上這些宣傳把重點全放在“真實工作”和“Agent”上。


以前模型更像高級聊天工具,現在明顯往能獨立幹活的方向走了,開發者圈反饋編碼和多步任務確實順暢很多,token省下來後跑長任務也更划算。

GPT-5.5 也不是完美的,吐槽的聲音也有。


有網友在X上直接指出,GPT-5.5遇到複雜佈局時有時會直接生成一張圖片了事,不再像之前那樣一步步碼出來。處理圖標需求時,它會從頭硬寫SVG,而不是調用現成庫,在執行過程中還頻繁暫停追問用戶,執行力反而不如從前果斷。

(這裏有張動圖,黑盒死活傳不上來)

這些問題放在Agent場景就有大問題了。


用戶讓它獨立跑完一個項目,結果它半路停下來問“你要不要這樣改”,或者直接甩給你偷偷敷衍過去,這顯然是不妥的。


從去年的 GPT-5發佈,再到今天的 GPT-5.5,OpenAI 一路走來,可以看到其在模解決問題的能力上,花了不少心思。


當然,現在 Coding 能力不錯(特別是前段時間,Claude降智抽風還變貴,CodeX只是一味地重置額度),Agent能力起來了,效率也上去了,這屬實是不錯的進步。


不過,執行力上偶爾露出的小毛病,也告訴我們現在的 5.5 並非完美,仍有進步的空間。


說起 OpenAI 這半年多的時間也是夠命運多舛,自去年Sora2推出讓大家驚豔了一下之後便問題不斷......圖片生成被谷歌香蕉系列壓着打,本來看着還算不錯的 Sora2 又被字節 Seedance2.0 直接完爆。。甚至在傳統大模型方面,也被 Claude 和其他家先進版本模型壓一頭。


甚至本月初 OpenAI 還傳出內部面臨換帥消息,山姆奧特曼的位置似乎都變得都岌岌可危了起來。

結果短短一兩週,OpenAI 直接連發 GPT Image V2 和 GPT-5.5,節奏一下子找回來了,真是攻守之勢異也。


Tips:就在撰寫本文的時候,DeepSeek V4 系列也發佈了,精準狙擊忙完這一切準備喘口氣的奧特曼和他的 OpenAI,這下有好戲看了,有一種回到了25年初的感覺。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com