GPT-5.5來了，真能幹但也學會偷懶了

今天凌晨，OpenAI 正式推出 GPT-5.5。

這次更新被官方稱爲面向真實工作和Agent的新智能級別，是繼 GPT-5.4 之後，又一次不小的躍升。（劇透：然後被DeepSeek狙擊了）

官方Blog開篇就點明，這次升級不只是聊天問問題更直觀，更多是讓GPT真正成爲能接手複雜任務、自主規劃執行的Agent底座。

用戶扔給它一個模糊目標，它能自己拆解步驟、調用工具、自我檢查，直到把活幹完。

能力上最明顯的變化是Agentic部分。

在面對複雜多步驟工作流、在線研究、數據分析、生成文檔表格、操作軟件這些以前需要用戶反覆引導的任務，現在模型自己就能往前推。

顯然，5.5 這次能力上的進步是較爲可觀的。

編碼調試能力尤其強，跟 5.4 相比，在相同 Codex 任務的情況下， 5.5 消耗的token明顯更少，在保證速度的同時，但輸出質量更高。

上下文的處理也更加平穩，能扛住亂七八糟的多部分需求。

目前，OpenAI 已經向 Plus、Pro、Business、Enterprise用戶開放了 5.5 的訪問全系，GPT-5.5 Pro只給Pro以上訂閱，同事的 Codex 也同步更新了 5.5 。

以上這些宣傳把重點全放在“真實工作”和“Agent”上。

以前模型更像高級聊天工具，現在明顯往能獨立幹活的方向走了，開發者圈反饋編碼和多步任務確實順暢很多，token省下來後跑長任務也更划算。

GPT-5.5 也不是完美的，吐槽的聲音也有。

有網友在X上直接指出，GPT-5.5遇到複雜佈局時有時會直接生成一張圖片了事，不再像之前那樣一步步碼出來。處理圖標需求時，它會從頭硬寫SVG，而不是調用現成庫，在執行過程中還頻繁暫停追問用戶，執行力反而不如從前果斷。

（這裏有張動圖，黑盒死活傳不上來）

這些問題放在Agent場景就有大問題了。

用戶讓它獨立跑完一個項目，結果它半路停下來問“你要不要這樣改”，或者直接甩給你偷偷敷衍過去，這顯然是不妥的。

從去年的 GPT-5發佈，再到今天的 GPT-5.5，OpenAI 一路走來，可以看到其在模解決問題的能力上，花了不少心思。

當然，現在 Coding 能力不錯（特別是前段時間，Claude降智抽風還變貴，CodeX只是一味地重置額度），Agent能力起來了，效率也上去了，這屬實是不錯的進步。

不過，執行力上偶爾露出的小毛病，也告訴我們現在的 5.5 並非完美，仍有進步的空間。

說起 OpenAI 這半年多的時間也是夠命運多舛，自去年Sora2推出讓大家驚豔了一下之後便問題不斷......圖片生成被谷歌香蕉系列壓着打，本來看着還算不錯的 Sora2 又被字節 Seedance2.0 直接完爆。。甚至在傳統大模型方面，也被 Claude 和其他家先進版本模型壓一頭。

甚至本月初 OpenAI 還傳出內部面臨換帥消息，山姆奧特曼的位置似乎都變得都岌岌可危了起來。

結果短短一兩週，OpenAI 直接連發 GPT Image V2 和 GPT-5.5，節奏一下子找回來了，真是攻守之勢異也。

Tips：就在撰寫本文的時候，DeepSeek V4 系列也發佈了，精準狙擊忙完這一切準備喘口氣的奧特曼和他的 OpenAI，這下有好戲看了，有一種回到了25年初的感覺。

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com

相關資訊 更多