還沒有來得及爲昨日 Google 的 Gemini 3 Pro 來得及好好慶祝,即將登場的是我們的新選手 GPT‑5.1‑Codex‑Max。
奧特曼昨天還在 X 上點了個贊,看上去一派同行間“良性競爭、互相祝福”的樣子。
![]()
昨天就有網友整活,把 sama 的話配了張圖。👇
![]()
結果今天,OpenAI 還真就毫無預告,把 GPT-5.1-Codex-Max 扔了出來。
Gemini 3:你個老六。
Musk and Grok 4.1:我們都沒意見。
我們說回Codex。
Codex-Max 是什麼定位?
簡單講,它不是類似於 GPT-5 到 GPT-5.1 的那種情感層面的小升級,也不是“寫代碼更厲害一點”的那種常規升級,而是往“能獨立幹長活”的方向邁了一大步。
OpenAI 自己的內部工程師每週 95% 在用 Codex,而自從用了它,工程師的 PR 數量提升了 70%。這個數字放到任何公司都是能上報 CEO 的那種。
這次 Codex-Max 的核心升級是一個叫“壓縮”(Compaction)的機制。
![]()
以前模型上下文一旦太長就會爆掉,長任務做到一半也可能會出現“跑斷氣”的情況。現在,它會自動篩掉無用歷史,只保留關鍵線索,把自己清出新的上下文空間,再繼續幹活。
你可以理解成:AI 程序員不但不忘事,還自己做會議紀要,把重點記下來,垃圾全扔掉,繼續下一輪工作。
並且,學會了 996。
內部測試中,它能連續工作超過 24 小時。重構倉庫、修失敗測試、重新跑 CI,全自己來。
![]()
性能方面,做到了壓着谷歌同檔產品一頭,100%符合昨日奧特曼真實情感。
![]()
SWE-Bench Verified 上 77.9%,比 Gemini 3 Pro 的 76.2% 稍高。
Terminal-Bench 2.0 也領先 4 個點。LiveCodeBench Pro 上兩者打成平手,但這套基準本身就被認爲很“卷”,能打平也說明實力到了。
![]()
有人可能覺得這點差距沒什麼,但軟件工程任務裏,一個點就能拉出一個段位。
而在 OpenAI 自己的工程任務裏,Codex-Max 的提升更明顯。它訓練時加入了 Windows 環境、真實 PR、代碼審查、前端 UI、問答等代理式任務,這讓它在 Codex CLI 裏表現更像一個“能溝通、能執行、能覆盤”的隊友,而不只是個生成器。
如果你之前用過 GPT-5-Codex,會發現它容易超時、容易上下文塞滿、容易把任務做到一半突然跑偏。Codex-Max 最大的提升就是穩。尤其長任務的穩。
OpenAI 給了一個比較直觀的例子:讓它從頭到尾重構整套 Codex CLI 的倉庫。
中間遇到上下文接近極限,它就會自動壓縮、篩歷史,繼續往前做。幾輪壓縮下來,任務沒斷,結果還真給跑通了。

工程師最關心的“成本”和“速度”,這次也被當成一級指標優化。
SWE-bench Verified 上,在同等推理模式下,Codex-Max 比上代少用約 30% 思考 token。這意味着做同樣一件事,它更便宜、更快、延遲更小。
OpenAI 還新增了 xhigh 推理模式,專門用於“你讓它好好想”的場景。
日常任務用 medium 就夠,xhigh 則是那種長活、複雜鏈路、跨文件重構才能觸發的。
![]()
說到長活,就不得不提安全性。
Codex 默認在沙盒裏運行,網絡訪問默認關閉,能寫的文件範圍也被限制在工作區內。
做任何可能“搞壞東西”的操作前,它都會請求批准(昨天已經看到用Gemini 3的受害者了👇)。
![]()
對於現在的 AI 編程工具來說,這些限制並不是爲了束手束腳,而是爲了防止開發者在連代碼都沒看懂時,一鍵把 AI 生成的補丁合到主分支裏。
Codex-Max 能幹得越久,越需要審查和控制。
OpenAI 這次也很直接地強調:它不是替代人工審查。
它更像是“前置審查者”,把大部分垃圾問題提前撈出來,讓真正的人只處理關鍵事項。
![]()
綜合來看,Codex-Max 的方向非常清晰:讓 AI 程序員不僅能寫代碼,還能撐住長時間迭代,把一個複雜任務從“開始”做到“結束”。
而這一點,恰好擊中了當下所有模型都想回答的那個問題——AI 能不能扛住真實工程生產力?
Gemini 3 Pro 昨天給了一個“可以的,已經很強”的回答。
OpenAI 今天的回應是:“可以,還能更強,以及我還比你厲害(小聲)。”
這兩家從昨天到今天的速度,已經很難用“你追我趕”去形容了。
真正值得討論的是:
當 AI 程序員已經可以做到 996,能跨窗口記憶、能做審查、能做重構、能自主調試,那未來的工程團隊會變成什麼樣?
是效率狂飆的黃金時代,還是協作方式的巨大重置?亦或者是一波恐怖的裁員潮?
這個問題,恐怕一時半會說不清楚。
我是 CyberImmortal,關注我們,帶你暢遊AI世界!!
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
