沒人味的 GPT-5 更新了,但變尬了。

被吐槽了這麼久沒人味的 GPT-5, 終於進化了。

看得出來,OpenAI 是真有點沒招了。畢竟,GPT-5 上線後本該功成身退的 4o,就因爲太受歡迎,被生拉硬拽着不許退役。新產品口碑不如舊產品,換誰都得急着證明自己。

那被培養成替身的 5.1,能取代大夥兒心目中的賽博白月光嗎?看完了官網案例,世超立刻上手試了試。

事先說明,下面所有的測試都在臨時聊天環境進行,沒有任何 AI 受到記憶干擾。

咱先測了一下奧特曼 “ 尤其喜歡 ” 的指令遵循,第一個問題就把它考蒙了。

行吧,世超只能懷疑自己,開始反思是不是因爲沒用英文。

結果用官方一毛一樣的英語提示詞,5.1 還是答錯了。

不死心的世超又換了一個問題,讓它寫一段 200 字的薯條頌,但全文不能出現 “ 的 ” 字。

本來以爲是網不好引起的波動,但試了五遍全是繁體。去掉後半段強制性指令,回答又正常了。

再看看 Gemini 2.5 pro,輕輕鬆鬆一口氣給出正確答案,啥岔子都沒出。

而接下來是大夥兒吐槽得最多的,GPT-5 莫得感情。官方表示,這回 5.1 在 5 的基礎上變得 “ 更溫暖、更有對話性 ” 了,又能有意思,又能保持回答清晰有用。

說實話,從官網給出的案例來看,這個效果也只能說一般般。4o 本來就有的能力,被 5 整沒了,現在又靠 5.1 回到起跑線,屬實誇不出口啊。

但該測還得測,世超問了一個經典失戀問題,結果沒有對比就沒有傷害,不管是 5.1 還是 5,都和 4o 不在一個 level。。。

上 GPT-5.1,中 GPT-5,下 GPT-4o

不知道大夥兒有沒有感覺,5 和 5.1 像是在描述對人類情感的刻板印象,作爲旁觀者分析 “ 失戀 ” 是一種什麼感覺,爲什麼難過,怎麼解決。

爲了不冤枉它,世超換了個問題再問問,這次感覺新版回答得還不如老版,連基本的感情牌都不打了。。。

上 5,下 5.1

自適應,我願稱之爲 5.1 更新最大的亮點,畢竟前兩個都拉完了。

這優化簡單來說,就是以前的 AI,在不同難度題目上不會自己分配思考時長,問個杭州美食都有啥,花的力氣可能和宇宙爲什麼大爆炸一樣。

世超試了試,它的效果還挺明顯的。在簡單的邏輯問題上,左邊 5.1 Thinking 的思考速度明顯比右邊 5 Thinking 要快得多。

而到了複雜的編程難題,反而是 5 Thinking 更快給出了錯誤結果,5.1 思考了更長的時間給出了正確答案。

除了上面這些屬於 5.1 的版本變動,ChatGPT 還有個整體大更 —— 在個性化裏面可以設置 GPT 的回答風格,除了默認一共七種人設可選。

這個功能還挺有意思,同一個問題,不一樣的人設能給出不同的回答,人設之間風格差異很大。

比如,吐槽達人說話更衝更直接,技術宅有探知慾,天馬行空喜歡藝術化的表達,專業可靠是純純工具人等等。

上吐槽達人,中技術宅,下默認模式

尤其是吐槽達人,基本上啥都跟你槓着來,反而有了大部分 AI 沒有的思辨能力。面對不給錢又讓它賣力幹活的話術一點不領情,知道世超在這 PUA 它呢。

有一說一,要是說話方式能不這麼尬,感覺這模式的潛力可比默認模式大多了。

總的來說,雖然這次更新小有亮點,但 OpenAI 帶來的驚喜越來越少了。

根據 10 月的一篇報告,GPT 在 2025 已經快走了一年的下坡路,市場份額一直在萎縮。雖然搶佔先機保住了龍頭地位,但 AI 界的競爭依然在殘酷進行中。

Similarweb 10 月的統計數據

像是世超以前用得最多就是 GPT,最近也開始頻繁使用其他家的產品了,競品們的市佔率增長可比想象中快得多,順利得多。

一邊是奧特曼還在到處拉小手招投資,一邊是產品在覈心質量上有點泯然衆人。

撰文:莫莫莫甜甜

編輯:江江 & 面線

美編:萱萱

圖片、資料來源:

莫莫實測

OpenAI 官網

Similarweb

小紅書、X

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com