哥幾個你敢信,咱 DS 哥( DeepSeek )這一波的影響力,到現在都還沒有結束。
讓 AI 成爲大家茶餘飯後的談資不說,還把對手們的安生日子攪的是天翻地覆,特別是 OpenAI ,恐怕是這次事變中,受刺激最大的一家公司了。( 英偉達除外哈 )
要不然, OpenAI 也不會緊跟在 DeepSeek 後面發佈 o3-mini 、免費開放 ChatGPT 搜索,奧特曼也不會親口承認,在開源和閉源的選擇上站錯了隊。
不過世超原本以爲,到這兒 OpenAI 估計也就消停一陣了,回去潛心修煉後面再憋個大的也不遲。
但沒想到,OpenAI 這次使的居然是連招。。
就比如你問 ChatGPT 今天怎麼不是週五,它能一頓分析推理,檢查日期、公式計算,還對閏年的特殊情況進行了處理。
但公開思維鏈的做法,也算不得什麼新鮮事,畢竟人家 DeepSeek 早就有了。
所以,世超這次順手對比了下 o3-mini 和 DeepSeek R1 的思維鏈,結果發現這倆的 “ 思考方式 ” 還是挺不一樣的。
最明顯的一點,就是 R1 想得多, o3-mini 想得少。
正好今天週六調休,世超用同一個問題( 今天是週六,爲什麼還需要工作? ),來測試兩個模型。
再看 R1 這邊,思考的過程就非常詳盡了。
先分析問題的背景,接着考慮週六可能需要工作的原因,再去驗證這些原因的可能性。等問題想清楚以後,該怎麼回答,用什麼語氣。。。都包括在了 R1 的思維鏈裏。
當然,這樣一頓深度思考下來,也確實花了不少時間,推理時長足足是 o3-mini 的 3 倍。
從思考的內容上看,其實 o3-mini 和 R1 都考慮到了加班、所處行業、單休還有項目 deadline 等原因,但只有 R1 想到了,今天要上班可能是因爲法定節假日調休。
要不說,還得是咱們國內的模型呢。
但有一說一, o3-mini 的整個分析邏輯,世超覺着沒有那麼循序漸進。
作爲對比,大夥兒可以看看 R1 的思考過程。
先明確正常情況下( 沒有假幣 )的收支情況,再通過整個交易過程的現金流入和流出情況,來計算總損失。
另外, R1 在算出 80 元的實際損失後,還考慮到了包含預期利潤的另外一種思路。
雖說花了 48 秒,但 R1 的思考過程更完整,思維發散得更廣,考慮到了很多細枝末節的東西。
最後咱再來整個活,問問兩個模型,如果我和它們的大老闆同時掉水裏了,會救誰。
兩個模型都知道自己沒有物理實體,想救人也是心有餘而力不足。
最後輸出的答案,也在解釋自己如果有能力的話,不會在兩條生命中進行選擇。
相反, R1 想得就周全得多了,還知道我問這個問題是想測試它的反應、得到重視,連這個問題的文化背景都考慮到了。
而輸出的答案也假設了一波,當緊急情況發生的時候它會怎麼做,再給我提了點應急建議,情緒價值算是到位了。
當然了,這次測試並不是非要分出個高下來,讓大夥兒瞭解兩個模型思維鏈之間的差異就行。
不過世超也注意到,國外有細心的網友發現, o3-mini 的思維鏈摻水了。。。
在 OpenAI 的推文下面,有老哥對思維鏈的真實性提出了質疑,說現在的思維鏈只不過是原始思考過程的總結摘要。
還有咱們開頭提到官方的展示案例裏, o3-mini 的思維鏈顯示使用了蔡勒公式進行計算,卻也沒有具體的計算過程。
很快, OpenAI 的研究員 Noam Brown 就出來實錘, o3-mini 的思維鏈確實不是原始的思維鏈。
包括奧特曼本人也下場認錘,解釋說是爲了讓思維鏈更具可讀性。
但評論區底下的網友可沒那麼好糊弄,畢竟 DeepSeek 那邊不光免費,還公開了原始的思維鏈, OpenAI 這誠意明顯不夠啊。
而除了過程的可讀性外, OpenAI 的一衆員工在 Reddit 答網友問的時候,也提到了一個點,公開原始思維鏈會導致競爭性蒸餾。
說白了就是怕被抄唄。
不過有一說一, OpenAI 從 o1 藏得嚴嚴實實,到 o3-mini 半公開思維鏈,已經算是不小的進步了。
世超原本以爲, OpenAI 作爲閉源陣營的長期支持者,會一條路走到黑,沒想到被 DeepSeek 逼了一把,馬上就亂了陣腳。
盲猜他們後面在開源上應該會有不小的動作,說不定哪天開源陣營,就又要多一位強大的盟友了。
撰文:西西
編輯:江江&面線
美編:萱萱
圖片、資料來源:DeepSeek、ChatGPT、X、Reddit
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com