AI進化成人的速度，可能比你想象的還慢。。。

吹了這麼久AI，到底嘛時候才能超越人類啊？

其實，圈內人對 AI 都有一個終極期望，就是實現 AGI （通用人工智能），說白了，就是造出“和人一樣聰明的AI”。

咱去馬斯克的社交平臺上逛一圈，會發現他三句不離AGI。。

OpenAI的奧特曼也在瘋狂預言，AGI即將到來，也就這三五年的事兒了。

但這玩意，到底咋衡量呢？俗話說得好，人和人的區別，比人和豬的區別還大。。到底啥水平，才能和人一樣聰明啊？

就連天天爲了AGI吵架的大佬們，也根本說不出來，AGI到底是個啥。。

合着都在這虛空對線是吧。

所以最近，一幫頂尖大佬看不下去了，幾十號人聯手發了篇論文，作者還是全明星陣容，包括圖靈獎得主、谷歌前 CEO 等等，他們聯合起來，給出了目前爲止第一個 AGI 的量化定義。

他們也順便用GPT模型做了個測試，結果顯示，如果AGI是100分，GPT-5只有58分，不及格的水平。

這幫大佬的核心觀點是：AGI，就是一種能達到“一個受過良好教育的成年人”的能力的人工智能。

他們把心理學中一個最權威的理論，CHC 理論，給AI搬過來了。

CHC 的觀點，簡單來說，就是智力這玩意，不是一個單一的標準能衡量的東西，需要多維度考察。

說白了，這就和高考差不多。一門課強根本不夠，你得門門都強，才證明你厲害。

所以，他們把 AI 的能力分成了 10 個核心能力，每個佔了 10% 的分。它們分別是：

(K) 通識知識、(RW) 讀寫能力、(M) 數學能力、(R) 即時推理、(WM) 工作記憶、(V) 視覺處理、(A) 聽覺處理、(S) 反應速度、(MS) 長期記憶存儲、 (MR) 長期記憶檢索。

這裏面比較抽象的，可能就是工作記憶和長期記憶了。

工作記憶，其實就是短期記憶，就是說我剛剛提過的東西，你現在還能記得起來；而長期記憶就是，AI通過跟我的對話，永久性學到了新東西，就像你上過學，即使你畢業了，“奇變偶不變”還刻在你DNA裏一樣。。

每一種能力，他們都會叫AI測試，也就是寫他們精心準備的測試題。比如(R) 即時推理這一塊，他們就專門找了些略微燒腦的問題，比如：

“David認識張先生的朋友Jack，Jack認識David的朋友林女士。認識Jack的人都有碩士學位，認識林女士的人都是上海人。所以誰既是上海人又有碩士學位？”（測試你是不是AI的時候到了）

他們找了OpenAI的兩員大將，GPT-4（2023）和 GPT-5（2025）來考試。結果，GPT-4 總分 27。 GPT-5 總分 58，合計也沒達到100分。

而且，咱來看看這成績單，有拉滿的，也有拉褲兜的，純純嚴重偏科。

比如 GPT-5，在通識(K)、讀寫(RW)、數學(M)這幾項上，直奔 9 分 10 分。所以說目前來看，這幾項是AI的強項。

而 (MS) 長期記憶存儲這項，GPT-5純純大光頭，3-4分的也有一堆。而GPT-4更不用說，好幾項都是0分。

這一項其實考的是， AI 能不能持續學習獲得信息。因爲論文發現，現在的 AI 根本就是個健忘症，你今天教它的東西，明天它就忘得一乾二淨。

他們做測試的方法，就是第一天跟AI講一些東西，然後第二天單開一個對話，再讓AI回想。

都不用猜，包想不起來的，大夥用過都知道，新開窗口就會清空記憶，那得分不是0就怪了。。

有的人會反駁，現在的AI早就有永久記憶了。但文章中其實譴責了這一點，現在AI的記憶，根本不是真正的記憶，他們只是在假裝自己有記憶。

作者們把這招叫做 “能力扭曲” ，即利用某些領域的優勢來彌補其他領域的嚴重弱點，創造出一種“AI真有能力”的錯覺。像現在的AI記憶，其實就是在瘋狂捲上下文長度，或者通過知識庫來實現，實際上就是外掛，模型本身是一點記憶都沒有。

除了記憶力，長期記憶檢索ai們也很拉，說白了，就是檢測幻覺，別睜眼說瞎話。

當然，還有一項大夥都很拉的功能，(V) 視覺處理。 GPT-4是0分，而GPT-5進化過後，也只來到4分。

它考的不是簡單的“這圖裏有啥”，考的是視覺推理。這對大模型來說，可就難多了。比如說，咱來試一道：

“下面這 4 個 2D 展開圖裏，哪一個不能折成左邊那個立方體？”

還真有點難度，但我們人類稍加思索，還是能做出來的。我也去求證了下Gemini，結果確實是無法戰勝。

這也說明，AI的眼睛和腦子，目前配合的不是很好，還沒有人類這種，邊看邊想就解決問題的能力。

當然，這份報告，肯定還是不夠完美的。除了這十個維度，人腦還有聯想等其他難以名狀的能力，人類可太複雜了，不是幾道題就能測明白的。

但它最大的價值，是給當下的 AI 做了一次全面診斷：AI現在還是瘸腿，在一些人類最基本的認知能力上，仍然有嚴重的缺陷。

而且，現在的 AI 廠商會還用一些捷徑，來掩蓋這些弱點。

因此，這篇文章也在給大家敲警鐘：這樣搞出來的 AI，是到不了 AGI 的。

但奧特曼在前一陣的直播裏還說了，AGI在路上了，我只能說，走着瞧了。

當然，俺覺得，這套標準本身也有不小的槽點。

人家AGI ，憑啥非要模仿人類啊？它很可能是一種完全不同的智能。硬拿人類的 CHC 理論去套 AGI，是否有點刻舟求劍的意味了。

而且，這標準定得也有點高了。講實話，AI 要能達到一個“沒受過教育的小孩”的水平，就已經無敵了。更別提有相當一部分人類，自己都通不過這個測試。。

不過，不管怎麼吐槽，有人提出標準就是好事。

它最大的意義，是終於把 AGI 這個話題從玄學的範疇，拉回到了一個可以討論的具體問題上。

就算這個標準不完美，它也會逼着整個行業開始思考，我們到底在追求什麼，以及我們到底缺了什麼。

這總比大家都在吹牛，說自己快要實現 AGI要強得多。

撰文

：不咕

編輯

：江江&面線

美編

：萱萱

圖片、資料來源

：

A Definition of AGI, Arxiv

OpenAI, X，部分圖源互聯網

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com

AI進化成人的速度，可能比你想象的還慢。。。

相關資訊更多

C盤拯救計劃，簡單瞭解系統盤裏裝了哪些文件並清理無用文件。

「深夜好物推薦」充電頭也開始「賣萌」了？酷態科6號充電頭

索尼CEO表示拒絕補貼硬件，PS6定價可能將突破1000美元？

【出差黨】重度筆記本用戶必讀：Type-C擴展塢選購指南

【小米 17系列最新總銷量曝光：全系近545萬，Ultra約22.85萬】

蘋果MacBook漲瘋了，像我們這種真要換機的人怎麼辦？

DeepSeek V4 正式版 7 月中旬上線同步引入 API 峯谷定價

【DeepSeek V4 正式版官宣7月中旬上線，高峯時段API價格將翻倍】

卓威真進步了，目前卓威最現代化的鼠標之一——卓威ZA12DW

9950X3D+5080夜神+ROG 幻世神裝機分享！

熱點資訊

【7.1】夏促還沒選好遊戲？一網打盡200+款夏促史低佳作！

Epic發行商喜加一，限時7天免費領取原價3的遊戲

Epic總裁稱:Steam沒有“原神”等熱門遊戲，錯失了PC端百萬玩家！

不止《以撒的結合》，夏促肉鴿神作推薦合集

Steam【烏克蘭】區夏促【第三期】遊戲清單，最高省96元！

2026全面戰場國際邀請賽總冠軍LT戰隊全套改槍碼分享

热门游戏

艾爾登法環

塞爾達傳說：曠野之息

原神

我的世界

荒野大鏢客：救贖2

寶可夢傳說阿爾宙斯

泰拉瑞亞

巫師3：狂獵

星露穀物語

空洞騎士

Nintendo Switch

塞爾達傳說：王國之淚

寶可夢朱

饑荒

超級馬力歐：奧德賽

光遇

賽博朋克2077

永劫無間

Apex 英雄

雙人成行

AI進化成人的速度，可能比你想象的還慢。。。

相關資訊 更多

熱點資訊

热门游戏

相關資訊更多