前天放假在家,閒來無事刷推,然後看到關注的@Designarena發了條文章:
他們剛放出了最新一版的單輪 Web Design 榜單,第一名居然是—— GLM-5.2。

也就是說,GLM-5.2 這次至少網頁設計這塊,戰勝了 Claude Fable 5、Opus 4.8還有 GPT-5.5 等一衆強力對手。
這條文章我反覆又看了好幾次,字面意思上——按之前的慣性思維,這類榜單我已經習慣看到 Anthropic 的模型在上面輪換霸榜,閉源、貴、偶爾高峯期還要擁堵,,,結果這次排第一的是個 MIT 許可的開源模型,價格跟A\一比也便宜不少。

先說下 Design Arena 是幹嘛的。
簡單講就是給一堆模型丟同樣的網頁設計需求,讓它們一次性吐出一個能用的網頁,然後讓真人投票(如果你玩過LMArena就很容易理解)。
做網頁最難點不在於寫代碼,是同時要做佈局、視覺層次、排版、交互動畫、內容結構這一堆決策,單輪不能重試——落地頁一醜,這輪基本就廢了。
過去這種活兒,閉源大廠是有統治力的,結果這次 GLM 5.2 比 Claude Fable 5 高了 15 個 Elo。

各位要知道,GLM-5.2 只有 744B 參數,並且不是多模態模型,也就是說它連視覺能力都沒有。
這就有意思了。
價格這塊也得提一嘴,Fable 5 的 API 定價是 $10/$50 per million tokens,GLM 5.2 是 $1.40/$4.40,直接便宜了七到十一倍。

除了最終的成品優秀,Design Arena 在報告裏還提到,GLM 5.2 在各種庫的調用上絲滑流暢,Tailwind 使用率高達 91%,沒出現調用了但忘了用的尷尬情況。
早期 AI 寫前端最經典的一個反模式就是紫色漸變糊一臉,這次 GLM 5.2 反而主動避開了。它傾向於生成模板化但高質量、一致性極強的設計,平均輸出質量比 Fable 5 那種更發散的寫法更討人喜歡。

當然,代價也是有的。
精美的網頁需要時間來堆砌——平均 304 秒一個,是 Fable 5 的兩倍時間。你可以理解成它願意花時間扣細節,但最佳輸出長度有個甜點區間,46K 到 57K 字符,再長就開始 diminishing returns,這點倒挺誠實。

聊到這裏我得插一句時機。
GLM 5.2 最近被國內外很多媒體、機構、衆多開發者提起,以及這次的網頁設計登頂,發生在一個非常戲劇化的背景裏。
各位都知道,本月12號,白房子以安全爲由,給 Anthropic 下了一道出口管制指令,指令範圍非常誇張,要求 Anthropic 禁止任何外國國民訪問 Fable 5 和 Mythos 5,不管這個人在大美麗還是境外,連 Anthropic 自己的外籍員工都不行。

Anthropic 想了想,最後乾脆全球下線了這兩款模型——存活四天光榮下線。
緊接着的第二天,6 月 13 號,智譜宣佈北京時間下午5:21,GLM-5.2 全面開放給所有 GLM Coding Plan 用戶,沒幾天後,再以 MIT 許可正式開源,沒有任何地理或訪問限制。
開源模型的含金量,想必我不用多說吧,今天下載下來,明天誰下指令來也撤不走的開放權重。
所以你能看到今天這次港股智譜的反應有多劇烈。
盤中最高漲了將近 48%,截至撰寫本文時,收漲約 32.8%。

總市值突破 1 萬億港幣。
這個劇本放在一年前,我是不信的。
再說一個有趣的事,由於其開源的特性,目前已經有一些美國企業都開始認真評估遷移到 GLM 5.2。我一開始也覺得有點誇張,但仔細想想邏輯是通的:
現在大家在AI上都捨得花錢,在實力面前,成本成了可討論的——可控性,開源的智譜拿來自己部署(雖然成本也不低)不會被一紙指令撤銷,基準表現在目前也是頂尖梯隊。

對一個被合規和供應鏈折騰得頭大的 CTO 來說,這種屬性幾乎是按需定製的。
寫到這裏,我不想把這這篇內容寫成“國內 AI 反超大美麗”,這種內容聽着爽但容易翻車,各位看多了也不喜歡看。但開源模型的訪問連續性、可靠性在這件事上對閉源模型的結構性優勢,是一次無比直觀的體現了。
不過,話說到這裏,各位也要清楚,GLM 5.2 不是無敵的。
Design Arena 的其他類別裏,它在 Game Dev、Data Visualization、3D 設計都排第二,UI Component 排第四。它是純文本模型,沒有視覺能力,多模態這塊也還是硬傷,生成速度也慢,304 秒一個網頁,對急性子不太友好。

更廣泛地說,在最複雜的前沿智能、長程 agent 任務、整個開發者生態的成熟度上,跟頂級閉源模型比還有差距,這點智譜自己也清楚,沒必要嘴硬。
我個人的態度是,正視差距,但別把這次登頂不當回事。
幾個月前的 SOTA,今天已經被一個任何人都能下載、微調、本地部署的開源模型追上甚至反超。這件事的速度感比登頂本身更值得停下來想一想。閉源護城河的窗口期正在被逐漸壓縮,開源的工程化能力上了一個臺階,接下來這種開源模型打閉源的情況會越來越頻繁——就像一年之前的 DeepSeek-R1 一樣。

讓我們再次讚歎智譜Z.AI團隊這次幹得漂亮,但漂亮完之後,該補的課得繼續補,該追的差距得繼續追。
樂觀和清醒不是對立的。
心懷理想,繼續前行。
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
