Claude 新模型太離譜了:性能不輸旗艦,價格只要三分之一

各位好,我們是果核剝殼旗下的AI方向新賬號 —— 飛碟AI,初來乍到小黑盒(來摸魚,真的),還請各位多多關注我們,感激不盡!!

Anthropic(Claude AI 背後的公司) 最近是真有點活明白了


當大家還在討論 Sora、Grok、Gemini 這些花裏胡哨的視頻模型時,Anthropic 今早悄悄扔出了一顆“平價核彈”:Claude Haiku 4.5

它幾乎是 Claude Sonnet 4 的性能,價格只要三分之一,速度還翻倍。

(並且這次 Anthropic 一上來就着重強調了其“平價”和"所有人可用")

聽着是不是有點離譜?但這次數據擺在那兒,不吹。


在最新的 SWE-bench Verified 編程基準測試裏,Haiku 4.5 的準確率達到了 73.3%,略微超過中杯的 Sonnet 4(72.7%),比 OpenAI 的 GPT-5 還略高一點點,差點就打過專長代碼的 GPT-5 CodeX。

更有意思的是,在另一個測試 OSWorld(讓模型像人一樣操作電腦)裏,Haiku 4.5 居然反超了 Sonnet 4,成了最會用電腦的 AI。


你可能想問:這到底是怎麼做到的?



其實很簡單,Anthropic 把這次的 Haiku 4.5 定位成一個高智能的“輕型選手”。它是通過“蒸餾”(Distillation)技術,把 Sonnet 4 那一整套複雜的知識體系,壓縮成更小、更快的結構。



結果就是:性能幾乎沒掉,成本砍到原來的三分之一。


如果你是開發者,這次的定價會讓你心動:



每百萬輸入 Token 1 美元,輸出 5 美元。



對比一下同系列的 Sonnet 4.5(3/15 美元)和 Opus 4.1(15/75 美元),差距堪比點外賣從黑松露牛排換成香辣雞腿堡——但你喫完會發現,這雞腿堡其實也挺香。

更絕的是,Anthropic 還特意爲它設計了“多模型協同”機制:


Sonnet 4.5 當指揮官,Haiku 4.5 當執行隊。


前者負責拆任務、定策略,後者負責並行幹活。一個人思考,一羣人幹活——效率、成本、速度都上去了。


從產品線角度看,這次的 Haiku 4.5 是 Anthropic 的一個戰略信號。


它不再追着 OpenAI 的 CodeX 比有多強,而是往能跑多快、能用多久、能省多少錢上發力。



這很聰明。



因爲在 AI 工具進入生產線、客服、開發流程這些真實場景時,延遲和價格往往比天花板性能更重要。


Anthropic 甚至在官方博客裏寫得很直白:

“依賴人工智能執行實時、低延遲任務(如聊天助手、客戶服務代理或結對編程)的用戶將欣賞 Haiku 4.5 的高智能和卓越速度的結合。Claude Code 的用戶會發現 Haiku 4.5 使編碼體驗(從多代理項目到快速原型設計)的響應速度顯着提高。”

聽着像是對 OpenAI 的 GPT-5 和 Google Gemini 說的:

你們繼續打性能牌,我去收割用得起、跑得快、上線方便的市場。(來收割我這種窮哥們了)


而且這次 Haiku 4.5 在安全性上也下了功夫。

它是 Anthropic 目前安全等級最低風險的模型,被官方列爲 ASL-2(比 Sonnet 4.5 的 ASL-3 更寬鬆)。

在一堆看起來很學術的評估中,它的“未對齊行爲率”比前幾代都更低。

簡單說,就是更穩、不容易“出幺蛾子”。


這讓它在企業場景和 API 部署裏更有優勢——你可以放心地讓它當客服、寫代碼、自動回覆郵件,而不用擔心哪天它突然開始討論人生意義(如果你被這種情況折磨過的就知道有多生草,這種情況我稱之爲大模型哈氣)。

說到性能表,你可能更想看看全景對比。

從表裏可以看到,Haiku 4.5 的各項表現都非常均衡,綜合編程能力僅次於 Sonnet 4.5,但在計算機使用、視覺推理等方面反而略勝一籌。

同時它的推理類任務(GPQA、MMMLU)也在一線水平,比上一代 Haiku 3.5 提升明顯,甚至有些項目上,Haiku 4.5 已經接近 GPT-5。

Tips:當然,Anthropic 自己也說了,這些是內部數據,“請審慎參考”。

但就算打個折,這成績也足夠說明問題。


從使用層面看,Haiku 4.5 已經全線開放,面向所有人可用,定價也便宜了不少。

無論是 Claude App、Claude Code、API、Amazon Bedrock 還是 Google Vertex AI,都能直接用。


這意味着它將迅速成爲各類嵌入式AI或實時協作Agent的首選模型。


如果說 Sonnet 4.5 是 Anthropic 的旗艦,那 Haiku 4.5 就是那款“你每天真會用到”的主力機型。


這次更新其實還有個更深的信號——

Anthropic 正在用雙層模型策略打穿整個市場。


大模型負責思考,小模型負責執行。

AI 不再是一臺萬能大腦,而是一支分工明確的團隊。

這意味着:可能未來我們用的不是一個 Claude,而是一整個 Claude 小組,這纔是多代理(multi-agent)時代的雛形。


從行業角度看,Haiku 4.5 可能會逼所有廠商重新定價。

OpenAI 的 GPT-5 在“快”和“省”上被追得不遠,Google Gemini 2.5 Pro 的 67.2% SWE-bench 分數更顯尷尬。


Anthropic 用一款“小型號”打出了“旗艦級表現”,說明了一個現實:

AI 的下半場,不拼誰最聰明,而拼誰最划算。


Haiku 4.5 或許不是最耀眼的,但它可能是最接地氣的——讓 AI 從“炫技的怪物”,變成“真正能幫你幹活的員工”。

也許幾年後我們回看,會發現改變世界的,不是巨獸模型,而是這些能快速響應、能並行協作的“小AI”。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com