各位好,我們是果核剝殼旗下的AI方向新賬號 —— 飛碟AI,初來乍到小黑盒(來摸魚,真的),還請各位多多關注我們,感激不盡!!
Anthropic(Claude AI 背後的公司) 最近是真有點活明白了。
當大家還在討論 Sora、Grok、Gemini 這些花裏胡哨的視頻模型時,Anthropic 今早悄悄扔出了一顆“平價核彈”:Claude Haiku 4.5。
它幾乎是 Claude Sonnet 4 的性能,價格只要三分之一,速度還翻倍。
(並且這次 Anthropic 一上來就着重強調了其“平價”和"所有人可用")
聽着是不是有點離譜?但這次數據擺在那兒,不吹。
在最新的 SWE-bench Verified 編程基準測試裏,Haiku 4.5 的準確率達到了 73.3%,略微超過中杯的 Sonnet 4(72.7%),比 OpenAI 的 GPT-5 還略高一點點,差點就打過專長代碼的 GPT-5 CodeX。
更有意思的是,在另一個測試 OSWorld(讓模型像人一樣操作電腦)裏,Haiku 4.5 居然反超了 Sonnet 4,成了最會用電腦的 AI。
你可能想問:這到底是怎麼做到的?
其實很簡單,Anthropic 把這次的 Haiku 4.5 定位成一個高智能的“輕型選手”。它是通過“蒸餾”(Distillation)技術,把 Sonnet 4 那一整套複雜的知識體系,壓縮成更小、更快的結構。
結果就是:性能幾乎沒掉,成本砍到原來的三分之一。
如果你是開發者,這次的定價會讓你心動:
每百萬輸入 Token 1 美元,輸出 5 美元。
對比一下同系列的 Sonnet 4.5(3/15 美元)和 Opus 4.1(15/75 美元),差距堪比點外賣從黑松露牛排換成香辣雞腿堡——但你喫完會發現,這雞腿堡其實也挺香。
更絕的是,Anthropic 還特意爲它設計了“多模型協同”機制:
Sonnet 4.5 當指揮官,Haiku 4.5 當執行隊。
前者負責拆任務、定策略,後者負責並行幹活。一個人思考,一羣人幹活——效率、成本、速度都上去了。
從產品線角度看,這次的 Haiku 4.5 是 Anthropic 的一個戰略信號。
它不再追着 OpenAI 的 CodeX 比有多強,而是往能跑多快、能用多久、能省多少錢上發力。
這很聰明。
因爲在 AI 工具進入生產線、客服、開發流程這些真實場景時,延遲和價格往往比天花板性能更重要。
Anthropic 甚至在官方博客裏寫得很直白:
“依賴人工智能執行實時、低延遲任務(如聊天助手、客戶服務代理或結對編程)的用戶將欣賞 Haiku 4.5 的高智能和卓越速度的結合。Claude Code 的用戶會發現 Haiku 4.5 使編碼體驗(從多代理項目到快速原型設計)的響應速度顯着提高。”
聽着像是對 OpenAI 的 GPT-5 和 Google Gemini 說的:
你們繼續打性能牌,我去收割用得起、跑得快、上線方便的市場。(來收割我這種窮哥們了)
而且這次 Haiku 4.5 在安全性上也下了功夫。
它是 Anthropic 目前安全等級最低風險的模型,被官方列爲 ASL-2(比 Sonnet 4.5 的 ASL-3 更寬鬆)。
在一堆看起來很學術的評估中,它的“未對齊行爲率”比前幾代都更低。
簡單說,就是更穩、不容易“出幺蛾子”。
這讓它在企業場景和 API 部署裏更有優勢——你可以放心地讓它當客服、寫代碼、自動回覆郵件,而不用擔心哪天它突然開始討論人生意義(如果你被這種情況折磨過的就知道有多生草,這種情況我稱之爲大模型哈氣)。
說到性能表,你可能更想看看全景對比。
從表裏可以看到,Haiku 4.5 的各項表現都非常均衡,綜合編程能力僅次於 Sonnet 4.5,但在計算機使用、視覺推理等方面反而略勝一籌。
同時它的推理類任務(GPQA、MMMLU)也在一線水平,比上一代 Haiku 3.5 提升明顯,甚至有些項目上,Haiku 4.5 已經接近 GPT-5。
Tips:當然,Anthropic 自己也說了,這些是內部數據,“請審慎參考”。
但就算打個折,這成績也足夠說明問題。
從使用層面看,Haiku 4.5 已經全線開放,面向所有人可用,定價也便宜了不少。
無論是 Claude App、Claude Code、API、Amazon Bedrock 還是 Google Vertex AI,都能直接用。
這意味着它將迅速成爲各類嵌入式AI或實時協作Agent的首選模型。
如果說 Sonnet 4.5 是 Anthropic 的旗艦,那 Haiku 4.5 就是那款“你每天真會用到”的主力機型。
這次更新其實還有個更深的信號——
Anthropic 正在用雙層模型策略打穿整個市場。
大模型負責思考,小模型負責執行。
AI 不再是一臺萬能大腦,而是一支分工明確的團隊。
這意味着:可能未來我們用的不是一個 Claude,而是一整個 Claude 小組,這纔是多代理(multi-agent)時代的雛形。
從行業角度看,Haiku 4.5 可能會逼所有廠商重新定價。
OpenAI 的 GPT-5 在“快”和“省”上被追得不遠,Google Gemini 2.5 Pro 的 67.2% SWE-bench 分數更顯尷尬。
Anthropic 用一款“小型號”打出了“旗艦級表現”,說明了一個現實:
AI 的下半場,不拼誰最聰明,而拼誰最划算。
Haiku 4.5 或許不是最耀眼的,但它可能是最接地氣的——讓 AI 從“炫技的怪物”,變成“真正能幫你幹活的員工”。
也許幾年後我們回看,會發現改變世界的,不是巨獸模型,而是這些能快速響應、能並行協作的“小AI”。
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com