Claude 新模型太離譜了：性能不輸旗艦，價格只要三分之一

各位好，我們是果核剝殼旗下的AI方向新賬號 —— 飛碟AI，初來乍到小黑盒（來摸魚，真的），還請各位多多關注我們，感激不盡！！

Anthropic（Claude AI 背後的公司）最近是真有點活明白了。

當大家還在討論 Sora、Grok、Gemini 這些花裏胡哨的視頻模型時，Anthropic 今早悄悄扔出了一顆“平價核彈”：Claude Haiku 4.5。

它幾乎是 Claude Sonnet 4 的性能，價格只要三分之一，速度還翻倍。

(並且這次 Anthropic 一上來就着重強調了其“平價”和"所有人可用")

聽着是不是有點離譜？但這次數據擺在那兒，不吹。

在最新的 SWE-bench Verified 編程基準測試裏，Haiku 4.5 的準確率達到了 73.3%，略微超過中杯的 Sonnet 4（72.7%），比 OpenAI 的 GPT-5 還略高一點點，差點就打過專長代碼的 GPT-5 CodeX。

更有意思的是，在另一個測試 OSWorld（讓模型像人一樣操作電腦）裏，Haiku 4.5 居然反超了 Sonnet 4，成了最會用電腦的 AI。

你可能想問：這到底是怎麼做到的？

其實很簡單，Anthropic 把這次的 Haiku 4.5 定位成一個高智能的“輕型選手”。它是通過“蒸餾”（Distillation）技術，把 Sonnet 4 那一整套複雜的知識體系，壓縮成更小、更快的結構。

結果就是：性能幾乎沒掉，成本砍到原來的三分之一。

如果你是開發者，這次的定價會讓你心動：

每百萬輸入 Token 1 美元，輸出 5 美元。

對比一下同系列的 Sonnet 4.5（3/15 美元）和 Opus 4.1（15/75 美元），差距堪比點外賣從黑松露牛排換成香辣雞腿堡——但你喫完會發現，這雞腿堡其實也挺香。

更絕的是，Anthropic 還特意爲它設計了“多模型協同”機制：

Sonnet 4.5 當指揮官，Haiku 4.5 當執行隊。

前者負責拆任務、定策略，後者負責並行幹活。一個人思考，一羣人幹活——效率、成本、速度都上去了。

從產品線角度看，這次的 Haiku 4.5 是 Anthropic 的一個戰略信號。

它不再追着 OpenAI 的 CodeX 比有多強，而是往能跑多快、能用多久、能省多少錢上發力。

這很聰明。

因爲在 AI 工具進入生產線、客服、開發流程這些真實場景時，延遲和價格往往比天花板性能更重要。

Anthropic 甚至在官方博客裏寫得很直白：

“依賴人工智能執行實時、低延遲任務（如聊天助手、客戶服務代理或結對編程）的用戶將欣賞 Haiku 4.5 的高智能和卓越速度的結合。Claude Code 的用戶會發現 Haiku 4.5 使編碼體驗（從多代理項目到快速原型設計）的響應速度顯着提高。”

聽着像是對 OpenAI 的 GPT-5 和 Google Gemini 說的：

你們繼續打性能牌，我去收割用得起、跑得快、上線方便的市場。（來收割我這種窮哥們了）

而且這次 Haiku 4.5 在安全性上也下了功夫。

它是 Anthropic 目前安全等級最低風險的模型，被官方列爲 ASL-2（比 Sonnet 4.5 的 ASL-3 更寬鬆）。

在一堆看起來很學術的評估中，它的“未對齊行爲率”比前幾代都更低。

簡單說，就是更穩、不容易“出幺蛾子”。

這讓它在企業場景和 API 部署裏更有優勢——你可以放心地讓它當客服、寫代碼、自動回覆郵件，而不用擔心哪天它突然開始討論人生意義（如果你被這種情況折磨過的就知道有多生草，這種情況我稱之爲大模型哈氣）。

說到性能表，你可能更想看看全景對比。

從表裏可以看到，Haiku 4.5 的各項表現都非常均衡，綜合編程能力僅次於 Sonnet 4.5，但在計算機使用、視覺推理等方面反而略勝一籌。

同時它的推理類任務（GPQA、MMMLU）也在一線水平，比上一代 Haiku 3.5 提升明顯，甚至有些項目上，Haiku 4.5 已經接近 GPT-5。

Tips：當然，Anthropic 自己也說了，這些是內部數據，“請審慎參考”。

但就算打個折，這成績也足夠說明問題。

從使用層面看，Haiku 4.5 已經全線開放，面向所有人可用，定價也便宜了不少。

無論是 Claude App、Claude Code、API、Amazon Bedrock 還是 Google Vertex AI，都能直接用。

這意味着它將迅速成爲各類嵌入式AI或實時協作Agent的首選模型。

如果說 Sonnet 4.5 是 Anthropic 的旗艦，那 Haiku 4.5 就是那款“你每天真會用到”的主力機型。

這次更新其實還有個更深的信號——

Anthropic 正在用雙層模型策略打穿整個市場。

大模型負責思考，小模型負責執行。

AI 不再是一臺萬能大腦，而是一支分工明確的團隊。

這意味着：可能未來我們用的不是一個 Claude，而是一整個 Claude 小組，這纔是多代理（multi-agent）時代的雛形。

從行業角度看，Haiku 4.5 可能會逼所有廠商重新定價。

OpenAI 的 GPT-5 在“快”和“省”上被追得不遠，Google Gemini 2.5 Pro 的 67.2% SWE-bench 分數更顯尷尬。

Anthropic 用一款“小型號”打出了“旗艦級表現”，說明了一個現實：

AI 的下半場，不拼誰最聰明，而拼誰最划算。

Haiku 4.5 或許不是最耀眼的，但它可能是最接地氣的——讓 AI 從“炫技的怪物”，變成“真正能幫你幹活的員工”。

也許幾年後我們回看，會發現改變世界的，不是巨獸模型，而是這些能快速響應、能並行協作的“小AI”。

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com

Claude 新模型太離譜了：性能不輸旗艦，價格只要三分之一

相關資訊 更多

熱點資訊

热门游戏

相關資訊更多