Claude 5泄露,編程能力超80% SWE-Bench

根據爆料消息稱,2月3日前,Anthropic的Claude Sonnet 5(代號Fennec)已在谷歌基礎設施中部署,性能全面超越現有模型。該模型支持100萬token上下文窗口,定價僅爲Claude Opus 4.5的50%,旨在降低開發者使用成本。

在SWE-Bench基準測試中,Sonnet 5得分超過80.9%,遠高於此前最高74.4%,可獨立處理bug修復、重構、測試生成和CI/CD流程。同時,在結構化視覺生成、UI渲染及複雜代碼構建等領域表現出色。

核心創新包括“Dev Team”模式:模型可自動生成多個子智能體,實現並行協作,輸出完整可測試的功能模塊。“蜂羣”(Swarm)功能支持層級式、依賴式和廣播式協作,AI能自我組織創建新Agent,模擬全開發團隊運作。

Anthropic憑藉100億美元融資(估值3500億美元)和Claude Code年收入超10億美元,在編程AI市場佔有40%份額,領先OpenAI(27%)和谷歌(21%)。此次泄露正值OpenAI預告Codex系列,Anthropic或意在搶先競爭。

業內認爲,Sonnet 5的發佈將重塑軟件工程範式,推動AI從輔助工具向自主開發團隊轉型。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com