微軟發佈開源小型代理模型 Fara-7B,用於本地電腦操作

微軟研究院推出面向電腦操作的開源小模型 Fara-7B,定位爲“Computer Use Agent(CUA)”,能夠通過鼠標與鍵盤在網頁上自主執行任務。模型規模僅 70 億參數,但在 WebVoyager、Online-Mind2Web、DeepShop 及微軟新提出的 WebTailBench 等基準上表現達到同尺寸最優,並接近更大模型的水平。

Fara-7B 依賴瀏覽器截圖進行視覺感知,無需訪問無障礙樹等結構信息,即可預測點擊、輸入、滾動等操作步驟,支持表單填寫、檢索、比價、預訂等多步網頁任務。模型基於 Magentic-One 多智能體系統生成的合成數據訓練,總計約 14.5 萬條任務軌跡。

該模型已在 Microsoft Foundry 與 Hugging Face 上架,採用 MIT 許可證開源,同時提供 Magentic-UI 實驗環境與面向 Copilot+ PC 的量化版本,可在 Windows 11 設備上本地運行並利用 NPU 加速。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com