
朋友們,小米這波牛大了。
前段時間在 OpenRouter 上調用量突然熱度飆升的神祕模型 Hunter Alpha,原來是小米家的模型!

昨天,神祕模型身份揭曉——Xiaomi MiMo-V2 系列。

同系列的其它模型有 MiMo-V2-Omni 多模態模型和 MiMo-V2-TTS 語音模型,三款模型一起上線,暫時還沒開源,目前通過 API 提供。
小米 MiMo 大模型負責人羅福莉(前DeepSeek研究員,1995年,很年輕,很厲害)也在X平臺公開認領了這個項目。

怪不得大家刷到性能數據時總覺得有股熟悉的DeepSeek味,原來是老東家的人帶着團隊過來的。
先說主力選手 MiMo-V2-Pro。
這是一款專攻 Agentic 工作流、長鏈路任務和複雜編碼的萬億參數MoE模型,總參數超過1T,激活參數約42B。

定位非常明確,就是給需要長時間思考、反覆調用工具的場景準備的。
Artificial Analysis的獨立基準測評直接把它的位置釘死在了全球第十。
Intelligence Index 拿到49分,僅次於幾家頂級閉源模型,在我國的模型裏穩居前列。

GDPval-AA Elo(真實Agent任務評分)高達1426,甩開GLM-5的1406和Kimi K2.5的1283一大截。

AA-Omniscience Index也提升了5分,幻覺率降到30%,比上一代MiMo-V2-Flash的48%低了不少。

MiMo-V2-Pro 這波還有一個亮點——性價比。
它跑完整套 Index 只用了 77M 輸出 tokens,比 GLM-5 省了30%左右,總成本348 美元。同等智能水平的閉源模型動輒兩千多刀,這差距直接把很多人看傻了。

上下文窗口支持最高 1M token,輸出上限32K token,純文本模態但能力極強。
編程任務裏它表現尤其突出,長鏈路代碼生成、複雜邏輯拆解、多輪調試都拿得出手。

對了,還有 MiMo-V2-Omni 全模態模型,它在 Pro 的基礎上補齊了圖像、視頻、音頻原生理解能力,上下文256K,定價也更親民。

讓人眼前一亮的還有 MiMo-V2-TTS。
與一般的 TTS 模型不同,如果說前面的 MiMo-V2-Pro 是爲 Agent 提供了強大的智力,那麼 MiMo-V2-TTS 則可以說是爲 Agent 補上了最後的“靈魂”。
![]()
它用自研Audio Tokenizer加上多碼本語音-文本聯合建模,在上億小時真實音頻數據上預訓練,再經過多維度強化學習,把情感、韻律、風格全部優化到位。
最牛的地方在於情感實時轉折,同一句話裏就能完成語氣切換和情感遞變,這在行業裏目前還很少見。
你可以精確控制整體風格、局部情緒、停頓、強調,甚至支持東北話、四川話、河南話、粵語、臺灣腔等多方言切換,還能多角色聲音自由轉換。
![]()
芝士圖片,移步微信
你好,我叫MiMo,我能跟你嘮東北嗑,也能擺哈龍門陣,還能同你講粵語,當然也可以這樣說悄悄話,甚至——陪你哭、陪你笑,誒嘿,這就是我,請多指教。
把Pro、Omni、TTS三款湊在一起,小米等於一次性把“腦+眼耳+嘴”全補齊了。
Pro 負責深度思考,Omni 負責多模態感知,TTS 負責把輸出變成有溫度的聲音。
三件套一閉環,Agent從工具變成真正能陪你幹活的數字同事。
小米這次低調歸低調,但出手就是重拳。
1M上下文、低成本、Agent任務強、TTS情感拉滿,還在OpenRouter和OpenClaw等主流工具裏開了首周全球免費試用窗口。
雷軍在微博上那句“小米在AI領域相對低調,但實際進展或比大家看到的快很多”,如此看來,還真不是客氣話。

最後,我還得蛐蛐一下,小米這波宣稱免費試用,但語言的藝術還是有的。
首先是限免僅限於 TTS 模型,其次限免僅一週,且只限特定工具使用,各種限制條件也比較多。
以及,我們實際測試 Pro 的代碼能力時,就遇到了點小麻煩——它不僅沒按要求完成任務,還擅自修改了之前的文件,還改翻車了。

不過整體能力還是不錯,當然,瑕疵也有(紅框)。

看來萬億參數的腦子雖然聰明,但偶爾也會自己發揮一下。
整體來說,小米這波確實把國產大模型的性價比天花板又抬高了一截。
海外霸榜的神祕模型身份揭開後,大家才發現,原來低調的那個纔是真王者。
![]()
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
