面对中国AI独角兽DeepSeek登顶美国App Store的强势冲击,OpenAI的CEO山姆奥特曼突然在今天凌晨,发布了最新的推理模型o3-mini,为o3的经济适用版,外界普遍认为o3mini是用来对抗幻方的deepseek,这次o3mini的成本已经大幅降低,但API价格仍高于DeepSeek模型。
据OpenAI披露,o3-mini在科学、数学、编程三大硬核领域实现全面突破,在真实软件开发测试SWE-bench中,o3-mini 61%的成绩较前代o1提升13个百分点,远超主流开源模型;14种语言的MMLU测试准确率飙升,中文、西班牙语等非英语场景错误率下降39%;高推理模式下,FrontierMath 难题首次解题率突破32%,复杂公式推导速度提升24%,平均响应压至7.7秒,斯坦福AI实验室认为,“这是小型模型首次触及科研级智能门槛。”
尽管o3-mini的API定价仍比DeepSeek高18%,但每个token成本已较GPT-4时期暴降95%。OpenAI CTO米拉·穆拉蒂说:“这是顶级推理能力与极致成本的平衡艺术。”目前,o3-mini对免费用户开放"Reason"基础功能,Plus用户消息限额提升3倍至150条/日,Pro用户无限制访问。
新模型提供三种推理强度选项(低、中、高),用户可以根据具体需求调整模型的推理强度。另外,o3-mini还支持函数调用和外部工具的集成,可以更好地与自动化工作流程结合,同时引入了“开发者消息”功能,允许开发者通过更灵活和结构化的指令来指导模型。
当前OpenAI仍然在全力备战这场AI竞赛,为o3系列豪掷3440万美元的单次高效测试费,山姆联合微软打造的“星际之门”首台GB200 NVL72服务器已在Azure上线,与软银有望即将达成超过400亿美元的合作,如今DeepSeek的低成本优势逐渐成为各家厂商下一步专注解决的方向,高效生产力才是王道。
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com