重磅!OpenAI大戰deepseek,宣佈上線推理模型o3-mini!

面對中國AI獨角獸DeepSeek登頂美國App Store的強勢衝擊,OpenAI的CEO山姆奧特曼突然在今天凌晨,發佈了最新的推理模型o3-mini,爲o3的經濟適用版,外界普遍認爲o3mini是用來對抗幻方的deepseek,這次o3mini的成本已經大幅降低,但API價格仍高於DeepSeek模型。

據OpenAI披露,o3-mini在科學、數學、編程三大硬核領域實現全面突破,在真實軟件開發測試SWE-bench中,o3-mini 61%的成績較前代o1提升13個百分點,遠超主流開源模型;14種語言的MMLU測試準確率飆升,中文、西班牙語等非英語場景錯誤率下降39%;高推理模式下,FrontierMath 難題首次解題率突破32%,複雜公式推導速度提升24%,平均響應壓至7.7秒,斯坦福AI實驗室認爲,“這是小型模型首次觸及科研級智能門檻。”

儘管o3-mini的API定價仍比DeepSeek高18%,但每個token成本已較GPT-4時期暴降95%。OpenAI CTO米拉·穆拉蒂說:“這是頂級推理能力與極致成本的平衡藝術。”目前,o3-mini對免費用戶開放"Reason"基礎功能,Plus用戶消息限額提升3倍至150條/日,Pro用戶無限制訪問。

新模型提供三種推理強度選項(低、中、高),用戶可以根據具體需求調整模型的推理強度。另外,o3-mini還支持函數調用和外部工具的集成,可以更好地與自動化工作流程結合,同時引入了“開發者消息”功能,允許開發者通過更靈活和結構化的指令來指導模型。

當前OpenAI仍然在全力備戰這場AI競賽,爲o3系列豪擲3440萬美元的單次高效測試費,山姆聯合微軟打造的“星際之門”首臺GB200 NVL72服務器已在Azure上線,與軟銀有望即將達成超過400億美元的合作,如今DeepSeek的低成本優勢逐漸成爲各家廠商下一步專注解決的方向,高效生產力纔是王道。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com