DeepSeek 發佈 DeepSeekMath‑V2 強調自驗證數學推理能力

DeepSeek 公佈 DeepSeekMath‑V2,主打可自我驗證的數學推理訓練框架。團隊認爲,僅追求最終答案正確率難以保證推理鏈條的嚴謹性,尤其在定理證明等需要逐步推導的任務中更爲突出。模型通過構建基於 LLM 的驗證器,對生成的證明進行自動審查,並利用擴展的驗證計算持續生成高難度訓練樣本提升驗證器能力。

DeepSeekMath‑V2 基於 DeepSeek‑V3.2‑Exp‑Base,已在 IMO 2025、CMO 2024 與 Putnam 2024 中取得高分表現,顯示自驗證機制在提升複雜數學推理上的潛力。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com