DeepSeek 发布 DeepSeekMath‑V2 强调自验证数学推理能力

DeepSeek 公布 DeepSeekMath‑V2,主打可自我验证的数学推理训练框架。团队认为,仅追求最终答案正确率难以保证推理链条的严谨性,尤其在定理证明等需要逐步推导的任务中更为突出。模型通过构建基于 LLM 的验证器,对生成的证明进行自动审查,并利用扩展的验证计算持续生成高难度训练样本提升验证器能力。

DeepSeekMath‑V2 基于 DeepSeek‑V3.2‑Exp‑Base,已在 IMO 2025、CMO 2024 与 Putnam 2024 中取得高分表现,显示自验证机制在提升复杂数学推理上的潜力。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com