丁丁打折网 - 网友优惠券分享网站,有688999个用户

京东优惠券 小米有品优惠券

当前位置 : 首页>电脑数码>DeepSeek推出数学推理新模型 自验证框架达国际奥赛金牌水平

DeepSeek推出数学推理新模型 自验证框架达国际奥赛金牌水平

类别:电脑数码 发布时间:2025-11-28 12:35

【太平洋科技快讯】11 月 28 日,DeepSeek 于昨日在 HuggingFace 平台发布了 DeepSeekMath‑V2 模型,主打可自我验证的数学推理训练框架。

研发团队指出,传统方法仅追求最终答案的正确率,难以确保推理链条的严谨性。这一局限在定理证明等需要逐步推导的任务中尤为明显。

DeepSeekMath-V2 基于 DeepSeek-V3.2-Exp-Base 构建,其核心创新在于引入了可自我验证的训练框架。该模型通过 LLM 验证器,对生成的数字证明进行自动审查,并利用扩展的验证计算持续生成高难度样本优化验证器性能。

该框架通过构建基于大语言模型的验证器,能够对模型生成的数学证明进行自动审查,并利用持续生成的高难度样本优化验证器性能,有效提升了推理链条的严谨性。

据了解,在 2025 年国际数学奥林匹克竞赛和 2024 年中国数学奥林匹克竞赛中,DeepSeekMath-V2 均达到金牌水准。特别是在 2024 年普特南数学竞赛中,该模型取得了 118 / 120 分的优异成绩,近乎满分。

目前,DeepSeek 已将该模型的代码与权重在 Hugging Face 及 GitHub 平台开源。研发团队表示,这一成果验证了自验证推理路径的可行性,尽管仍有大量工作待推进,但为构建更强大、更可靠的数学智能系统提供了新方向。

丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备2023003002号-11

Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All rights reserved