【太平洋科技快讯】由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 研究论文,登上国际顶级学术期刊《自然》(Nature)封面。此次发布的论文版本不仅补充了大量模型细节,还首次正面回应了模型发布之初关于蒸馏 OpenAI 的质疑。
今年 1 月,有报道称 OpenAI 研究人员认为 DeepSeek 可能使用了 OpenAI 模型的输出结果来训练 DeepSeek-R1。这种方法被认为能够以较低资源消耗加速模型能力提升,一度引发业内广泛讨论。
在论文的补充材料中,DeepSeek 团队明确回应了训练数据来源问题,强调“DeepSeek-V3-Base 的训练数据仅来自普通网页和电子书,不包含任何合成数据”。DeepSeek 表示,在预训练冷却阶段没有故意使用 OpenAI 生成的合成数据,该阶段所有数据均通过网页抓取。
丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备20009233号-2
Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All
rights reserved