推理性能直逼o1，DeepSeek再次出手，重点：即将开源

机器之心

2024-11-21 14:46发布于北京机器之心官方账号

机器之心报道

编辑：佳琪、蛋酱

DeepSeek 又出手了，这次又是重磅炸弹。

昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。

在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型，有三项成绩还领先于 OpenAI o1-preview。

背后的秘诀，就是「深度思考」。

更多的强化学习、原生的思维链、更长的推理时间，能让大模型的性能更强，这在领域内已经是广泛共识。这种模式其实非常像人类大脑的深度思考。

与 OpenAI o1 有点不一样的是，DeepSeek-R1-Lite-Preview 会在回复中展示「思路链」推理，也就是响应查询和输入的不同链或「思路」，并解释它在做什么以及为什么这样做。

就像是解题时，有人喜欢将每一步骤都详尽地写在卷子上，而 DeepSeek-R1-Lite-Preview 更进一步：把内心 OS 也都写出来了。

DeepSeek 官方表示，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。已经发布的 DeepSeek-R1-Lite-Preview 使用的是一个较小的基座模型，尚未完全释放长思维链的潜力。

对于用户的 Prompt，DeepSeek-R1-Lite-Preview 会有一个很长的推理过程。如上图中的红色实线所示，模型所能达到的准确率与所给定的推理长度呈正相关。且相比于传统的多次采样 + 投票（Majority Voting），模型思维链长度增加展现出了更高的效率。

最惊艳的是，发布即上线：所有用户均可通过官网开启与 DeepSeek-R1-Lite-Preview 的对话，但注意要先在输入框中打开「深度思考」模式，每天限制 50 次使用。

体验地址：http://chat.deepseek.com/

不得不说，对 o1 直接发起冲击的 DeepSeek，着实让国内 AI 社区振奋了一把：

图源：https://www.zhihu.com/question/4689435060/answer/36575793425

由于 DeepSeek-R1-Lite-Preview 目前仅支持网页使用，没有发布完整代码供独立第三方分析或基准测试，也没有通过 API 提供 DeepSeek-R1-Lite-Preview 以进行同类独立测试，也没有解释 DeepSeek-R1-Lite-Preview 是如何训练或构建的博客文章或技术论文，大家心中其实还有许多的「问号」。

但 DeepSeek 已经表示，正式版 DeepSeek-R1 模型会完全开源，还会公开技术报告，部署 API 服务。