1.杭州的人工智能基础技术研究公司DeepSeek因其最新开源的推理模型R1正式版,登顶苹果美国地区应用商店免费APP下载排行榜。
2.DeepSeek R1与OpenAI的o1正式版水平相当,但成本较低、速度较快,且对个人用户免费。
3.除此之外,DeepSeek R1模型权重和技术报告完全开源,为全世界技术平权和进步带来巨大助力。
4.温颖认为,DeepSeek在有限的条件下取得显著成果,得益于人才和组织效率。
以上内容由腾讯混元大模型生成,仅供参考
似乎一夜之间,DeepSeek(深度求索)就“火”了。其实早些时候,这家来自杭州的人工智能基础技术研究公司在国内业内人士中就颇有口碑,近日由于其最新开源了推理模型R1正式版,不仅登顶苹果美国地区应用商店免费APP下载排行榜,在其冲击下当地时间1月27日美国人工智能主题股票遭抛售。
与此前大热的ChatGPT相比,DeepSeek的技术路线有何不同?优势在哪里?带来哪些启示?解放日报记者专访了上海交通大学人工智能学院长聘教轨副教授温颖。
【成本较低、速度较快,关键还免费】
“从大的技术路线来说,DeepSeek和OpenAI公司的ChatGPT没有特别大的区别,都是混合专家模型架构进行预训练,然后加上强化学习后训练,主要还是具体工程实现的不同。”温颖说,从最终公开榜单的效果来看,DeepSeek R1基本达到与OpenAI公司去年底发布的推理模型o1正式版相当的水平。
并没有超越OpenAI,为何会引发美国以科技公司为主的纳斯达克比较大的跌幅呢?
温颖认为,主要是因为DeepSeek推理成本较低、速度较快,关键它还对个人用户免费,其他企业或开发者调用DeepSeek-R1接口的成本也只是o1的几十分之一。
公开资料显示,DeepSeek R1的基座模型训练成本较低,一次完整训练只需要550万美元,每次生成只需要激活相对较少的参数,降低了对计算资源的需求,提高了计算效率。
温颖此前花了200美元/月订阅了OpenAI的o1 pro,“就使用感受而言,两者性能整体差不多,有些领域各有千秋。但DeepSeek R1免费,速度更快,性能真的很好。”
【开源,助力全世界技术平权和进步】
DeepSeek带来哪些启示?
“这是国内大模型第一次达到国外最顶尖大模型水准,与OpenAI的o1 pro相当,远超谷歌、Meta及国内一众大模型,把我们大模型上的技术差距从1-2年降低到3-6个月。”温颖说,DeepSeek R1模型权重和技术报告完全开源,技术路线简单有效,这对于全世界技术平权和进步都是巨大助力。
温颖一直研究强化学习,这是一种交互式学习方式,通过奖励引导模型学习推理和反思。DeepSeek R1验证了该领域一个朴素的观点,即当基座模型足够强大时,给模型一些明确且简单的奖励信号,再使用强化学习,就能让模型能力获得极大提升,涌现一些更高层次的推理和反思能力。“从学术角度看到这个观点被一定程度验证,感觉很振奋。”
其实,国内外比DeepSeek拥有更多资源的技术公司有很多,但DeepSeek能在有限的条件下大有作为,在温颖看来这得益于人才和组织效率,“凭借着一群优秀年轻人对技术的热爱,最终转化成生产力。”