一个来自杭州的大模型在全球AI界刷屏。
近日,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)宣布,全新系列开源模型DeepSeek-V3首个版本上线。
消息一经发布,就迅速在行业内引发关注和热议,被海外科技圈视为“来自东方的神秘力量”。主要原因在于模型的预训练成本极低,比OpenAI最新推出的AI大模型GPT-4o的低十几倍。
DeepSeek-V3模型究竟是“何方神圣”?为什么会引起国内外关注?
和世界顶尖的闭源模型“不分伯仲”
当前,AI对于我们来说并不陌生。
2022年,ChatGPT横空出世,敲开了人工智能的一扇门,给人们带来了很多惊喜。随之而来的,各种生成型AI产品如雨后春笋般冒出。
而这次在全球刷屏的DeepSeek-V3是“AI大模型”。简单来说,它的作用相当于像ChatGPT这样“人工智能聊天机器人”的“大脑”。
深度求索网页截图
“DeepSeek-V3和常见的AI大模型一样,能够针对用户提出的问题提供详细解答,无论是写代码、写文章、知识问答、陪伴聊天,它都可以。但让人惊喜的是,这是由我国本土公司自研,在性能上基本处于头部的开源大模型。”北京理工大学校外硕士生导师、无界AI联合创始人马千里解释道。
Meta AI 研究科学家田渊栋在社交媒体上的评价 图源:社交媒体截图
DeepSeek-V3性能有多强?官方数据显示,该模型多项评测成绩超越了头部开源模型,它在性能上和世界顶尖的闭源模型GPT-4o不分伯仲。
比如在数学能力上,它在美国数学竞赛(AIME 2024, MATH)测试上,得分高达90.2%,比GPT-4o 高出10分以上。
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试后得出的结论。
被称之为“AI界的拼多多”
此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
深度求索网页截图
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
著名 AI 科学家 Andrej Karpathy 在社交媒体的评价 图源:社交媒体截图
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。
这股“东方的神秘力量”来自杭州
其实DeepSeek-V2发布时,硅谷就惊讶地称之为“来自东方的神秘力量”。
公开资料显示,深度求索是由知名量化资管巨头幻方量化创立。幻方量化是一家依靠人工智能技术进行量化投资的对冲基金公司与科技公司,拥有强大的算力资源。2023年7月,深度求索在杭州成立,专注于AI大模型的研究和开发。
据报道,幻方量化和深度求索创始人梁文锋本硕就读于浙江大学,攻读人工智能,是一个极致的80后技术理想主义者,念书时就笃定“AI定会改变世界”。
一些已经尝鲜 DeepSeek-V3 的用户已经开始在网上分享他们的体验 图源:社交媒体截图
深度求索的出现,给AI界带来了怎样的影响?
马千里认为,DeepSeek-V3的爆火,不仅仅是因为其强大的性能和低廉的成本,它的出现,体现了中国不仅仅是跟随者,而是以一种创新的方式,在AI大模型发展上贡献“中国版本”。“在AI的浪潮下,深度求索像是一朵浪花,是AI发展过程中的‘重要一环’。”
梁文锋曾经在接受媒体采访时表示,过去很多年,中国公司习惯了别人做技术创新,他们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,他们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。
三年前,ChatGPT的出现,犹如投下了一枚重磅炸弹,掀起了行业的千层浪,随后产品的更新,虽有亮眼之处,但未能再次给人电光火石的震撼感。与此同时,中国AI企业不断向前迈进,全力加速,争相推出具有竞争力的AI产品,此次DeepSeek-V3“出圈”,让全球看到中国在AI大模型上的创新力。
如果你要问当前AI发展进度如何?也许正如深度求索官方所说:“这是一个全新的开始。”