文丨博阳
编辑丨徐青阳
DeepSeek正在洽谈首次引入外部资本。貌似不缺钱的梁文锋,为何也要融资了呢?
《The Information》援引五位知情人士消息,这家此前一直由母公司幻方量化(High-Flyer Quant)全资拥有的AI初创公司,正计划以至少100亿美元的估值筹集不低于3亿美元(约20亿元人民币)的资金。
这次融资标志着创始人兼CEO梁文锋的经营战略发生重大转折。作为业内公认的技术理想主义者,他曾长期拒绝顶级风投和科技巨头的投资提议,试图让公司保持独立,免受商业压力的干扰。
然而,他现在似乎改了主意。原因并不复杂——“账单”压力。
随着全球AI竞赛进入比拼算力储备和人才留存的昂贵阶段,即便是最孤傲的技术高地,也需要更深厚的资金池来支撑其后续开发。
01 百亿美元估值,贵了还是便宜了
100亿美元的估值放在美国同行旁边,显得不太起眼。
Anthropic上市前估值约8510亿美元,OpenAI超过5000亿美元,埃隆·马斯克的xAI融资规模在800亿美元左右。DeepSeek展现出的技术能力并不比这些公司差多少,但估值不到人家的零头。
AI领域创业者阿曼·西杜(Armaan Sidhu)分析了这个差距,并给出三个原因:
第一是开源模式。DeepSeek坚持公开模型权重,没法像美国实验室那样靠API调用收钱。但开源等于把赚钱的路子自己堵上了一半。西杜的评价很直白:DeepSeek"有效地扮演了全球人工智能研究界的公共产品提供者的角色"。翻译过来就是,东西是好东西,但不赚钱。
第二是监管压力。中国AI公司同时受到国内监管和跨境资本流动两方面的制约,美国还限制本国资本投资中国AI企业。两层因素叠加,DeepSeek基本被隔绝在西方资本市场之外,估值空间自然受压制。
第三是出口管制的不确定性。投资人不确定DeepSeek能不能持续拿到足够强的算力。命脉被人掐着,给的价码就得打折扣。
但换个角度看,100亿美元本身不是小数目。
DeepSeek此前一分钱外部融资都没拿过,这是它的身价第一次被拿到市场上检验。如果管理层觉得算力短缺会卡死未来的路,就不会在这个节点出手融资。要么他们通过某些渠道拿到了够用的芯片,要么在技术上找到了进一步压低算力需求的办法。两种可能都值得琢磨。
02 “560万美元”只是入场费
DeepSeek靠什么出名的?R1模型。
2025年1月发布时,市场被一个数字炸懵了。按照DeepSeek自己公布的数据:V3模型完整训练只花了不到600万美元,用的是英伟达H800芯片。这个数字直接戳破了美国AI圈的前提假设——搞前沿模型必须烧天量的钱。纳斯达克一天蒸发约一万亿美元,英伟达跌掉近六千亿。
但实际上,560万美元描述的只是一次训练运行,不是这家公司的全部开销。
半导体研究机构SemiAnalysis去年算过一笔账:DeepSeek的硬件家底远不止明面上那点东西,服务器总资本支出估计接近16亿美元,其中9亿多直接和运行计算集群相关。
按照他们的估算,DeepSeek手里大概有五万张Hopper架构的GPU,包括H100、H800、H20和A100。这个数字DeepSeek没有确认,但方向是清楚的——560万美元只是柜台上那盘菜的边际成本,背后的厨房才是大头。
幻方量化是DeepSeek的全资母公司,这家对冲基金本就是玩机器学习的老手。他们最初囤芯片是为了做量化交易降延迟,后来这批家当转给了DeepSeek搞模型研发。所以DeepSeek从一开始就不是白手起家,背后站着一个已经为算力付过钱的金主。
训练成本低,不等于扩展成本低。DeepSeek用560万美元做了一次漂亮的演示,但要把演示变成能持续运转的业务,账单完全是另一个量级。
芯片要钱,数据中心要钱,推理服务要钱。这些钱从哪来?融资。
03 留住人才,也得加钱
钱不光要砸在机器上,还要砸在人身上。
据The Information报道,DeepSeek近期流失了多位核心研究员。对V3模型有重要贡献的罗福莉已加入小米,负责新成立的人工智能部门。另一位核心人物郭达雅则跳槽至字节跳动的Seed团队,那是字节AI的核心部门,做基础模型研究,也做豆包这类产品。
郭达雅的离职在中国科技圈闹出了不小动静。《晚点LatePost》报道其年薪高达1470万美元,字节跳动副总裁李亮随后在社交媒体上否认了这个数字,表示Seed团队采用统一薪酬框架,包含现金、字节跳动股权及豆包相关股票期权。
他承认部分员工可能在四年后通过行权获得数亿元收入,但未确认郭达雅是否入职。《南华早报》援引字节跳动员工的说法称,郭达雅的名字尚未出现在内部员工系统中,不过新员工用化名也是常事。
不管具体数字是多少,趋势很明确:顶尖AI研究员的价码正被迅速推高。仅靠技术理想主义,已经留不住人了。
职场社交平台脉脉的数据,从另一个侧面印证了这场人才争夺的激烈程度。
字节跳动自己的Seed团队过去一年有近70人离职,其中约30人去了腾讯,主要从事AI基础设施和数据系统相关工作。前Seed视觉AI平台负责人肖学峰和基础设施专家张弛,目前都在腾讯做模型基础设施项目。还有人去了OpenAI、谷歌、Meta和苹果等。
人才在主要科技公司之间流动,薪酬条件成为决定性因素。DeepSeek如果不融钱,在抢人大战里只会越来越被动。
04 V4卡在华为芯片上,这是场硬仗
人才之外,还有一道更难迈的坎。
DeepSeek原计划2026年2月发布下一代旗舰模型V4,时间表已经推了好几次。问题出在芯片上。
据The Information报道,DeepSeek的工程师花了大量时间让V4兼容华为芯片,而且是即开即用地兼容。之前的模型都是针对英伟达芯片设计的,现在换到华为硬件上跑,工程难度比预想的大得多。
这个转向不是DeepSeek自己选的,是因为美国出口管制把英伟达最先进芯片挡在了中国门外。DeepSeek之前用A100和H800,那是美国收紧对华销售之前囤下来的。但下一代模型需要更强算力,比如英伟达Blackwell芯片,而这款芯片已被禁止出口到中国。
路透社今年2月报道,DeepSeek没按行业惯例向美国芯片制造商展示V4进行性能调优,而是让包括华为在内的中国供应商提前接触。4月又有消息说,V4将在华为最新芯片上运行。阿里巴巴、字节跳动和腾讯已大量订购了数十万片华为芯片。
这是一场硬仗。DeepSeek要证明的不只是模型本身好不好用,而是整个中国硬件栈能不能撑起一个前沿模型的训练和推理。英伟达CEO黄仁勋对此说得很直接:如果DeepSeek的模型在华为芯片上运行,对美国来说将是"可怕的后果"。
05 美国人眼里的两个DeepSeek
融资消息传出来之后,西方的反应很有意思。他们对DeepSeek的态度一直自相矛盾,好像同时相信两个完全不同的版本。
一个版本是可怕的。这个DeepSeek缩小了中美模型差距,冲击了美国股市,还给华为提供了一条摆脱英伟达生态的路径。按这个版本,出口管制形同虚设。
另一个版本是有缺陷的。美国国家标准与技术研究院(NIST)下属CAISI的评估报告显示,DeepSeek模型在性能、成本、安全性和采用率上都落后于美国顶级模型。最好的美国模型比最好的DeepSeek模型在软件工程和网络任务上多解决了超过20%的问题。报告还发现,DeepSeek智能体听从恶意劫持指令的可能性高出12倍,在某次越狱攻击测试中,对94%的恶意请求做出了回应。
两个版本其实可以同时成立。DeepSeek确实比美国顶级模型弱,但它仍然足够重要。它可以在某些基准测试上落后于Anthropic,同时还能让英伟达、AMD、华为、阿里巴巴、腾讯和美国出口官员都围着它转。如果一个模型便宜、好用,它就能把订单、政策和芯片路线图都拉向自己这边。
斯坦福大学今年发布的AI指数报告给了一个数据:自2025年初以来,美国和中国模型多次交替领先。截至今年3月,Anthropic的顶级模型领先中国最佳模型仅2.7%。差距小到让华盛顿紧张。
但资金差距依然巨大。斯坦福的数据显示,2025年美国私人AI投资2859亿美元,中国124亿美元,差二十三倍多。报告也提醒,这个数字可能低估了中国政府支持的支出规模。在这个背景下,DeepSeek融3亿美元放在美国不算什么,放在中国私人AI投资里就是一笔大钱。
06 账单不会消失,只会换个科目
DeepSeek这次融资的意义不在3亿美元本身,而在它释放的信号。
从去年1月到现在,关于DeepSeek的讨论转了三个弯。最初是恐慌——一个中国小团队用零头成本做出前沿水平,美国AI的护城河是不是纸糊的?然后是质疑——560万美元到底是不是全部成本?接着是消化——DeepSeek确实有两下子,但美国实验室也没被甩开。现在话题又变了:DeepSeek也要融资了,AI竞赛终究还是拼财力。
Benchmark投资人科迪·阿克里(Cody Acree)说过,低成本模型并不会消除对高端芯片的需求。DeepSeek用560万美元做了一次漂亮演示,但要把演示变成能持续运转的业务,需要的钱是另一个量级。那个廉价AI的故事从来不是说AI可以便宜地做,而是说DeepSeek找到了一种更省钱的训练方法。 但省钱和省到不需要钱是两回事。
西杜的评论里也有一句话很实在:"中国的人工智能并没有赶超美国,但已经并驾齐驱。问题在于,美国AI公司的估值,是按'美国遥遥领先'这个前提来定价的。现在,这个前提还站得住吗?"
V4发布在即。这是DeepSeek在华为硬件上的第一次大考。如果成了,这家公司就不再只是一个让人眼前一亮的模型实验室,而是中国AI自主硬件通道上的关键一环。如果不成,那个廉价AI的故事就得换个讲法。
从拒绝投资到开口要钱,从英伟达芯片到华为硬件,从技术理想主义到精打细算过日子——DeepSeek的转向说明了一件事:AI竞赛的下半场,比的不是谁更惊艳,而是谁的账单付得起。
账单已经来了。接下来看DeepSeek怎么付。
特约编译金鹿对本文亦有贡献