DeepSeek拟启动首次融资，梁文锋用20亿要做什么？

腾讯科技

2026-04-18 13:35发布于北京腾讯新闻科技频道官方账号

问AI · 梁文锋为何从技术理想主义转向融资？

作者声明：该图片由AI生成

文丨博阳

编辑丨徐青阳

DeepSeek正在洽谈首次引入外部资本。貌似不缺钱的梁文锋，为何也要融资了呢？

《The Information》援引五位知情人士消息，这家此前一直由母公司幻方量化（High-Flyer Quant）全资拥有的AI初创公司，正计划以至少100亿美元的估值筹集不低于3亿美元（约20亿元人民币）的资金。

这次融资标志着创始人兼CEO梁文锋的经营战略发生重大转折。作为业内公认的技术理想主义者，他曾长期拒绝顶级风投和科技巨头的投资提议，试图让公司保持独立，免受商业压力的干扰。

然而，他现在似乎改了主意。原因并不复杂——“账单”压力。

随着全球AI竞赛进入比拼算力储备和人才留存的昂贵阶段，即便是最孤傲的技术高地，也需要更深厚的资金池来支撑其后续开发。

01 百亿美元估值，贵了还是便宜了

100亿美元的估值放在美国同行旁边，显得不太起眼。

Anthropic上市前估值约8510亿美元，OpenAI超过5000亿美元，埃隆·马斯克的xAI融资规模在800亿美元左右。DeepSeek展现出的技术能力并不比这些公司差多少，但估值不到人家的零头。

AI领域创业者阿曼·西杜（Armaan Sidhu）分析了这个差距，并给出三个原因：

第一是开源模式。DeepSeek坚持公开模型权重，没法像美国实验室那样靠API调用收钱。但开源等于把赚钱的路子自己堵上了一半。西杜的评价很直白：DeepSeek"有效地扮演了全球人工智能研究界的公共产品提供者的角色"。翻译过来就是，东西是好东西，但不赚钱。

第二是监管压力。中国AI公司同时受到国内监管和跨境资本流动两方面的制约，美国还限制本国资本投资中国AI企业。两层因素叠加，DeepSeek基本被隔绝在西方资本市场之外，估值空间自然受压制。

第三是出口管制的不确定性。投资人不确定DeepSeek能不能持续拿到足够强的算力。命脉被人掐着，给的价码就得打折扣。

但换个角度看，100亿美元本身不是小数目。

DeepSeek此前一分钱外部融资都没拿过，这是它的身价第一次被拿到市场上检验。如果管理层觉得算力短缺会卡死未来的路，就不会在这个节点出手融资。要么他们通过某些渠道拿到了够用的芯片，要么在技术上找到了进一步压低算力需求的办法。两种可能都值得琢磨。

02 “560万美元”只是入场费

DeepSeek靠什么出名的？R1模型。

2025年1月发布时，市场被一个数字炸懵了。按照DeepSeek自己公布的数据：V3模型完整训练只花了不到600万美元，用的是英伟达H800芯片。这个数字直接戳破了美国AI圈的前提假设——搞前沿模型必须烧天量的钱。纳斯达克一天蒸发约一万亿美元，英伟达跌掉近六千亿。

但实际上，560万美元描述的只是一次训练运行，不是这家公司的全部开销。

半导体研究机构SemiAnalysis去年算过一笔账：DeepSeek的硬件家底远不止明面上那点东西，服务器总资本支出估计接近16亿美元，其中9亿多直接和运行计算集群相关。

按照他们的估算，DeepSeek手里大概有五万张Hopper架构的GPU，包括H100、H800、H20和A100。这个数字DeepSeek没有确认，但方向是清楚的——560万美元只是柜台上那盘菜的边际成本，背后的厨房才是大头。

幻方量化是DeepSeek的全资母公司，这家对冲基金本就是玩机器学习的老手。他们最初囤芯片是为了做量化交易降延迟，后来这批家当转给了DeepSeek搞模型研发。所以DeepSeek从一开始就不是白手起家，背后站着一个已经为算力付过钱的金主。

训练成本低，不等于扩展成本低。DeepSeek用560万美元做了一次漂亮的演示，但要把演示变成能持续运转的业务，账单完全是另一个量级。

芯片要钱，数据中心要钱，推理服务要钱。这些钱从哪来？融资。

03 留住人才，也得加钱

钱不光要砸在机器上，还要砸在人身上。

据The Information报道，DeepSeek近期流失了多位核心研究员。对V3模型有重要贡献的罗福莉已加入小米，负责新成立的人工智能部门。另一位核心人物郭达雅则跳槽至字节跳动的Seed团队，那是字节AI的核心部门，做基础模型研究，也做豆包这类产品。

郭达雅的离职在中国科技圈闹出了不小动静。《晚点LatePost》报道其年薪高达1470万美元，字节跳动副总裁李亮随后在社交媒体上否认了这个数字，表示Seed团队采用统一薪酬框架，包含现金、字节跳动股权及豆包相关股票期权。

他承认部分员工可能在四年后通过行权获得数亿元收入，但未确认郭达雅是否入职。《南华早报》援引字节跳动员工的说法称，郭达雅的名字尚未出现在内部员工系统中，不过新员工用化名也是常事。

不管具体数字是多少，趋势很明确：顶尖AI研究员的价码正被迅速推高。仅靠技术理想主义，已经留不住人了。

职场社交平台脉脉的数据，从另一个侧面印证了这场人才争夺的激烈程度。

字节跳动自己的Seed团队过去一年有近70人离职，其中约30人去了腾讯，主要从事AI基础设施和数据系统相关工作。前Seed视觉AI平台负责人肖学峰和基础设施专家张弛，目前都在腾讯做模型基础设施项目。还有人去了OpenAI、谷歌、Meta和苹果等。

人才在主要科技公司之间流动，薪酬条件成为决定性因素。DeepSeek如果不融钱，在抢人大战里只会越来越被动。

04 V4卡在华为芯片上，这是场硬仗

人才之外，还有一道更难迈的坎。

DeepSeek原计划2026年2月发布下一代旗舰模型V4，时间表已经推了好几次。问题出在芯片上。

据The Information报道，DeepSeek的工程师花了大量时间让V4兼容华为芯片，而且是即开即用地兼容。之前的模型都是针对英伟达芯片设计的，现在换到华为硬件上跑，工程难度比预想的大得多。

这个转向不是DeepSeek自己选的，是因为美国出口管制把英伟达最先进芯片挡在了中国门外。DeepSeek之前用A100和H800，那是美国收紧对华销售之前囤下来的。但下一代模型需要更强算力，比如英伟达Blackwell芯片，而这款芯片已被禁止出口到中国。

路透社今年2月报道，DeepSeek没按行业惯例向美国芯片制造商展示V4进行性能调优，而是让包括华为在内的中国供应商提前接触。4月又有消息说，V4将在华为最新芯片上运行。阿里巴巴、字节跳动和腾讯已大量订购了数十万片华为芯片。

这是一场硬仗。DeepSeek要证明的不只是模型本身好不好用，而是整个中国硬件栈能不能撑起一个前沿模型的训练和推理。英伟达CEO黄仁勋对此说得很直接：如果DeepSeek的模型在华为芯片上运行，对美国来说将是"可怕的后果"。

05 美国人眼里的两个DeepSeek

融资消息传出来之后，西方的反应很有意思。他们对DeepSeek的态度一直自相矛盾，好像同时相信两个完全不同的版本。

一个版本是可怕的。这个DeepSeek缩小了中美模型差距，冲击了美国股市，还给华为提供了一条摆脱英伟达生态的路径。按这个版本，出口管制形同虚设。

另一个版本是有缺陷的。美国国家标准与技术研究院（NIST）下属CAISI的评估报告显示，DeepSeek模型在性能、成本、安全性和采用率上都落后于美国顶级模型。最好的美国模型比最好的DeepSeek模型在软件工程和网络任务上多解决了超过20%的问题。报告还发现，DeepSeek智能体听从恶意劫持指令的可能性高出12倍，在某次越狱攻击测试中，对94%的恶意请求做出了回应。

两个版本其实可以同时成立。DeepSeek确实比美国顶级模型弱，但它仍然足够重要。它可以在某些基准测试上落后于Anthropic，同时还能让英伟达、AMD、华为、阿里巴巴、腾讯和美国出口官员都围着它转。如果一个模型便宜、好用，它就能把订单、政策和芯片路线图都拉向自己这边。

斯坦福大学今年发布的AI指数报告给了一个数据：自2025年初以来，美国和中国模型多次交替领先。截至今年3月，Anthropic的顶级模型领先中国最佳模型仅2.7%。差距小到让华盛顿紧张。

但资金差距依然巨大。斯坦福的数据显示，2025年美国私人AI投资2859亿美元，中国124亿美元，差二十三倍多。报告也提醒，这个数字可能低估了中国政府支持的支出规模。在这个背景下，DeepSeek融3亿美元放在美国不算什么，放在中国私人AI投资里就是一笔大钱。

06 账单不会消失，只会换个科目

DeepSeek这次融资的意义不在3亿美元本身，而在它释放的信号。

从去年1月到现在，关于DeepSeek的讨论转了三个弯。最初是恐慌——一个中国小团队用零头成本做出前沿水平，美国AI的护城河是不是纸糊的？然后是质疑——560万美元到底是不是全部成本？接着是消化——DeepSeek确实有两下子，但美国实验室也没被甩开。现在话题又变了：DeepSeek也要融资了，AI竞赛终究还是拼财力。

Benchmark投资人科迪·阿克里（Cody Acree）说过，低成本模型并不会消除对高端芯片的需求。DeepSeek用560万美元做了一次漂亮演示，但要把演示变成能持续运转的业务，需要的钱是另一个量级。那个廉价AI的故事从来不是说AI可以便宜地做，而是说DeepSeek找到了一种更省钱的训练方法。但省钱和省到不需要钱是两回事。

西杜的评论里也有一句话很实在："中国的人工智能并没有赶超美国，但已经并驾齐驱。问题在于，美国AI公司的估值，是按'美国遥遥领先'这个前提来定价的。现在，这个前提还站得住吗？"

V4发布在即。这是DeepSeek在华为硬件上的第一次大考。如果成了，这家公司就不再只是一个让人眼前一亮的模型实验室，而是中国AI自主硬件通道上的关键一环。如果不成，那个廉价AI的故事就得换个讲法。

从拒绝投资到开口要钱，从英伟达芯片到华为硬件，从技术理想主义到精打细算过日子——DeepSeek的转向说明了一件事：AI竞赛的下半场，比的不是谁更惊艳，而是谁的账单付得起。

账单已经来了。接下来看DeepSeek怎么付。

特约编译金鹿对本文亦有贡献