我开始做空大模型公司的股票了

问AI · 大模型公司的算力成本如何颠覆传统估值逻辑?

图片

昨天,我和一个二级市场的基金经理吃晚饭。他问我最近在看什么,我说我在研究做空AI大模型公司。

我还给他举例:港股的一家明星大模型公司,总市值4077亿港元,2025年收入才7.24亿元人民币;另一家上市后股价直接涨了4倍,市值超过300亿美元,而2025年收入只有7900万美元,PS超过380倍。

但他的反应是先惊讶后不屑。"你疯了?"他说,"AI是未来。"我说是,AI是未来,但AI公司不一定是。铁路是未来,铁路公司股票让一整代人破产。电力是未来,电力公司股票二十年后才回到发行价。互联网是未来,1999年买互联网公司的人现在又在哪里?

我觉得今天仍然会一样。

每次技术革命的赢家从来不是技术供应商,而是技术使用者。大模型公司正在被市场错误地当成完美软件公司来定价,但它们的商业结构更接近云计算、半导体工厂、电力公司和咨询公司的混合体。遗憾的是,这些都不是好生意。

市场用"赢家通吃"的范式给大模型定价,但大模型行业的结构性特征,例如核心技术开源、产品能力趋同、竞争格局恶劣、极低切换成本、创新路径未定等等,恰好都不支持这个假设。当技术进入壁垒的下降速度快于价值创造速度时,投资者将成为输家,即使技术本身取得了巨大成功。

你好,我是方醒鹿。

一、你最好真的是一家软件公司

自互联网时代以来,软件公司几乎是人类最好的生意。

我投资过不少软件公司,深知:写完代码以后,多服务一个客户的成本几乎为零。你的工程师已经领工资了,你只需要再多卖一份。这就像餐厅和快餐店的区别。餐厅每多一个客人就要多买食材多雇厨师,快餐店做一个汉堡的成本和做一万个汉堡的边际成本是完全不同的。这就是为什么软件公司能到80%的毛利率,而且规模越大越赚钱。

市场现在给大模型公司的估值,隐含假设就接近最完美软件公司的结构。但大模型公司不是卖软件的,它们是卖计算的、更本质的说,他们是卖能源的。每一次用户问ChatGPT一个问题,后台的GPU就要工作一次,电表就要转一次,数据中心的折旧就要计一次。成本不是写完代码就结束了,而是每次服务都在产生新的成本。用的人越多,成本越高。

更重要的是,大模型公司的成本结构本质上就是所在国的能源结构,具有极强的供给刚性,无法短期快速下行。

OpenAI总裁Greg Brockman日前在法庭上承认,公司预计2026年在计算资源上花500亿美元,计划到2030年前累计投入6000亿美元。惊人的6000亿!相当于每天烧掉将近1.4亿美元,只是为了保持服务不宕机。

没有任何传统软件公司有过这种成本结构。

Salesforce在接近200亿美元年收入的时候,运营利润率已经超过15%。Oracle的云服务毛利率常年稳定在70%以上。而OpenAI的毛利率,至今仍没有公开披露过一个令人信服的、能够覆盖算力成本后仍然显著为正的数字。

如果你给一家公司按软件公司来估值,那它最好真的是一家软件公司。如果它实际上是一家以每次服务都在增加成本的计算服务公司,那这个估值早晚会塌方。

二、技术革命的红利不属于基础设施

如果AI是电力,那做空大模型公司不等于做空电气化,等于做空1910年那批被当成垄断者的发电厂。最终真正靠电赚到大钱的,是通用电气、西屋电气、所有电器的制造商和用电来改造自己业务的工厂。

历史会证明,大模型的技术价值是极高的。但这不等于大模型公司的股权价值同样高。

人们常把"这个技术很重要"和"这家做这个技术的公司值得买"混为一谈。它们是两件完全不同的事。技术的社会价值越大,想分这块饼的人就越多,最终做基础设施的那一层,利润反而被压到最薄。

我只是想强调,市场对大模型公司的定价是基于一套错误的类比。

三、付费深度的陷阱

很多AI投资人在晒大模型公司的增长曲线 ,OpenAI年化收入在2026年初突破300亿美元,年初还在250亿美元左右;Anthropic年化收入从2025年末的90亿美元飙升到2026年4月的约300亿美元;港股大模型明星公司智谱2025年收入增长132%至7.24亿元。

这些数字看起来很美。但增速快不等于收入质量高。你更应该看付费深度,有多少用户真正付了钱?付了多少钱?还会继续付吗?

OpenAI虽然用户规模极大,但付费率是硬伤。据The Information在2025年7月的报道,约3500万ChatGPT周活用户中,购买Plus或Pro的比例仅有5%左右。OpenAI预测到2030年,约2.6亿周活用户中的2.2亿人将转为付费用户,付费率约8.5%。这个数字隐含着从现在到2030年,付费转化要从5%提升到8.5%,幅度看起来不算大,但要建立在用户基数翻几倍的基础上,也就是说绝对付费人数要增长六倍以上。能不能做到?也许。但如果做不到,今天的估值就是基于一场幻觉。

更麻烦的是,传统SaaS的逻辑是,重度用户等于高黏性用户,等于优质客户。在大模型里,重度用户反而是成本最高的用户。你用得越多,消耗的token越多,占用的上下文窗口越大,调用的工具链越复杂。如果模型公司不能按消耗量向用户收取相应的报酬(目前的市场竞争让他们很难完全做到这点),那么最忠诚的用户反而可能是在摧毁毛利。

Anthropic的收入叙事更要小心。Anthropic对外强调"年化收入已超过300亿美元",听起来非常震撼。但这个数字是怎么算出来的?所谓"run-rate"是将最近28天的消费型收入乘以13来年化,再加上订阅收入。这种算法对一个仍处于超高速增长的公司有表面解释力,但脆弱性也一目了然。如果下个月增速哪怕只是从环比50%降到25%,这个run-rate就会瞬间产生巨大的水分。他们实际累计的GAAP收入,从公司成立到2025年12月,总共只有约50亿美元。用纯外推的口径来替代稳定的经常性收入,是泡沫叙事最喜欢的温床。

如果你也有意做空,那就应该盯住三个东西,GAAP收入、净收入留存率、毛利率。不要含糊。如果有人给你推销一个模型公司的股票,你问管理员这三个数字,如果他们说不清楚,那就不要买。

四、定价权幻觉

做软件的人都知道一个残酷的事实。你的产品定价不由你最强的功能决定,而由市场上那个"刚好够用"的替代品决定。

大模型正在以我从未见过的速度走向这个陷阱。

你看看公开定价,OpenAI官网显示GPT-5.5的标准输入价是每百万token 5美元,输出价30美元;但同时推出的GPT-5.4 mini输入价只要0.75美元,输出价4.5美元。Batch API还能再省一半。Google Gemini API的Flash类模型输入价低到每百万token 0.05到0.10美元,输出价0.20到0.40美元。最便宜的模型和最贵的模型价格相差几百倍。

这对模型公司是一个恐怖故事,因为一个理性的客户会怎么做?他会把所有的简单任务,摘要、分类、客服回复、初稿,全部丢给最便宜的模型。只有真正复杂的推理、代码生成、关键决策分析才会调用最贵的模型。这个现象有一个专门的词叫模型路由。它意味着,模型能力的提升不会再带来ARPU的提升,反而大概率会进一步推高调用量、拉低收入单价、压缩毛利空间。

竞争会让未来变成这样一个让你不舒服的分层:

  • 高频低难任务 → 客户用小模型、开源模型、本地部署做 → 收入被压到地板

  • 中频工作流任务 → 云厂商或企业软件内置模型 → 收入被平台抽成收走

  • 低频高难任务 → 才留给旗舰闭源模型 → 单价高,但调用量有限

  • 高风险任务 → 必须人工复核加合规流程 → agent自动化根本进不去

市场在数token消耗量的时候,兴奋地以为这就是未来收入的倍数。但这个世界有一样东西叫结构性降级,客户一边消耗更多token,一边用更便宜的token。用得多,不等于花得多。花得多,不等于赚得多。

更近一步的问题是,模型能力的真正商业价值,正在被"蒸馏"和开源快速扩散。

DeepSeek  V4 pro的最新论文再次显示,它在数学、代码和推理任务上达到了与美国“御三家”旗舰模型相当的表现,并通过开源权重和蒸馏模型免费释放给社区。

这对领先模型意味着什么?意味着一个18到24个月的领先窗口正在缩减到大概3到9个月的滚动领先。你今天发布的最强模型,可能半年后就被追平。一个蒸馏后的开源模型足以应付85%的任务,客户为什么要多付几十倍的溢价去用闭源旗舰?

五、算力合同的永动机

现在,AI产业链还有一个微妙的循环。云厂商投资模型公司,模型公司承诺购买云算力,云厂商确认订单和增长预期,资本市场给云厂商和模型公司更高估值,更高估值支撑下一轮融资和更大算力合同。

这个循环看起来很漂亮,像一个永动机。但问题是,永动机通常需要会计师和投行家站在旁边不停鼓掌。

OpenAI与Oracle签署约3000亿美元、为期约五年的算力采购合同。 Reuters还报道称,Anthropic承诺五年内向Google Cloud和芯片采购约2000亿美元资源;Alphabet还被报道将向Anthropic投资最高400亿美元。

这些合同的风险在于收入、融资、客户承诺和资本开支互相支撑。它们共同构成一个庞大预期系统。系统稳定时,每一方都能讲出美丽故事。模型公司说需求爆炸,云厂商说backlog强劲,芯片公司说供不应求,数据中心说容量紧缺,投资人说这次不一样。

如果收入兑现慢了呢?如果订阅付费率上不去呢?如果企业客户规模化部署比预期更慢呢?如果模型价格被打穿呢?如果融资市场冷下来呢?

那时,合同仍在那里。电费仍在那里。GPU折旧仍在那里。数据中心仍在那里。资本开支是一个很讲信用的朋友,它会准时来找你。

大泡沫都不是完全靠假故事撑起来。很多泡沫建立在真实需求上,只是把真实需求乘了一个过于热情的倍数。

六、最终赢家会是谁

科技史上,真正能留住价值的大多不是核心技术的发明者,而是掌握工作流和控制客户关系的人。

如果你研究一下电力、互联网和移动通信的历史,这是最一致的规律。电力改变了所有行业,但电厂不是资本市场里最赚钱的资产,钱流向了电器、工业自动化、消费电子和平台型公司。4G、5G改变了连接,但真正赚钱的是微信、Uber、Netflix和TikTok,不是基站供应商。

大模型很可能也会沿着同一条路前行。

你可能会反驳,大模型公司现在有了新的商业叙事:去年底AI coding的能力突然指数级增长,今天从龙虾到爱马仕,Agent开始全面爆发,未来可能完全颠覆现有应用入口与交互模式。

我承认,Agent对生产力、信息获取、软件交互的影响很大;但它对“入口级应用”的替代能力,可能远低于资本市场最激进的想象。

其中,像信息搜索、知识问答、内容初稿、轻量办公、初级代码、客服机器人、低端数据分析、部分教育答疑等等,这些入口原本就偏“信息中介”,Agent的替代效率很高。

但在社交、支付、电商、本地生活、短视频、企业ERP、金融交易、医疗系统、游戏社区等领域,这些入口不只是信息入口,还有关系链、账户体系、供给网络、履约能力、监管责任和沉没习惯,Agent难以击穿。

也就是说,AI会改造入口,但未必夺走入口。Agent会进入流程,但未必成为新入口。模型公司会很重要,但未必最赚钱。

关键入口级应用有长期沉淀的核心资产,如用户关系、身份体系、支付账户、社交网络、交易闭环、内容供给、商家供给、组织权限、历史数据、默认位置。Agent强在理解和生成,弱在这些资产。

Agent很容易成为“超级操作层”,不容易直接成为“终局入口”。用户可能会说:“帮我订机票”“帮我买咖啡”“帮我整理报表”。但最后执行动作,还是落到携程、星巴克、美团、Excel、SAP、银行系统里。

此外,在很多领域里,Agent比聊天机器人更难商业化。因为它不能出错。

你的ChatGPT说错了话?你再问一次。你的Agent发错了邮件、下错了单、删错了数据、触发了违规交易?你被开除了。

越靠近真实业务,Agent越需要权限管理、审计日志、回滚机制、责任归属和人类复核。这些东西全都烧时间烧预算,而且一个都省不掉。

七 、版权、监管与合规成本

早期互联网公司有一个隐性红利:先做大,再解决版权、隐私、监管和社会责任。AI公司也走过类似路径。先训练,先发布,先增长,先融资。等版权人、监管者、法院、媒体、行业协会一起找上门,再说“我们正在认真对待”。

现在,账单开始出现了。

Anthropic同意以15亿美元解决作者版权集体诉讼;截至2026年4月,近12万名作者和版权持有人申请参与该和解,覆盖作品中约91%已被申领。 2026年5月,Elsevier、Cengage、Hachette、Macmillan、McGraw Hill等出版商又在纽约起诉Meta,指控其未经许可使用图书和期刊训练Llama;Meta表示将抗辩并主张合理使用。

同时,全球各地政府的监管政策也进入实操阶段。

这些风险会持续挤压利润率和迭代速度。未来模型公司可能需要训练数据来源披露、版权补偿、模型安全评估、系统性风险报告、外部审计、地区化数据处理、高风险场景责任保险、模型输出追踪和申诉机制。

这些词每个都很无聊。无聊的东西常常最贵。

创业者讨厌合规,是因为合规不会让产品变酷。投资人也不喜欢合规。但到了某个规模,合规就像重力。你可以抱怨重力,但不能对着重力发新闻稿。

版权问题还有一层商业含义。如果高质量数据越来越需要付费,模型训练成本会变得更像内容采购成本。最早一批模型享受了“互联网公共矿场”的红利,后来者可能面对一个更贵、更碎、更法律化的数据世界。数据越值钱,免费午餐越少。

八、公用事业化的宿命

很多人以为AI越普及,模型公司利润越爆炸。我倾向于相反的判断:AI越普及,模型层越可能被公用事业化。

技术公司最喜欢的叙事是:谁掌握核心技术,谁拿走最大利润;但商业史里,核心技术和最大利润经常分家。电改变了所有行业,但最赚钱的不是电厂。互联网协议改变了世界,但TCP/IP无法上市。开源软件支撑全球互联网,很多开源项目维护者还在为服务器账单发愁。

未来,AI成为每个软件、手机、操作系统、云服务、办公系统、电商平台、内容工具的基础能力后,用户可能会逐渐失去对模型品牌的感知。

没有人走进咖啡店会问:“你们用的是哪家电厂的电?”只要灯亮、咖啡机能转、账单别太贵,客户不关心电力品牌。模型也可能走向这个方向。企业会要求稳定、便宜、可替换、可审计。模型供应商会在后台竞争,前台属于应用和工作流。

大模型可能成为基础设施,但基础设施不自动等于垄断利润。基础设施经常意味着重资本开支、强监管、标准化、价格压力、客户议价权和公共责任。

当然,少数大模型公司可能通过入口、生态、企业工作流和自有应用逃离公用事业化。谁能牢牢占据用户心智和工作流,谁才有机会拿到更厚利润。但纯模型层、纯API层的公司,会越来越难讲高毛利的故事。

AI的最大社会价值,可能会流向应用、平台、云、芯片、数据拥有者、垂直软件、企业自身流程优化。模型公司会拿到一部分,但不是最大的一部分。

谢谢你坚持看到这里。

祝你也做空愉快。

作者声明:个人观点,仅供参考