云计算中场战事,Token变成了「新货币」

图片

■你的Token被用在了哪里,创造了什么价值?
■如何高效、经济地将
输送到千行百业?

■中国AI已逐步从实验室PPT深入到产业实践的关键一跳



  作者|晨曦
编辑|陈秋
另镜ID:DMS-012

2025年的倒数第二天,巧舌如簧的罗永浩和AI智能助手豆包吵了一架。

在和AI助手豆包辩论锤子手机到底做得好不好时,这位以辩才著称的企业家五分钟就败下阵来。他承认:豆包是我见过最会吵架的AI,能吵出心流。

几乎同一时间,央视春晚官宣字节跳动成为官方合作伙伴。但不同的是,结果这番泼天流量的,是字节跳动旗下相对低调的火山引擎,成为了2026春晚独家AI云合作伙伴。

这两件事看似无关,却指向同一个真相。能让罗永浩语塞的豆包,展示了火山引擎的技术高度;而登上国民舞台的火山引擎,正在把这种豆包级智能,输送给千行百业。

前不久召开的火山引擎FORCE 2025原动力大会上,火山引擎总裁谭待公布,豆包大模型日均Token使用量已突破50万亿。这一数字和去年同期相比增长了10倍,目前,豆包大模型调用量已经成为中国第一、全球第三。

图片

而在谭待的演讲中,“Token”被提及的次数是的两倍还多,这暗示着游戏规则已经改变。从能与人辩论的豆包,到支撑春晚的火山引擎,再到每天50万亿次的智能调用,一条完整的链条正在浮现——

AI行业的竞争,正从比拼谁家GPU多、模型参数大,转向一个更实际的问题:你的Token被用在了哪里,创造了什么价值?

图片

Token的含金量究竟多少?

简单来说,Token就是AI思考的脉搏AI每思考一次、每回答一句话、每生成一张图,都要消耗一定数量的Token也代表着机器对人类意图的一次深度拆解。

当整个行业开始像互联网时代比拼日活一样比拼Token调用量时,Token就从技术单位跃升为了衡量AI活跃度与产业渗透率的核心指标。

然而,当全行业开始追逐Token数量时,一场关于其含金量的深刻博弈也随之展开。纯粹的Token数字,能等同于真实产生的智能价值吗?

比如说,一个AI模型,可能要用1万个Token才能完成一份漏洞百出的市场报告;另一个模型,或许只用2000Token就能生成逻辑严谨的版本。谁更优秀?显然不是Token多的那个。同样,消耗在闲聊上的1000Token,和用在诊断工厂设备故障上的1000Token,它们创造的价值天差地别,Token的含金量也完全不同。

同时,现在各大企业公布的Token数,大多只统计了企业直接调用云上API的数量。但现实中,不论是在本地部署大模型的企业,还是汽车、手机等各大终端的AI,这些更深入、更核心的AI应用,消耗着天文数字的算力。但因为不走标准API,它们的“Token大多没被计入,导致整个行业的Token数据,可能只露出了冰山一角。

所以,当一些公司通过免费试用、简单任务来冲高Token数据时,水分就出现了。这些Token看似庞大,却没能真正转化为商业价值。

图片

在这样的数据迷雾中,火山引擎的做法是:承认规则,但重新定义比赛的重点。

他们不否认规模的重要性,日均50万亿Token就是证明。但他们更执着于追问:这些Token最终流向了哪里?

火山引擎给出的答案是,流向了真正创造价值的硬骨头里。数据显示,超过100家企业,在火山引擎上消耗了累计超万亿Token,它们来自汽车、手机、金融、制造等行业。这些Token不是用来闲聊,而是用来优化一条生产线、设计一款新车、分析一份投资报告、或服务千万客户。

换句话说,火山引擎在努力确保AI的每一次思考,都能深入到真实生活与生产中。

事实上,面对数量能否代表价值的根本性质疑,火山引擎内部也有过争论。但他们的最终结论很务实:更多的Token,意味着AI被更频繁、更广泛地使用,这是价值产生的前提。

一个正确的决策或许只输出一个词,但背后可能是数万Token的复杂推演。长期看,Token总量的增长,必然与整体智能价值的增长挂钩。

基于这个判断,火山引擎智能算法负责人吴迪预测,到2030年,国内市场的Token消耗量将是现在的百倍以上。未来,AI将像水和电一样融入数字世界的底层,从写代码到处理视频,催生出百倍于今天的Token需求。到那时,衡量一个企业实力的,将不再是它仓库里囤了多少GPU,而是它的业务究竟消耗了多少Token

火山引擎现在所做的一切,就是在为这个Token为度量衡的未来,提供最高效的“智力工厂”与创新杠杆。

图片

云计算的逻辑变了

而当Token成为衡量AI价值的新尺度,一个根本性问题随之浮现:如何高效、经济地将输送到千行百业?这直接指向了云计算模式本身。

传统的云服务,本质是算力超市。厂商兜售虚拟机、存储桶和数据库,企业像采购原材料一样,租回去自己组装应用。云厂商只保证机器能运转,至于客户用这些东西生产了什么,是否高效并非其关切的核心。

AI时代,这种甩手掌柜模式走不通了。企业需要的不是一堆难以驾驭的GPU,而是开箱即用、能直接干活的AI能力。而火山引擎多次强调的以模型为中心的提出的“AI云原生架构,正是在将云计算的角色从算力零售商重塑为全能工具箱

这种转变,具体体现在三大关键设施的修建上:

第一,打破壁垒,让算力调用门槛从降到应用级。

过去,企业想让AI处理复杂任务,需要自己搭台子——买服务器、搞运维,成本高且风险大。现在,火山引擎把这些复杂的底层操作全部“折叠”了。

以新发布的Responses API 为例,它就像一个任务自动处理器。以前需要写几百行代码去规划、调用不同工具的复杂任务,现在只要发一个指令,火山引擎就能在后台自动拆解并完成。这意味着,企业不再需要盯着底层的服务器动不动,只需要关心AI处理问题的结果。

这种模式让智能不再是实验室里的奢侈品,而是成了随调随用的“通用工具”。同时,也极大降低了企业,尤其是中小团队使用前沿AI技术的门槛和试错成本,使得智能成为了可靠、易得的基础生产力。

第二,提供“模块化”的开发工具降低AI应用的开发门槛。

图片

有了AI能力,如何把它变成业务助手?火山引擎发布的AgentKit平台,就是为了让普通业务员也能变开发者。

在这个平台上,开发者不再需要编写枯燥的连接代码。通过图形化界面,就像“拼积木”一样,拖拽几个功能模块,就能定好AI的逻辑。平台内置了大量“技能包”,比如联网搜索、查数据库、写代码等。你想让AI干什么,就给它装上对应的零件。

通过AgentKit,一个市场运营人员可能只需30分钟,就能组装出一个能自动分析舆情、生成日报的“数字员工”。一个产品团队可以用几天时间,打造出一个深度理解产品知识、能处理复杂售前咨询的专属客服。

这背后的稳定性与安全性,源于抖音、今日头条等亿级产品每日千亿次AI交互的实战打磨,让火山引擎不仅能支撑Token供应,还最清楚如何让Token最稳定、最安全地驱动各种AI应用。

第三,建立“按思考质量计价”的逻辑,让每一Token投入都换回价值。

解决了怎么用的问题,火山引擎还重新定义了怎么买最划算。

如果只是粗放地按字数收钱,其实并不公平。火山引擎创新的计费模式,本质上是在为“思考的深度”定价。其“AI节省计划” 允许企业将不同模型的Token消耗合并累计,享受规模折扣,最高可节省47%的成本。

更具突破性的是,它首创了按思考长度”分段计费。一次简单的问候,和一次需要查阅海量资料、经过多步推理的深度分析,虽然可能产出等长的文本,但消耗的算力截然不同。火山引擎为此设计了不同的费率让企业为“高质量的思考”支付合理的费用,而不是为无意义的字符买单。

图片

这种让利能力,并非凭空而来,而是得益于字节跳动内部独一无二的高压测试场。为了让豆包大模型在抖音等亿级产品里跑得又快又省,火山引擎必须在技术上榨干每一分效率。最终,这些技术红利通过工具化的方式,反哺给每一家想要在AI时代实现突围的企业。

例如,豆包大模型最终选择将所有能力整合进一个统一的All-in-One模型,就是因为来自大量企业客户的最真实反馈:版本太多,我们不知道怎么选。

一切技术决策,最终都收敛于让AI能力的获得和使用更简单、更经济。

图片

全球AI竞赛的第二战场

在全球AI的竞技场上,大家公认比的是能源、算力和应用。

美国目前靠着先发的芯片封锁和恐怖的算力储备,试图把中国AI锁死在底层硬件的军备竞赛里。

但火山引擎的50万亿Token调用量,给出了一个截然不同的突围信号:算力是存量,Token才是活钱;芯片是家底,应用才是生机。

Token规模,正成为全球AI竞赛的第二战场。

首先,面对芯片封锁,最好的防御就是把现有的每一块芯片用到极致。

根据IDC报告数据,火山引擎在中国的公有云大模型的服务调用量上稳居第一,MaaS市场份额从2024年的46.4%提升到了今年的49.2%

“也就是说,在中国公有云上每产生的两个Tokens就有一个是火山引擎生产的。”谭待表示。

50万亿次Token消耗,不是实验室里的跑分,而是千万次真实的业务交互。

当海外还在实验室里烧钱调优大参数模型时,中国企业正通过高频的Token调用,在真实的场景里磨炼AI

图片

2025年,已有超过100万家企业和个人通过火山引擎使用大模型服务,覆盖百余行业。

比如,在Token消耗的头部领域,火山引擎已覆盖超过90%的主流车企。从特斯拉、蔚小理等新势力,到宝马、奔驰、比亚迪等传统巨头,豆包大模型正成为智能汽车的标配。

这些Token的消耗,直接转化为了用户体验的质变。荣威的智能座舱能理解山东味的倒装句指令;奔驰的车机唤醒快至0.2秒,并能感知驾驶员情绪。一句先接同事再去最近的海底捞,放点他喜欢的歌的复杂指令,系统能流畅地完成路线规划、地点搜索与娱乐联动。

在这里,Token不是用于简单问答,而是驱动着从感知、理解到决策、执行的完整智能链条,重新定义了人车关系。

在手机领域,全球前十大手机厂商中,九家选择了与火山引擎合作,超过5亿台设备内置了豆包大模型的能力。Token的注入,让手机从一个被动工具变为主动助理。看到不认识的花,镜头一扫便能识别并推荐养护知识。聊天中提及的餐厅,助手能自动推荐、跳转预订,甚至能理解把微信里那个地址导航过去的跨应用指令。

这背后,是火山引擎将大模型能力封装成可被手机系统高效调用的模块,让AI从云端算力,无缝融入指尖触碰的每一次交互。

在更广阔的实体经济中,Token正成为提升核心效率的新生产要素。 华泰证券基于豆包大模型打造的“AI涨乐,不再是传统的行情查询工具,而是能理解用户意图、提供选股分析、生成投资建议的智能伙伴,将Token消耗直接关联到投资决策的价值链上。海底捞的AI用餐管家将预订环节效率提升30%、制造业客户利用大模型分析海量用户反馈,将产品问题定位从月级缩短到天级。

在这些场景里,Token的消耗紧密捆绑在企业核心业务流程中,驱动了降本增效或体验优化。

汽车座舱、手机系统工厂车间我们是在用极其密集的实战数据,换取算法的快速进化,实现弯道超车。

其次,AI竞争的终局,比的也不是谁的模型更庞大,而是谁的智力更便宜、更管用。火山引擎把Token价格压到极低,本质上是帮中国企业减少了硬件采购成本,以更加轻巧的方式投入这场竞赛。

最后,应用爆发将重新定义中国AI的胜率。

国家数据局数据显示,截至20256月底,中国日均Token消耗量突破30万亿。相比2024年初,一年半时间增长了300多倍。

数字背后,是中国AI已经实现逐步从实验室PPT深入到产业实战的关键一跳。

图片

然而,豆包万亿Token俱乐部中的100家企业,集中在互联网、汽车、金融等行业,也说明了一个问题,全社会的Token消耗量相当不均衡。

AI竞赛的重点,就是要让AI像空气一样渗进产业链的每一个环节和人们生活的每一个细节。如今,越来越多传统行业也面临AI转型需求。比如,做钢铁生产的,想用AI来实时优化高炉的燃烧参数;搞现代农业的,想用AI来分析卫星影像和土壤数据;管理城市电网的,想用AI来预测千万家庭的用电高峰......它们所释放的Token潜力将远超今日。

这也是中国AI面对全球竞争时,最坚硬的一道底牌。

因为未来真正的故事,不在于实验室里的参数增长,而在于这些Token如何在钢铁高炉、田间地头生根发芽,如何在每一个具体业务中定义中国式的智能红利。Token价值标准,也不在消耗数量,而在它能解决多少海外AI“看不见”也“摸不着”的现实难题。