1.过去四个月,AI领域技术迭代迅速,基础模型淘汰赛悄然打响,开源模型继续狂飙,推理能力跨越式进化。
2.MCP和A2A协议引发技术平权运动,降低AI应用门槛,催生更多创新。
3.国产算力加速突围,全球投资降温,AI硬件领域的资本门槛提高,市场集中度可能加剧。
4.AI应用从炫耀技术转向解决问题,垂直领域落地加速渗透,比拼行业Know-How的理解深度和场景落地的执行力度。
5.原生多模态与世界模型迈出关键一步,AI真正开始理解物理世界,为通用人工智能(AGI)奠定基础。
以上内容由腾讯混元大模型生成,仅供参考
作者 林易
编辑 重点君
如果你也感觉AI圈的时间流速快得让人窒息,那么恭喜你,我们都有同感。
短短四个月,AI领域风起云涌,技术迭代的速度堪比坐上了火箭。从底层算力,到基础大模型,再到遍地开花的AI应用,AI几乎以天为单位在进化。几个月前,没人会想到,来自中国DeepSeek们煽动的翅膀,会产生如此剧烈的蝴蝶效应。可以肯定的是,大浪淘沙,真正的好戏才刚刚开始。
这也是《划重点》开始制作「大模型月报」的原因。以后我们会每月为您梳理那些不容错过的AI趋势,从中找到通向未来的答案。
这次,我们复盘了过去四个月AI算力、模型和应用等方面的进展,关注到5个关键变化。如果有任何遗漏,欢迎您在评论区留言。以下是「大模型月报」首期:
| 变化一:基础模型淘汰赛打响,开源模型继续狂飙,推理能力跨越式进化
过去两年,百模大战的盛况还历历在目,但进入2025年,一个残酷的现实摆在面前:基础大模型的“淘汰赛”已经悄然打响。
海外,OpenAI GPT系列在年初再次提升了逻辑推理和复杂任务处理能力,尤其是在数学、编程和科学文献理解方面。Google Gemini系列、Anthropic Claude 3家族(特别是Opus版本)也紧随其后,不断优化模型性能和安全性。
国内,DeepSeek还没发布的新版大模型R2,仍是期待值最高的存在;2024年因战略失误落后的玩家百度,凭借文心4.5及文心X1系列,又重新坐回了牌桌。目前基本是“1+4+N”的格局:1是DeepSeek;4是阿里、百度、字节和腾讯;至于N,玩家还未稳定。
然而,聚光灯之外,许多缺乏核心技术、清晰商业模式或强大资金支持的中小模型项目,在过去四个月里逐渐声量减弱,甚至黯然离场。市场开始意识到,通用大模型的门票,不是谁都能轻易拿到。
开源模型继续狂飙。Meta的Llama系列在第一季度如期更新,继续扮演着开源生态的“压舱石”,为全球开发者提供了强有力的基座模型。Mistral AI、Cohere等明星开源力量也持续贡献高质量模型。
中国开源力量中,阿里Qwen3系列全量开源,阿里也凭借较早确立的开源路线,在模型大战中后来居上;而DeepSeek最新模型Prover-V2-671B以88.9%的数学定理证明通过率,进一步验证了“小预算撬动高性能”的可能性。
但值得注意的是,单纯追求“开源”名号而缺乏维护和迭代的低质量项目,正被社区快速抛弃。开源社区开始更加注重模型的实用性、效率和可信赖度,而非仅仅是又一个新模型。
推理能力跨越式进化。如果说过去的模型在“知识广度”上做文章,那么今年初的趋势是,头部模型在“推理深度”上取得了显著突破。无论是通过更优化的训练方法(如强化学习从人类反馈RLHF的进阶版)、更精巧的模型架构(如混合专家MoE的成熟应用),还是对“思维链”(Chain-of-Thought)乃至更复杂的“思维树”(Tree-of-Thoughts)等推理策略的深度融合,使得顶尖模型在面对多步骤、需要复杂逻辑判断的任务时,表现得更像一个“会思考”的伙伴,而非简单的“复读机”。
大模型领域正从“人人都能参与”的普惠阶段,进入到“强者恒强,优胜劣汰”的整合阶段。对于大模型玩家而言,要么拥有绝对领先的技术和资金,要么在特定领域或特定能力上做到极致,否则生存空间将急剧压缩。开源模型的重要性愈发凸显,但其发展也更趋理性。
| 变化二:AI从内卷参数转向建立生态,MCP、A2A掀起“技术平权运动”
曾几何时,千亿、万亿参数是衡量大模型实力的重要指标。但进入2025年,业界风向大变:单纯的参数内卷正在被建立生态取代。
过去四个月,最受关注的是MCP、A2A协议,MCP即模型协作协议(Model Collaboration Protocol)、A2A即智能体间协议(Agent-to-Agent Protocol)。这两个略显生僻但可能极具颠覆性的概念,开始在技术社区和行业会议中被频繁提及。
MCP技术源自Anthropic ,旨在让不同来源、不同架构、不同特长的AI模型能够像乐高积木一样,通过标准化的接口和协议高效协同工作,就像一个USB接口或者说万能插座。比如,一个擅长文本理解的模型,可以无缝调用另一个擅长图像生成的模型,共同完成一个复杂的图文创作任务。
A2A则更进一步,致力于为不同AI智能体(Agent)之间的自主交互和协作制定规则。未来,你的个人AI助手或许能直接与航空公司的AI客服自主协商,完成改签任务,无需人工介入。 这些协议的早期草案和开源实现,在年初的一些开发者大会上(如FOSDEM或特定的AI工作坊)引发了热烈讨论。
MCP和A2A的出现,不仅仅是技术上的创新,更可能引发一场“技术平权运动”。当中小型开发者或企业无力从零开始构建一个全能的巨型模型时,他们可以通过这些开放协议,调用和组合生态中已有的、更专注、更经济的多个模型或智能体服务,形成强大的复合能力。这无疑将极大降低AI应用的门槛,催生更多创新。
这种趋势意味着AI行业的关注点,正从“我拥有多强的模型”转向“我能用AI解决什么复杂任务”。生态的价值在于,通过协作和组合,实现单个模型难以企及的复杂目标。总结一下,就是从模型为中心到任务为中心。
AI的未来不再仅仅是少数巨头的独角戏。通过开放标准和协议构建的协作生态,有望让更多参与者共享AI发展的红利。就像移动互联网时代,iOS、安卓生态的建立,让APP开发者都有公平的机会从中受益。
| 变化三:底层算力军备竞赛白热化,国产算力加速突围,全球投资降温
AI的发动机算力芯片,战略地位在过去四个月有增无减。
NVIDIA王者依旧,而AMD/Intel等老对手也紧追不舍。黄仁勋的NVIDIA在GTC 2025上再次“秀肌肉”,Blackwell架构的B100/B200 GPU开始规模化出货,性能参数继续领跑。同时,对下一代架构的展望也吊足了市场胃口。AMD凭借其MI300系列的迭代产品,在特定AI负载上持续攻城略地。Intel的Gaudi 3也凭借其性价比和开放性,在一些云服务商和企业客户中找到了增长点。
当然,两者都对老黄构不成威胁,H20被禁运中国才更让他头疼,毕竟中国市场占英伟达全球营收近20%。
面对日益复杂的国际环境和对供应链安全的考量,国产AI算力突围在过去四个月也明显提速。华为昇腾系列在支撑国内大模型训练和推理方面扮演了更核心的角色,生态适配和工具链建设取得积极进展。其他本土AI芯片公司,如壁仞科技、摩尔线程、燧原科技等,也在特定应用场景中持续投入,努力提升产品性能和市场认可度。
一个值得注意的现象是,相比中国GPU市场的供不应求,受业务周期影响,全球算力投资又放缓了一些。市场调研机构 Semianalysis 称,过去两个季度,微软放弃远超 2GW 功耗的数据中心租赁合同,近期又冻结 1.5GW 自建数据中心项目。这些项目原计划在 2025 年和 2026 年投入使用。作为对比,马斯克旗下 xAI 建设的大型数据中心,刚开始功耗大约 0.5 GW。亚马逊等大厂也在暂缓租赁更多数据中心。英伟达的股价持续波动,今年以来已下降近20%。
此外,全球范围内针对AI硬件初创企业的风险投资,在2025年第一季度似乎出现了一丝“降温”迹象。经历了前几年的狂热追捧后,投资者变得更加谨慎,更看重初创企业的技术壁垒、商业化能力和短期盈利前景。这或许意味着,AI硬件领域的资本门槛正在提高,市场集中度可能进一步加剧。
算力依然是AI发展的核心瓶颈与竞争焦点。国际巨头的技术迭代和生态壁垒短期难以逾越,但国产算力的自主化进程,也在国家战略和市场需求的双重驱动下全力冲刺。投资风向的微妙变化,则预示着AI产业正从「讲故事阶段」过渡到「见实效阶段」。
| 变化四:AI应用从炫耀技术到解决问题,垂直领域落地加速渗透
如果说2024年是AI应用的“体验年”,那么2025年则是AI应用的“实用年”。
过去四个月,市场对AI应用的评判标准发生了显著变化,AI应用从炫耀技术转向解决问题。单纯的“酷炫”功能已不足以打动用户和企业,能否切实解决行业痛点、提高生产效率、降低运营成本,成为衡量AI应用价值的“金标准”。
AI在垂直领域渗透多点开花。比如:
医疗健康:AI辅助影像诊断系统在更多医院试点,AI驱动的新药研发流程进一步缩短,个性化健康管理方案开始出现。
金融科技:更智能的量化交易模型、更精准的风险评估与反欺诈系统、更具个性化的智能投顾服务加速落地。
工业制造:基于机器视觉的AI质检、设备的预测性维护、智能排产与供应链优化,在智慧工厂中得到更广泛应用。
教育科研:AI个性化辅导系统、科研文献智能分析与综述工具、实验数据智能处理等,正在改变教与学、研与创的方式。
内容创作与营销:AI生成内容(AIGC)工具从单一的图文生成,向更复杂的视频、3D模型、交互式内容创作拓展,并深度嵌入营销自动化流程。
一批真正围绕AI能力构建核心功能和用户体验的“AI原生应用”开始涌现,它们不再是传统软件的“AI+”补丁,而是从底层逻辑上就体现出AI驱动的特性。
现阶段的AI应用,比拼的是对行业Know-How的理解深度和场景落地的执行力度。谁能率先在垂直领域打造出可规模化复制的成功案例,谁就能掌握下一阶段的竞争主动权。
| 变化五:原生多模态与世界模型迈出关键一步,AI真正开始理解物理世界
毫无疑问,让人工智能看懂、听懂并理解我们这个复杂物理世界,是通往通用人工智能(AGI)的必经之路。过去四个月,AI在这一征途上迈出了关键一步。
此前的多模态模型更多是不同模态信息的“拼盘”,而最新的进展是,模型正在学习更深层次的跨模态关联和因果推理。例如,模型不仅能根据文本生成连贯的视频,还能在一定程度上理解视频中物体的交互逻辑和物理属性的合理性。一些研究开始探索让模型同时处理文本、图像、音频、视频乃至触觉、运动等更广泛的模态数据。
同时,「世界模型」研究也取得突破性进展。Yann LeCun等AI巨擘力倡的「世界模型」(World Models),即让AI学习并内化物理世界的运行规律。在过去这段时间不再仅仅是理论探讨,一些顶尖实验室(如DeepMind、FAIR及部分高校)展示了其原型系统在模拟简单物理环境、预测物体运动轨迹、甚至理解基本因果关系方面的初步但令人鼓舞的能力。这些模型通过观察海量视频数据或在虚拟环境中进行交互学习,开始构建对现实世界的“直觉”。
此外,具身智能(Embodied AI)迎来新进展。大模型的进步,为机器人技术和自动驾驶等具身智能领域带来了新的曙光。当AI大脑能够更好地理解物理规则和环境动态,机器人才有希望在复杂、非结构化的真实环境中更自主、更智能地执行任务。我们看到,一些结合了大语言模型和世界模型的新型机器人控制架构开始出现。对于国内读者来说,宇树机器人、机器人马拉松,这些热点新闻,让我们对理解这个领域有天然优势。
总之,AI正从对符号世界的“统计学理解”逐步迈向对物理世界的“认知理解”。虽充满挑战,但意义深远。一旦AI真正开始理解物理世界的运作方式,其赋能范围和深度将发生质的飞跃,催生出今天难以想象的新应用和新产业。
| 结语:AI的终极价值是回归“人的尺度”
盘点至此,AI技术浪潮的汹涌澎湃已无需赘言。但越是在技术高歌猛进之时,我们越需要冷静思考一个根本问题:AI的终极价值是什么?
答案或许很简单:回归“人的尺度”,真正为个体、为社会创造可感知的价值。AI并不会自动改变世界,只有当它被有效地应用到具体场景中,被人真正用起来,融入到日常工作与生活,它的革命性力量才能释放。
下个月,我们或许将见证更惊人的突破,毕竟在AI世界,唯一不变的就是永远在变,而且是光速变化。
重点君也会一直关注AI,记录我们所处的这场伟大的技术浪潮。如果你对内容感兴趣,可随时和我们交流。