划重点
012025年大模型将继续蓬勃发展,智能体将成为内容、服务和信息的新载体。
02目前,互联网巨头各自建立起较成熟的模型能力,中国大模型创业“六小虎”也相继完成关键融资。
03胡延平认为,2025年大模型竞争将走向两个阵营,企业端市场和消费者端市场。
04除此之外,大模型厂商正在探索新的杀手级应用,如字节扶持的AI视频赛道“即梦AI”。
05颠覆式创新仍有可能出现在大模型领域,如具身智能实时交互的机器人等。
以上内容由腾讯混元大模型生成,仅供参考
2024年收尾时,各家大模型企业相继发布了成绩单。截至2024年11月初,百度文心大模型的日均调用量超15亿次,相较一年多前首次披露的5000万次,增长约30倍;截至2024年12月中旬,豆包通用模型日均tokens使用量超4万亿,较7个月前首发时增长33倍……从一根根陡峭的增长曲线中,我们能看得见大模型的“真需求”。
C端的用户需求爆发,推动大模型发展驶向“高速道”。能确定的是,2025年大模型依然将红红火火。但是,科技的魔力在于它的未知,变幻莫测的未来将带来诸多可能性:2024年大模型的风“煽”火了“豆包”,2025年风又将吹向何方?
智能体“应需而动”
过去的一年,你用大模型做了哪些事?豆包提供的一份数据显示,用户的创意天马行空。有人用豆包练习英语对话,有人做旅行规划,也有人在文档和表格间“无缝穿梭”。
千人千面——大模型的出现,为每个人架起效率的“登云梯”。过去一年,复旦大学管理学院信息管理与商业智能系教授卢向华在ChatGPT4.0、文心一言、豆包、Kimi等多个大模型间“横跳”,从最初的英语校对、中文润色,逐渐转向教研方法的转变。卢向华最近在做“企业数字代理人”的研究课题,感触最深的是大模型对文献查阅、归纳的效率拉升。“过去写一个文件综述,要提前搜索、筛选、总结国内外文献,费时费力,现在只需要输入‘数字代理人的最新主流文献’,大模型就会提供基于集成检索增强生成技术(RAG)的多个选项,并附上原文链接,至少节省70%的精力。”
当大模型调用渗透到一定阶段,智能体近在眼前。“我的不少研究要建模、分析、打标签,每一项研究都可以建立一个智能体。”卢向华坦言,她甚至愿意为此付费——在做最新的企业招聘态度学术研究时,她调用了API接口,将两万条招聘信息导入模型,在此基础上调整参数进行研究,还有不少教授则付费调用算力。“智能体能让研究体量变得更大,可以生成更复杂的实验设计,结论也会更科学。”从一段时间的体验值出发,卢向华认为,2025年将会有更多普通人玩转智能体。
于业界而言,当下各路人马都在寻找基于大模型的超级应用。在百度创始人李彦宏看来,智能体是人工智能应用的最主流形态,即将迎来爆发点,就像PC时代的网站、移动时代的自媒体账号,“在AI原生时代,智能体将成为内容、服务和信息的新载体”。
“2025年大模型的一大趋势,是智能体从概念走向落地。”FutureLabs未来实验室首席专家胡延平也给出相似判断。他认为,智能体接下来不仅意味着AI的个性化,更意味着任务从规划到达成的全过程有了颠覆式重构,是属于每个人“应需而动”的智能助手。
必有“后起之秀”
大模型一夜走红至今,热度已持续两年,丝毫没有下降迹象。
目前,互联网巨头各自建立起较成熟的模型能力,而中国大模型创业“六小虎”也相继完成关键融资,继续留在场内厮杀。但从目前的商业化脉络来看,当下的大模型竞争逐渐走向两个阵营,以商汤科技、阶跃星辰等为代表的大模型全力奔赴企业端市场,而百度、抖音等则将一部分“战力”留在消费者端,寻求通用人工智能的持续进阶。
在胡延平看来,即使是偏C端的大模型,国内外玩家也已形成各有千秋的局面。2025年,在全球的闭源大模型中,他仍看好OpenAI,其最新的推理模型O3再度迈出重要一步,此外,谷歌Gemini、Udio、Claude等分别在长文本、文生音频、代码能力等赛道有望持续放光。而对于中文大模型,他认为,各家的特长逐渐明显。“中文闭源大模型看好文心一言,移动端看好豆包,国产视频生成继续看好可灵,代码能力方面DeepSeek可能还会保持优势,开源大模型方面相信通义千问等会更进一步。”
大模型厂商也在探索新的杀手级应用。在“豆包”之后,字节扶持的另一大头部品牌“即梦AI”已于2024年5月上线,意味着字节重押AI视频赛道。在剪映业务负责人张楠看来,生成式AI可以把每个人脑子里的奇思妙想快速视觉化,让用户观看视频的方式发生变化。“今天人们还在跟随电影节奏去体验剧情的跌宕起伏,未来可以让剧情按照自己的剧本演绎。”
“2025年大模型赛道一定会有后起之秀,谁能抓住用户痛点,谁就能抓住时代机遇。”卢向华认为,当下的大模型发展与10年前的移动互联网浪潮有着很多相似之处,一个行业里必定会有巨头的存在,也一定会出现细分领域的弄潮儿,分工越来越细,但2025年可能出现一轮优胜劣汰,只有前排玩家才有机会做大。
还会有颠覆式创新吗
2025年,大模型的另一个悬念在于:是否会出现颠覆式创新?
胡延平认为有几率出现“重大变数”。他给出判断依据:2024年,大语言模型(LLM)的可用性已到达80分到90分区间,预计2025年会冲上90分,此外,基于实时语音的自然交互也将极大扩展使用场景,在这些综合能力的演进中,智能设备以AI自然交互为基础的超级入口会更清晰,比如,AI眼镜等智能硬件会起潮,AI OS驱动的手机和个人电脑将带来前所未有的体验,也许在不久的将来,“one more thing(另一件事)”又将出现,“现在还不能判断那是什么,但‘AI向实’是必然走向”。
“2025年应该会有更多偏实时交互的系统诞生,让大模型得以与人在各种场合进行交互,而不仅仅限于电脑和手机。”复旦大学计算机学院教授、MOSS大模型项目负责人邱锡鹏认为,未来大模型可能会往具身智能领域发展,与机器人的结合有很大想象空间。他解释道,目前的机器人只能做一些跳跃、抓取等动作,未来可以让机器人与软件进行交互,以更好识别人类的意图。反过来看,现在的大模型也仅仅处于只能听或者只能说的状态,要做到多模态、强交互,还有一段路要走。
但邱锡鹏认为,这个未来不会很远,2025年或许就会有不错的产品问世。他还透露,复旦大学的MOSS大模型今年就有望发布面向具身智能实时交互的模型。
下一个“豆包”会是谁?未知的答案永远让人着迷。正如著名未来学家凯文·凯利所言,颠覆式创新总在你没关注的地方冒出来,如何捕捉AI时代的商业灵光,人们更需要的是颠覆式思考。