一年一度的百度世界大会,已经成为观察百度AI战略动向以及行业趋势的一个窗口。
在2024百度世界大会上,李彦宏看起来比去年更为笃定。他说,基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。
当2023年下半年大模型混战逐渐出现分野,李彦宏就提出「卷模型不如卷应用」。但从随后的行业发展动态来看,国内应用之「卷」集中在了类ChatGPT的AI助手层面,其他领域出现颠覆式创新的AI应用凤毛麟角。
其中一个原因,创新是有认知门槛的,开发AI应用也是有技术门槛的。
或许是意识到了这一点,李彦宏和百度今年进一步向大模型战略聚焦,押注智能体的爆发。
如果现在要问百度的第一性原理是什么,答案越来越清晰——应用驱动。李彦宏还给这个「应用驱动」加了一个有别于移动互联网时代的注解,「不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。」
01
「做工程不丢人」
过去24个月,万众期待的AI超级应用还是没有踪影。一些人不禁怀疑:全球性的大模型狂热究竟是一场新的技术革命,还是新一轮泡沫?
但如果默念茨维格在《人类群星闪耀时》中所写的:「那些历史的尖峰时刻都需要太长的酝酿时间,每一桩影响深远的事件都需要一个发展的过程」,旁观者或许会更笃定一些。
作为这股AI浪潮最早和最深的参与者,李彦宏提前看到那个「尖峰时刻」。他对AI应用即将爆发的判断,主要依据有两个:
其一,底层技术突破。过去24个月,AI行业最大的变化是大模型基本消除了幻觉,回答问题的准确性大幅提升。基于检索增强技术的进展,百度年初切入iRAG(image based RAG)——即检索增强的文生图技术,进一步让文生图也能消除幻觉,从而让AI在影视、漫画、连续画本、海报制作等领域落地。
▲根据「爱因斯坦在天坛」提示词生成的图片 左为文心iRAG作品 右四均为其他大模型生成作品
其二,大模型调用量爆发,开发者觉醒。今年5月,文心大模型API日调用量达到2亿。当时百度高管们在会上讨论一个问题,大模型怎么就算「成了」?李彦宏给出的量化指标是,日均API调用量一年内涨10倍。这说明大家是真需要。到11月初,文心大模型的API日调用量超过15亿,比预期发展快了不少。
还有一个现实原因是李彦宏会上并未展开的——调用成本。过去两年内,大模型每个Token的使用成本下降了超过 99%。以美国为例,现在大模型处理100万个Token的成本仅为60美分。在国内,百度的一些模型甚至免费提供。
从会上传递的信息来看,百度目前重点押注两大应用方向:面向to C端的智能体,以及面对to B端的产业应用。
据我们观察,在to C端,大模型技术应用的广度可能比技术乐观派的预期还要高,因为许多使用场景并不局限于App等传统产品形态。
比如我的一名律师朋友,有时会让AI帮着做一个简单的法律协议,他自己改改就能交给客户。如果是其本人拟这份协议,最起码要用半小时。完成这一交互,他甚至不用专门下载AI工具类App,只通过一个法律行业公众号就能轻松获取。
可以说,AI应用场景无处不在,但产品形态未必跟从前一样。去年在大模型爆发之初,人们就憧憬着AI的iPhone时刻将在大模型领域复刻,诸如移动互联网时代的《愤怒的小鸟》、Instagram等超级应用,也会很快在大模型领域出现。
一年后,超级AI原生应用还没有出现,但新的共识逐渐形成:智能体将会成为AI应用的主流形态——
数月前,OpenAI发文称,在谷歌、苹果等科技巨头的带动下,2025年将是AI Agent最终成为主流的一年。在百度世界大会上,李彦宏再次给出智能体的判断:智能体是大模型最重要的发展方向,即将迎来它的爆发点。
按照AGI的进化顺序框架,智能体被视为Copilot的下一个阶段,它们具备一定自主性,能够执行长期任务,比如与环境进行多次交互、协同工作等,并且拥有自我进化能力。
目前全球很多顶尖科技公司都在关注智能体,但李彦宏在会上透露,百度已经把智能体作为大模型的最重要战略方向。
理由就在于,智能体的门槛足够低,天花板又足够高。去年行业已经意识到应该卷应用,但具体怎么做、怎么从模型变成应用,这里面有太多不确定性,也让很多人望而却步。从移动互联网时代的产品形态变化来看,每一次降低产品门槛,都会带来一个应用范式的爆发。最典型的是从App到小程序的迁移,微信生态从中受益匪浅。
智能体也有相似之处。当平台为开发者提供了一个高效、简单的路径,在大模型上构建智能体越来越方便,「势」就会汇聚起来。像文心智能体平台上,目前已吸引了15万家企业和80万名开发者,每周都有上万个新的智能体被创造出来,其中还有11岁小学生创造的智能体,然后通过搜索和其他渠道分发出去。
不过从李彦宏的发言来看,百度不是要推出一个超级应用,而是要帮助更多人、更多企业打造数以百万「超级有用」的应用。
言外之意,百度在AI时代的生态护城河宽度,未来要靠这些应用来构建了。
由此就不难理解,为什么AI领军人物中没有比李彦宏更着力于应用落地的人了。百度的AI优势,更多体现在底层技术和模型层。而技术的成功与否,最终取决于它在真实生活中的应用。就像DeepMind 创始人、微软AI CEO苏莱曼在最近的一次交流中所强调的,一个没有明确用途的AI模型,不过是一个引人入胜的计算机科学展示。
02
「自由画布」式的智能体开始涌现
智能体的爆发离不开「有用」。
李彦宏此前提醒,要避免掉入「超级应用」的陷阱。在AI时代,「超级能干」的应用恐怕比只看DAU的「超级应用」更重要。
结合国内主要智能体平台上的案例来看,目前公司类智能体、角色智能体、工具类智能体、行业智能体是几个主要发展方向。
这其中,公司类智能体被认为是于AI时代的公司官网。结合百度的搜索引擎底色,我们认为,这一类智能体是百度搜索的增量机会所在,公司类智能体是百度升级与KA客户关系、提供更多价值的一个触点。
据百度官方数据,比亚迪的官方智能体上线后,销售线索转化率提升了119%。
不过在整场世界大会中,参会者最感兴趣、最能让人眼前一亮的当属工具类智能体「自由画布」。这个由百度文库和百度网盘联合发布的AI创作新物种,在面向公众开启邀测首日,已吸引超20万人排队预约。
根据现场演示,「自由画布」就是一个由文心多模态大模型加持的万能白板,是百度文库、百度网盘行业首创的内容操作系统。
通过大模型技术,「画布」打通了公域与个人授权的私域内容,通过「一拖一圈」的极简操作,实现对多格式、全模态文件的混合理解、生成、创作,并支持对富媒体文档的一键分享和存储,实现了输入、编辑、创作、分享自由。
今年9月,百度集团宣布,网盘C端业务重新划归移动生态事业群组(MEG),并由百度副总裁、文库事业部负责人王颖接管。如果当时不少人还对这一决策逻辑感到不解。如今「画布」揭幕,通过AI能力进一步打通和重构,文库和网盘已经成为全新的智能生产力。
在上述四类智能体中,从商业化角度,《降噪NoNoise》同样关注行业智能体的前景。仅以保险行业为例,此前有专注大模型to B方向的AI创业者告诉我们,在这个30万亿规模的市场,部分保险经纪人的佣金能占到客户投保金额的20%-40%。如果大模型将保险专业知识沉淀为AI产品,继而能在一些简单险种上为客户制定投保方案,会非常有前景。
比如号称「免费AI律师」的法律智能体「法行宝」,上线半年已经回答超1660万个法律问题。产品信息显示,该智能体由百度自己下场创造的,主界面提供对话交互以及法律计算器、智能法律文书、在线法律意见书等免费工具,还有相似判决案例链接可以查阅。
比如用户可以就一起交通事故、一次工伤,询问赔偿方案、如何计算索赔金额,也可以请智能体代写一份起诉书。以往有这些法律咨询方面的需求时,普通人要么付费求助于专业律师,要么自己在繁杂的互联网中搜索,但要同时承担信息不全或者不准确的风险。
当然也有律师指出,基于专业知识积累和个人经验而提出的法律策略、分析判断等专业法律服务,是AI目前还很难做到的地方。
换个角度想,这或许正是智能体未来的想象空间,因为智能体本身是一个有自主性、会持续学习和进化的产品形态。
不过有必要指出的是,并非基础设施齐备了,就会出现智能体的涌现。一个应用方向的爆发,离不开清晰的商业化刺激。2012年,当《愤怒的小鸟》登陆iOS平台并且大获成功后,通过iOS端的下载付费和安卓端的广告植入,其背后的游戏开发公司当年收入较上一年增长101%,达到1.5亿欧元。
关于这一点,OpenA联合创始人山姆·奥特曼也有预警。在最近一次专访中,他不忘提醒创业者:通过更快地拥抱新技术,你可能会获得短期的爆发式增长,但长期来看,你仍然需要构建一个能持续提供价值的产品或服务。「每个人现在都能做出非常棒的演示,但要真正构建一个成功的商业,那才是关键所在。那是最艰难的部分,而商业规则仍然适用。」
据我们了解,目前文心智能体平台已经逐步跑通商业闭环,实现智能体从开发,到分发,再到变现。单个智能体的单次转化最高收入达到了10万元,其背后是链接挂载、商品转化、线索转化、联盟广告和胶囊位等商业组件的全方位支持。
03
长期主义、理想主义、现实主义缺一不可
中美AI巨头经常被拿来对比。相比美国AI同行对于AGI的宏大愿景、以科学研究和底层突破为驱动的做法,从世界大会上的表态来看,百度是典型的工程思路、应用驱动。
会后接受《甲子光年》专访时,李彦宏直言,「做工程不丢人。做工程很有可能是比科学更早发现机会、发现规律的。」就像飞机是先飞上天了,人们才开始研究,原来有一个东西叫空气动力学。所以百度的AI路线是优先解决大家在场景和应用中遇到最多的技术问题。
乍看上去,这与李彦宏的社会标签有一定反差。百度10年1700亿研发投入的故事已经为公众所熟知,李彦宏的「长期主义」、「未来主义」标签也早已得到业内认可。
比如去年9月,李彦宏同马斯克、黄仁勋、奥特曼一起入选《时代》周刊全球AI领袖时,《时代》的评语就是,「李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。」在近期沙利文发布的《2024年全球AI生态全景概览》报告中,百度被列入AI-Native Giant,与谷歌、OpenAI位于同一象限。
未来主义少不了理想色彩,但应用驱动的策略看起来又很现实。
看似矛盾的地方,或许取决于参与者如何看待人工智能革命的本质。如果AI会带来一次新的工业革命,那这场变革不是三五年就能结束的,可能会在未来几十年持续向社会的方方面面去渗透。作为置身其内的变革参与者,既需要耐心,也少不了源源不断的、真金白银的投入,然后以商业上的成功、生态上的高墙,保持在全球竞争中的头部位置。
正如李彦宏在此前受访时所预判的:未来两到三年,AI竞争会非常激烈,「至于说谁会是最后的赢家,我的看法是谁赚钱谁就能活下来。」
这或许是李彦宏不厌其烦的布道、呼吁大家做智能体、把AI用起来的一个初衷;也是百度一边自己下场做「自由画布」「法行宝」等智能体应用,一边做工具、做基础平台,不断去降低开发者应用开发门槛的动机。
比如世界大会上的另一个重磅发布——无代码开发工具「秒哒」,这个被李彦宏称为「迄今为止人类历史上最复杂的多智能体协作工具」,为的就是让每个人都具备程序员的能力,会说话就能做出应用。此前在设计领域,海外的Cursor和Replit等产品已经实现在不敲代码的情况下,只靠用户的自然语言指令就能生成应用界面。
这类工具又个共通的底层逻辑——让普通人靠创意就能赚钱。如果类似想法能够落地,AI应用无疑距离大规模爆发更近一步。我们也注意到,尽管「秒哒」明年一季度才会上线,据悉已经吸引超过5000家企业排队测试。
沿着前面的思路,同样可以理解百度为什么没在OpenAI的Sora惊艳出场后,投入到中国版Sora的竞争当中。在李彦宏看来,Sora和多模态是两回事。Sora本质上是任意场景下的视频生成能力,这件事非常有意义,但真正做到需要长期烧钱。
但这并不意味着百度不做多模态,「我们非常非常看好多模态,也在多模态上有非常长期的投入,在真正有应用场景的地方,我们的多模态能力是非常强的。」 百度只是选择更落地的方向推进。比如「自由画布」,便是多模态AI功能all in one的平台。
李彦宏在大会当日的专访尾声被问及有何寄语,他谈到,人工智能的革命不是三五年就结束,它更像是三五十年对于社会的全方位重构。需要长期主义、理想主义和现实主义三者相结合。
对于百度来说,未来与现实,或许正是AI战略的一体两面。
参考资料:
[1]《对话李彦宏:应用驱动是百度的第一性原理,基础模型两年一个大版本就够了》,甲子光年