日均调用量飞速增长、RAG技术带来幻觉消失……大模型爆发式应用“临界点”到了？

文汇

2024-11-13 06:40发布于上海文汇报官方账号

“过去24个月，人工智能行业的最大变化是什么？”昨天举行的百度世界2024大会一开场，百度创始人李彦宏就提出一个问题，他也给出了自己的体会：大模型基本消除了“幻觉”。这代表了他对于大模型和生成式人工智能（AIGC）当下的认知和判断：随着大模型日均调用量的飞速增长和集成检索增强生成技术（RAG）带来的“幻觉”消失，大模型爆发式应用的“临界点”或许将很快到来。

大模型两个关键变量已现拐点

随着ChatGPT的发布，大模型在令人惊艳的同时，也爆出天生短板——“幻觉”问题。专家认为，所谓“幻觉”问题，通常指一些看似合理但实际上是错误的输出，这可能是因为模型在训练时过度拟合了数据，又或者原始数据来源并不准确可靠。

但在应用者看来，“幻觉”问题是致命缺陷。“你要想基于大模型开发应用，消除‘幻觉’是必须的，如果这个模型总是一本正经地胡说八道，就不会有人信你，就不会有应用。”李彦宏说。

事实上，过去两年中，如何解决“幻觉”问题，一直是国内外科技巨头努力的方向。比如，腾讯AI Lab联合国内外多家学术机构，对“幻觉”的评估、溯源、缓解等进行全面探讨；商汤科技则通过知识库，增强模型对知识更新理解的能力，同时解决幻觉的问题。在诸多探索中，RAG技术在解决大语言模型“幻觉”问题上起到关键作用。

目前，文字层面的RAG已做得很好，但在图像等多模态方面，RAG的结合还不够，让生成的图片“一眼假”。针对这些问题，百度开发了检索增强的文生图技术iRAG（image based RAG），将百度搜索的亿级图片资源与强大的基础模型能力相结合，“整体效果远远超过文生图原生系统，去除了机器味儿”。他现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片，通过iRAG，无论是特定型号汽车的车型车标，还是作为背景的长城，均未出现错误或变形的“幻觉”问题，而且创作成本可以大幅降低。

“消除大模型的‘幻觉’，解决了可信可用的问题，也是AI应用爆发的基础。”在李彦宏看来，今天，基础大模型能力就绪，即将迎来AI应用的群星闪耀时刻。

同时，作为大模型爆发式应用的另一个关键变量——用户习惯和用户渗透率也出现拐点。“截至11月初，百度文心大模型的日均调用量超15亿，相较5月披露的2亿，增长7.5倍，相较一年前首次披露时的5000万次，更是增长约30倍。”李彦宏认为，这根非常陡峭的增长曲线可以代表“AI的真需求”，过去18个月中，这个增速已超出预期，“在我看来，如果大模型日均API调用量能够达到20亿，大模型的未来就成了，而如今的数据已非常接近”。

打造数百万“超级有用”应用

大模型“火”了将近两年，技术以前所未有的速度进行迭代和创新，从大公司，到创业者，再到风险投资，各路人马都在寻找生成式AI时代基于大模型的超级应用。

在AI应用的发展趋势方面，李彦宏表示，智能体是AI应用的最主流形态，即将迎来爆发点，“就像PC时代的网站、移动时代的自媒体账号，在AI原生时代，智能体将成为内容、服务和信息的新载体”。

早在去年10月，百度就发布了智能体机制，其核心是思考模型，包括理解、规划、反思和进化，能够做到可靠执行、自我进化，并在一定程度上将思考过程白盒化。在李彦宏看来，智能体的门槛低、天花板高，既能让人人都上手，又能做出复杂强大的应用。目前，文心智能体平台已吸引15万家企业和80万名开发者。比如，比亚迪的官方智能体上线后，销售转化率提升119%，联想AIPC智能体的9月互动率提升89%。

而更先进的工具也层出不穷。百度昨天还发布无代码工具“秒哒”，用自然语言就能搭建一整套系统。李彦宏总结说，这意味着每个人都能指挥多个智能体来协同完成任务，帮助更多人、更多企业打造出数百万“超级有用”的应用。

　　作者：徐晶卉

文：本报记者徐晶卉图：视觉中国编辑：施薇

转载此文请注明出处。

查看原图 4M