在大语言模型狂飙式发展近两年后,智能产业界的兴奋点转向了全新的领域——AI Agent(智能体,或智能代理)。
2024年5月,谷歌Deep Mind在其年度I/O大会中发布全新多模态AI助理Project Astra,用户可在手机上打开Astra观察现场环境并进行问答,展示了多模态AI助理在实时视觉识别和低延迟语音交互方面的能力。在Astra发布的前一天,OpenAI已发布了被普遍认为是智能体雏形的GPT-4o模型。
11月,在刚刚落下帷幕的里斯本Web Summit,来自我国的AIoT企业特斯联亦重磅首发了其联合国际智能奢侈品品牌BUTTONS共同打造的多模态通用智能体——“Hali”。不同于Project Astra和GPT-4o, Hali有具体的形象、声音;与Astra和GPT-4o相似,依托其模型能力,Hali能回答问题,更能解决困难。当被问及Hali区别于其他智能体的核心特点时,特斯联创始人兼CEO艾渝强调,“在于协作能力。Hali是相较于垂类智能体更高维的存在,她能够承接需求、抽象需求,并能为完成需求搭建团队、统筹多个智能体合作从而达成目标。”
11月Web Summit在里斯本落幕
那么智能体究竟该如何理解?其发展又呈现出怎样的趋势?
降低LLM使用门槛,
智能体有望成为下一代AI原生爆款应用
尽管当前LLM已经具备了突破性的性能,但要想让它给出精准的回答,则还需要足够精准的prompt。一个掌握prompt技巧的人和一个不具备相应能力的人使用同一个大模型提出问题,其得到的答案通常大相径庭:前者可以采用相应策略得到期待的结果,而后者的大模型则极大可能答非所问。这使得,prompt在增加LLM使用难度的同时,也降低了用户的体验,甚至催生了prompt engineer(提示工程师)这一新兴职业。本应尽显自然语言优势的LLM,反而因繁杂的提示逻辑而变得不那么用户友好。而这就是智能体得以发挥作用的地方。
智能体被认为是一种能够感知环境、进行决策和执行动作的智能载体。不同于传统的AI,智能体具备通过独立思考、调用工具逐步完成给定目标的能力。伴随LLM性能迅速迭代,智能体市场亦急速速膨胀。Grand View Research数据显示,2023年,全球智能体市场规模估值为38.6亿美元,预计从2024年到2030年将以45.1%的复合年增长率增长。报告分析,对自动化需求的增加、自然语言处理(NLP)技术的进步,以及对个性化客户体验需求的上升是推动智能体市场增长的主要因素。
Grand View Research report: AI Agents Market Size & Trends
随着LLM呈现出专精化趋势,智能体亦逐渐向专业化、垂直化转型。一个MAS(Multi-agent system,多智能体系统)的雏形开始显现。
多智能体系统:
一个超级智能体就是一支团队
根据Grand View Research的数据,尽管单一智能体系统在2023年仍然占据了最大的市场份额,然而多智能体系统细分市场预计在2024-2030间将展现出最高的复合年增长率。解决复杂问题、实时决策、增强的协作和沟通以及在各个行业中的多样化应用是推动该细分市场增长的主要因素。具体而言,多智能体协同系统能够极大提升所处理任务的复杂性,实现分布式资源的优化利用,提升智能体系统的灵活性与适应性,改善系统的安全性与容错性。这些特点在诸如智能交通、应急响应、智能电网等场景应用中至关重要。
特斯联创始人兼CEO艾渝在刚刚落幕的Web Summit上亦分享了其对MAS趋势的观察。在他看来,未来世界,智能体的数量或将远超人类数量,每个智能体均具备像人类一样的行动以及思考能力,同时,还能够成为某垂直领域的专家。在这样的前提下,一个能够统筹、协调所有智能体,完成与人类交互的超级通用智能体(AGI Agent)就显得尤为重要。
艾渝在Web Summit Lisbon现场
据艾渝分享,通用智能体的特点在于类人的思考能力、长时间的记忆、对物理世界的理解能力,以及最重要的多智能体的协作能力。通用智能体能够依据workflow无代码生成多个智能体;同时,基于其背后大模型的思考、规划能力,通用智能体能够实现对多个智能体的统一调度、编排。用户通过与通用智能体的简单语言交互,即可获得一整套多智能体协同的系统,从而完成导航、翻译、活动管理、商业分析等诸多任务。可以说,一个通用智能体就相当于一整支团队。
超级通用智能体存在的意义即在于,在智能体、大模型呈现出愈发多元、细分化发展的情况下,充分降低人类使用智能工具的门槛,帮助用户做“减法”。
超级通用智能体,
普惠化AI的杀手级应用入口
同样注意到多智能体趋势的还有微软。11月19日,在“Microsoft Ignite 2024”全球开发者大会上,围绕智能体,微软更新了多款AI产品。而尤其值得一提的是,大会上,微软公布了其智能体生态的发展状况。据透露,自推出以来,已有超过10万家组织通过其Copilot Studio创建或编辑过智能体。
“Microsoft Ignite 2024”全球开发者大会
作为微软发布的用来构建自定义ChatGPT的工具,Copilot Studio集成了1400 多种企业系统和数据源,范围从 SAP 到 ServiceNow、再到 SQL数据库。智能体生态的快速生长,使得企业在智能体间无缝协作成为可能。在该设想下,销售智能体可要求库存智能体检查库存情况,而后通知客户服务智能体为客户提供更新信息。
艾渝所提出的通用智能体,则是建构在蓬勃智能体生态基础之上的进一步展望。无疑,由智能体生态编织的网格提升了传统AI的“眼-脑-手”能力框架,增强了其解决复杂问题的能力。而如何处理好智能体与智能体、人与智能体之间的关系,在创造新价值的同时,避免冗余才是用好该能力框架的关键。“这是一种全新的生产关系,需要技术的优化,也需要workflow的不断改进。”
Hali与Copilot Studio代表了生成式AI乃至通用人工智能由权威走向个人及企业终端的不同路径。一如,App Store将软件定义的能力释放给个人,以Hali为代表的通用智能体、以Copilot Studio为代表的AI工具平台则正在成为新一代普惠化AI应用的入口,赋智于个体。