AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读?

作者: Kevin, the Researcher at BlockBooster

AI Agent 框架作为行业发展的关键拼图,可能蕴藏着推动技术落地与生态成熟的双重潜力。市场中热议的框架有:Eliza, Rig, Swarms, ZerePy等等。这些框架通过Github Repo吸引开发者,建立声望。以“库”发币的形式让这些框架,和光同时具备波和粒子的特质类似,Agent框架同时具备严肃外部性和Memecoin的特性。本文将重点解读框架的“波粒二象性”以及Agent框架为什么能成为最后一角。

Agent框架带来的外部性能够在泡沫消退后留下春芽

从GOAT诞生开始,Agent叙事冲击市场的力度不断上升,如同一位功夫大师,左拳“Memecoin”,右掌“行业希望”,你总会在其中一招里败下阵来。其实,AI Agent 的应用场景并未严格区分,平台、框架与具体应用之间界限模糊,但根据代币或协议的偏好仍可大致分类。但是,根据代币或者协议的发展偏好还是可以分为以下几类:

  • Launchpad:资产发型平台。Base 链上的 Virtuals Protocol 和 clanker,Solana 链的 Dasha。

  • AI Agent 应用:游离于Agent和Memecoin之间,在记忆内存的配置上有出彩的地方,比如GOAT,aixbt等。这些应用一般来说是单向输出的,输入条件非常有限。

  • AI Agent 引擎:Solana 链的 griffain 以及 base链的 Spectre AI。griffain可以做到从读写模式进化到读、写、行动的模式;Spectre AI 是RAG引擎,链上搜索。

  • AI Agent框架:对于框架平台来说,Agent本身就是资产,所以Agent 框架是Agent的资产发行平台,是Agent的Launchpad。目前具有代表性的项目有 ai16,Zerebro , ARC和这两天热议的Swarms。

  • 其他小方向:综合型Agent Simmi;AgentFi协议 Mode;证伪类Agent Seraph;实时 API Agent Creator.Bid。

进一步讨论Agent框架,可以看出它具有充分的外部性。不同于各大公链和协议的开发者只能在不同开发语言环境中选择,而行业内总的开发者规模并没有呈现对应市值增速的增长。Github Repo是Web2和Web3开发者建立共识的之所,在这里建立开发者社区,比任何一个协议单独开发出来的“一插即用”包对Web2开发者的吸引力和影响力更强大。

本文提到的4种框架都已开源:ai16z的 Eliza 框架获得6200颗星;Zerebro的ZerePy框架获得191颗星;ARC的RIG 框架获得1700颗星;Swarms的Swarms框架获得2100颗星。目前,Eliza 框架被广泛用于各种Agent应用,是覆盖面最广的框架。ZerePy的开发程度不算高,发展方向主要在X上,尚且不支持本地LLM和集成内存。 RIG的相对开发难度最高,但是能给开发者最大限度实现性能优化的自由。Swarms除了团队推出mcs之外还没有其他用例,但是Swarms可以集成不同框架,有较大想象空间。

此外,上述分类中,把Agent引擎和框架分割开来,或许或造成疑惑。但我认为二者是有区别的。首先,为什么是引擎?联想现实生活中的搜索引擎来类比是相对契合的。不同于同质化的Agent应用,Agent引擎的性能在其之上,但同时是完全封装的,通过api接口来调整的黑盒。用户可以以fork的形式来体验Agent引擎的性能,但是又不能像基础框架那样掌握全貌和定制自由。每个用户的引擎就像在调教好的Agent上生成一个镜像,是对镜像做交互。而框架本质上是为了适配链,因为在Agent做Agent框架,最终目的都是和对应的链有整合,怎样定义数据交互方式,怎样定义数据验证方式,怎样定义区块大小,怎样平衡共识和性能,这些是框架需要考虑的事情。而引擎呢?只需要在某一个方向,充分微调模型和设置数据交互还有内存之间的关系就行,性能是唯一评价标准,而框架则不然。

用“波粒二象性”的视角去评价Agent框架或许是确保走在正确方向上的前提

Agent执行一次输入输出的生命周期中,需要三个部分。首先是底层模型决定了思考深度和方式,然后内存是自定义的地方,在基础模型有了输出之后,根据内存再修改,最后在不同的客户端上完成输出操作。

图片

来源:@SuhailKakar

为了证实Agent框架具有“波粒二象性”,“波”具有“Memecoin”的特征,代表社区文化和开发者活跃度,强调 Agent 的吸引力和传播能力;“粒”代表“行业预期”的特征,代表底层性能、实际用例和技术深度。我会分别从两个方面结合三个框架的开发教程为例进行说明:

快速拼接式的Eliza框架

  1. 设置环境

图片

来源:@SuhailKakar
  1. 安装Eliza

图片

来源:@SuhailKakar

3.配置文件

图片

来源:@SuhailKakar

4.设置Agent性格

图片

来源:@SuhailKakar

Eliza的框架相对来说,易于上手。它是基于TypeScript,这是大多数 Web 和 Web3 开发者都熟悉的语言。框架简洁,没有过度抽象,让开发者能够轻松地添加自己想要的功能。通过步骤3,看到Eliza可以多客户端集成,可以将其理解为多客户端集成的组装器。Eliza支持DC, TG和X等平台,还支持多种大语言模型,可以通过上述社交媒体实现输入,LLM模型来输出,并且支持内置记忆管理,可以让任意习惯的开发者快速部署AI Agent。

由于框架的简洁性和接口的丰富性,Eliza大大降低了接入的门槛,实现了相对统一的接口标准。

一键使用式的ZerePy框架

1.Fork ZerePy的库

图片

来源: https://replit.com/@blormdev/ZerePy?v=1

2.配置X和GPT

图片

来源: https://replit.com/@blormdev/ZerePy?v=1

3.设置Agent性格

图片

来源: https://replit.com/@blormdev/ZerePy?v=1

性能优化式的Rig框架

以构建RAG(检索增强生成) Agent为例:

1.配置环境和OpenAI key

图片

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

2.设置 OpenAI 客户端并使用 Chunking 进行 PDF 处理

图片

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

3.设置文档结构和嵌入

图片

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

4.创建向量存储和 RAG agent

图片

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

Rig(ARC)是一个基于 Rust 语言面向 LLM 工作流引擎的 AI 系统构建框架,它要解决更底层的性能优化问题,换句话说,ARC 是一个 AI 引擎「工具箱」,提供 AI 调用、性能优化、数据存储、异常处理等后台支撑服务。

Rig 要解决的是「调用」问题,以帮助开发者更好选择 LLM,更好优化提示词,更有效管理 token,以及如何处理并发处理、管理资源、降低延迟等,其侧重点在于 AI LLM 模型和 AI Agent 系统协作过程中如何「用好它」。

Rig是一个开源 Rust 库,旨在简化 LLM 驱动的应用(包括 RAG Agent)的开发。因为Rig开放的程度更深,因此对开发者要求更高,对Rust和Agent的理解要求也更高。 这里的教程是最基础的RAG Agent的配置流程,RAG通过将LLM 与外部知识检索相结合来增强LLM。在官网的其他DEMO中,可以看到Rig具备以下特征:

  • LLM接口统一:支持不同LLM provider的一致api,简化集成。

  • 抽象工作流:预构建的模块化组件让Rig可以承接复杂AI系统的设计。

  • 集成向量存储:内置对裁体存储的支持,在RAG Agent等相似的搜索类Agent中提供高效性能。

  • 嵌入灵活:提供易于使用的 API,用于处理嵌入,在RAG Agent等相似的搜索类Agent开发时,降低语义理解的难度。

可以看出相比Eliza,Rig为开发者提供了额外的性能优化的空间,帮助开发者更好地调试LLM和Agent的调用和协作优化。Rig以 Rust 驱动性的性能、利用 Rust 优势零成本抽象和内存安全、高性能、低延迟的 LLM 操作。能够在底层层面上,提供更丰富的自由度。

分解组合式的Swarms框架

Swarms旨在提供企业级生产级多Agent编排框架,官网提供了几十种workflow和Agent并行串行架构,这里介绍其中一小部分。

Sequential Workflow

图片

来源:https://docs.swarms.world

顺序 Swarm 架构以线性顺序处理任务。每个Agent在将结果传递给链中的下一个Agent之前完成其任务。此架构可确保有序处理,并且在任务具有依赖关系时非常有用。

用例:

  • 工作流程中的每个步骤都依赖于前一个步骤,例如装配线或顺序数据处理。

  • 需要严格按照操作顺序的场景。

层次化架构:

图片

来源:https://docs.swarms.world

实现自上而下的控制,由上级Agent协调各下级Agent之间的任务。其中Agent同时执行任务,然后将其结果反馈到循环中进行最终聚合。这对于高度可并行化的任务非常有用。

电子表格式架构:

图片

来源:https://docs.swarms.world

用于管理同时工作的多个代理的大规模群体架构。可同时管理数千个代理,每个代理都在自己的线程上运行。它是监督大规模代理输出的理想选择。

Swarms不仅是Agent框架,还可以兼容上述Eliza, ZerePy和Rig框架,以模块化的思想,在不同工作流和架构中最大化释放Agent性能,以解决对应问题。Swarms的构思和开发者社区进展都没问题。

图片

  1. Eliza:易用性最强,适合初学者和快速原型开发,尤其适合社交媒体平台的AI交互。框架简洁,便于快速集成和修改,适合不需要过度性能优化的场景。

  2. ZerePy:一键式部署,适合快速开发Web3和社交平台的AI Agent应用。适合轻量级AI应用,框架简单,配置灵活,适用于快速搭建和迭代。

  3. Rig:侧重性能优化,尤其在高并发和高性能任务中表现出色,适用于需要细致控制和优化的开发者。框架较为复杂,需要一定的Rust知识,适合更有经验的开发者。

  4. Swarms:适合企业级应用,支持多Agent协作和复杂任务管理。框架灵活,支持大规模并行处理,并提供多种架构配置,但由于其复杂性,可能需要更强的技术背景来有效应用。

总体来说,Eliza 和 ZerePy 在易用性和快速开发方面具有优势,而 Rig 和 Swarms 更适合需要高性能和大规模处理的专业开发者或企业应用。

这就是Agent框架具有“行业希望”特性的原因,上述框架还处于早期阶段,当务之急是抢占先发优势并建立活跃的开发者社区。框架本身的性能高低以及相对Web2流行应用来说是否落后都不是主要矛盾。只有源源不断涌入开发者的框架才能最终胜出,因为Web3行业始终需要吸引市场的注意力,框架性能再强,基本面再雄厚,如果难以上手导致无人问津,则本末倒置。在能够框架自身能够吸引开发者的前提,具有更成熟和更完整的代币经济模型的框架会脱颖而出。

而Agent框架有着“Memecoin”特性这一点,则非常好理解。上述框架代币都没有合理的代币经济设计,代币没有用例或者用例非常单一,没有经过验证的商业模式,也没有行之有效的代币飞轮,框架仅仅是框架,和代币之间没有完成有机结合,代币价格的增长除了FOMO之外,难以获得基本面上的助力,没有足够的护城河来确保稳定且持久的价值增长。同时,上述的框架自身也显得比较粗糙,其实际价值和当前市值并不匹配,因此有着强烈的“Memecoin”的特性。

值得注意的是,Agent框架的“波粒二象性”并不是缺点,不能将其粗暴的理解为既不是纯粹的Memecoin,又没有代币用例的半罐水。正如我在上一篇文章中提到的观点:轻量化的Agent覆盖着模棱两可的Memecoin面纱,社区文化和基本面不会再成为矛盾,一种新的资产发展路径在逐渐浮出水面;尽管 Agent 框架初期存在泡沫与不确定性,但其吸引开发者和推动应用落地的潜力不容忽视。未来,具备完善代币经济模型和强大开发者生态的框架,或将成为这一赛道的关键支柱。