AI创新加速:揭秘Coze、元器、Dify、千帆、百炼如何推动Agent开发新纪元

今年开始,Agent成为大模型落地的最佳选择,各大厂商都在大力推广。面对这种技术簇,我们应采取一种积极探索与谨慎评估并重的策略——既要保持理性,也要保持乐观。

图片

随着大模型迭代的浪潮一波接一波地推高技术前沿,Agent技术已经成为大模型落地的主流选择,并被视为赋予大模型更广阔能力的最佳路径。从理解复杂的指令,到处理多模态信息,从简单的问答系统到复杂的决策支持系统,从个性化推荐到自动化的业务流程管理,陆续在更多领域展现出其巨大的潜力和价值,它正在为社会带来深刻的变革。

在这场趋之若鹜的群体行动中,面对这项持续发展变化的技术簇,我们应采取一种积极探索与谨慎评估并重的策略——既要保持理性,也要保持乐观,以此来应对不确定性。技术的更新迭代需要时间与耐心,而技术的应用则需了解其限制和准确判断业务场景。

要有效利用大模型,首先,必须明确他们的优势和不足(图1)。接下来,整理业务操作流程即业务SOP,确保对业务场景有深刻理解和准确的认知。其次,对领域知识进行必要的梳理。第四,在搭建Agent的过程中,尽可能的规避LLM的局限(例如,通过多轮对话精准捕捉识别用户意图)。第五,要做好企业内专业资料的处理和必要工具的建设。最后,准备好对Agent进行持续的优化(效果优化),从而在应用大型模型时发挥其优势,规避弱点。

一、大模型原生能力&局限

大模型擅长语义理解、逻辑推理以及生成和创作内容。然而,它们目前存在一些限制,包括对特定领域的深入理解和时效性不足、有限的记忆能力、在实际情况中的鲁棒性不够,导致错误、潜在的安全风险、推理和规划能力尚待提升、缺少合作意识而无法协同解决复杂问题、以及缺乏视觉和听觉等感官能力,有时生成的信息可能不精确或是虚构的。在构建Agent时,可以通过集成其他技术和能力来补充和改进大模型的这些不足。

另外,一些限制更多地取决于大型模型自身能力的提升。例如,泛化能力和过度拟合现象,这可能导致对含糊不清的信息的理解出现歧义,或者混淆了特定领域的知识。模型处理上下文的能力也受到长度的限制。模型的可解释性和可调试性不足,使其在某些情况下表现得像一个局部的黑箱。由于模型参数众多,推理过程耗时较长。此外,微调模型对高性能的GPU和TPU计算资源的需求也相对较大。

图片

二、Agent

为让大模型更充分的发挥价值,突破当前的局限,主流趋势是通过Agent增强能力(大脑),为大模型增加眼耳鼻口手脚的能力。

2.1 Agent框架

Agent为大模型提供了执行复杂任务、与环境交互、自主决策和长期记忆等关键能力,使得大模型的应用从单纯的语言处理扩展到更广泛的领域,包括自动化任务执行、客户服务、内容创作等,极大地扩展了AI的实用性和影响力。为了实现这样一套解决方案(图2),背后需要用工程化的手段落地——工具链。

图片

2.2 一站式AI Agent开发工具链

Agent开发平台是面向智能体生产场景的一站式开发工具,具备智能体编排、流程搭建、知识库管理、大小模型交互、计量、开放、私有化部署等功能,能够有效提升智能体研发效率,降低研发成本。目前国内知名的Agent开发平台包括百度的千帆、阿里的百炼、字节的Coze、Dify以及腾讯的元器等。

图片

2.3 工具链竞品分析

1)字节Coze

Coze平台专为零代码或低代码(可视化编排)开发者设计,极大地降低了开发门槛,使得非技术人员也能快速上手。

优势:

  • 功能强大(图像流、通过触发器实现自动化的任务调度和执行、多渠道发布)
  • 高度可定制
  • 支持丰富的主流第三方插件
  • 数据源多样

但整体的动线繁琐,用好的门槛比较高。

图片

2)腾讯元器

网站风格一如既往的“节制”,功能布局清晰易懂,用户无需花费脑力去理解网站的结构、布局和导航。该有的元素都有,后续在生态建设上,期待看到更多的可能,包括且不限于更丰富的大模型可选、插件……

图片

3)Dify

是做LLM应用开发平台中最早的一批之一,且功能性甚至比国内头部大厂更突出,相比之下,目前它是是Github上Star数最多的大模型应用开发工具(54000星),是全球LLM Tools增速Top1的开源项目(300万的安装量)。

优势:

  • AI生态相对最好:支持40多家厂商的大模型,对接大模型平台、对接开源大模型,全链路免费。上百种插件
  • 成功打开海外市场
  • 提供云服务和本地部署两种方式,满足了不同用户的需求,同时支持多平台发布应用
  • 自动化流程搭建和数据处理方面具有明显的优势,适合需要构建复杂自动化流程或处理大量数据的用户

图片

4)百度千帆AppBuilder

千帆AppBuilder提供全面便捷的应用开发套件与资源环境,包括大模型驱动的开发组件(文字识别、文生图等多模态能力),内置RAG(检索增强生成)、Agent(智能体)、GBI(智能数据分析)等常用的AI原生应用框架,语音识别、TTS、文生图等AI能力组件,以及各类IAAS云资源。使得开发者能够在一个平台上完成从应用开发到部署的全过程,大大提高了开发效率。

优势:

  • 千帆大模型平台提供了从模型设计、训练到部署、优化的全流程支持
  • 平台42个大模型,预置41个数据集。内置103套Prompt模版及自动化Prompt工程能力
  • 预置的安全模块可以有效控制输入和输出的安全风险,为用户提供全面的模型安全、内容安全和数据安全保障
  • 自研集群,为企业节约了算力成本和时间成本
  • 生态能力强大,预置100+优质官方组件
  • 自主规划准确,支持人工编排以高效还原业务SOP

图片

5)阿里百炼

优势:

  • 开放的模型非常多,除了阿里系之外,支持主流的三方大模型,百川、智谱、零一万物、Meta……
  • 支持进行多轮对话配置,模型支持将选定的历史对话信息作为输入
  • 允许企业开发应用时引入自研插件,与业务场景充分融合

图片

图片

6)竞品分析:核心功能

从Agent构建(编排)、节点(及节点管理)、生态、发布渠道、OPS,5个一级维度,70个三级维度,来评估5个头部供应商的功能,可以看出,在过去一年多的时间里,各家的开发工具链都在快速演进和迭代。

图片

2.4 参与方

以企业内部自建or私有化部署Agent开发平台角度看,利益相关者有Agent开发平台的建造者(自建)or维护人(外采)。有小白用户,有研发能力的Agent开发者(包括插件的开发、知识库的建设等围绕大模型应用的一系列的元素建设),还有外部的三方服务商(提供底层基座大模型、Agent开发套件、解决方案、甚至是上手帮企业调Agent)。

图片

2.5 沉淀的AI资产——生态市场

在大模型的范畴内,新型的AI资产是企业核心价值力的一种体现。包括各种Agent(Mult-Agent)、Flow工作流、业务的SOP、大&小模型、Prompt、插件、知识库、知识图谱、语料、评测集、评测排行榜(含报告)……。这些资产在具体的业务领域应用中,像变形金刚一样,可以单打独斗,也可以组合变形,以解决文本编辑、图像处理、语音识别、智能助手等形态推进企业的产品创新、服务质量的提升、运营效率的改进、营销效果的高转化。

图片

三、Agent开发生命周期

上文介绍了Agent开发工具,有了这些利器,接下来的关键点在于如何巧妙的运用它们?构建并完善Agent,以确保业务效率的显著提升,是展现大模型价值的最佳途径。企业内部做Agent一般经过3个步骤:

其一,业务提需求,搭建Agent,确保POC符合业务预期

其二,正式开发Agent,以及对接业务系统,上线交付

其三,持续运营优化Agent,不断提升效果

图片

四、行业发展趋势VS企业落地关键点

在企业实际搭建Agent的过程中,有三个关键步骤极其重要,必须由企业内部人员主动参与并领导,这是无法通过购买第三方服务来取代的。

其一,是让大型模型理解企业内部的数据、信息和知识,为Agent提供高质量、精确的数据资源,以便让大型模型输出符合业务预期的答案是至关重要的。数据到信息,信息到知识,知识到智慧的转化过程,需要从最终使用者的角度反向思考。如何采集、处理和加工数据、信息、知识才能达到预期效果。这需要在六个方面进行思考:准确性、完整性、全面性、粒度(粗糙或详细)、关联性以及访问或使用权限。信息处理的效果对于企业有效利用大型模型至关重要,这需要具备专业知识的人员掌握与大型模型互动的专门技巧,如提示(Prompt)和知识库或记忆技巧。

其二,通过使用插件,可以实现Agent与企业现有系统的无缝集成,从而提升系统的智能化程度。这一过程通常由开发团队负责编码(或使用如Cursor等代码生成工具)。在此过程中,需要重视元数据的完整性(AI资产管理),以便实现最大程度的复用性,从而提高企业内部系统对接的效率。

其三,在构建Agent之前,我们需要理清业务的标准操作流程(SOP)。在编辑工作流时,开发者需要参照SOP,将大模型、知识库、插件等原始元素进行编排,并通过逻辑节点将流程连贯起来,从而“虚拟重现”业务场景。这三个方面的推进效率和质量,决定了一个企业应用大型模型的效率和效果,也决定了在这场生产力革命中的排位。

可以预见,在2025年,大模型应用将给我们带来更多令人惊叹的“哇哦”时刻,让我们拭目以待~

图片

受作者领域认知深度所限及技术无时无刻不在更新迭代,业界对LLM、AGI、Agent、GPT……的衍生应用必定是珠零锦粲。无法在一篇中尽现全貌,未来可能会彻底推翻当下的种种尝试而不得知。能为大家带去一点点新的启发,以深感欣慰。文中难免有纰漏或不准确的地方,欢迎大家批评指正。

撰写中参考网络上各位同仁的最新观点,拿来主义未打招呼,还望见谅。若有任何建议或意见,欢迎联系作者探讨。

作者:shucay、佳琪

本文由@shucay 授权发布于人人都是产品经理,未经许可,禁止转载

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。