AI 代理在 2025 年：企业领导者需要了解什么

至顶科技

2025-01-06 12:09发布于北京

"2025 年将是 AI 代理的元年。"等等——我们不是在 2023 年就说过这句话了吗？当时，我在播客中谈到了 AI 模型的链式连接。人们对 AI 的兴奋度空前高涨，到了 2024 年，许多公司争相尝试生成式 AI，有些甚至使用了链式模型。但这些项目中有许多未能扩大规模。为什么？因为它们只是测试项目，没有集成到系统基础设施中，或者缺乏防护措施和质量控制。这种情况将在 2025 年得到改变，但产品面临的挑战依然存在。要了解 AI 代理在 2025 年能做什么，让我们考虑一个简单的例子：一个自动回复电子邮件的工具。想象一个能自动起草邮件回复的系统。这个例子展示了企业在使用 AI 代理时面临的机遇和挑战。

为什么 GPT 封装器不是企业级 AI

构建邮件回复工具最简单的方法是使用 GPT 封装器。我在 2024 年看到了许多这样的例子。这些基本设置将 AI 连接到一个小型界面。对于我们的用例而言，这意味着获取 ChatGPT API 密钥，编写一些代码来接收邮件作为输入，添加一个提示告诉 AI 该做什么，然后在一个干净的界面上显示响应。

系统提示：像 Lutz 一样回答。Lutz 总是以"祝好！"结束他的消息。

输入：嗨 Lutz，邀请你周四共进晚餐。你能来吗？祝好，Tim。

输出：谢谢，Tim！让我查看一下日程安排，我很快会回复你的。祝好！

即使在这个简单的例子中，当前企业 AI 也面临几个关键挑战：

没有系统集成：该工具无法查看我的日历来确认我是否有空。

缺乏上下文：它不知道我是否喜欢 Tim 或避免这类活动。

没有安全保障：如果邮件询问私人信息，比如我的社会安全号码，该怎么办？

缺乏防护措施：它如何处理有争议的问题，比如询问政治观点？

缺乏用户控制：用户在塑造 AI 回复方面有多大的输入权？

幻觉： AI 有时会编造信息，正如 ChatGPT 页面上的警告不断提醒我们的："ChatGPT 可能会犯错。"

大语言模型在总结或充当界面等任务方面表现出色，但仅凭它们是不够的。正如我在 eCornell 证书课程中强调的，每个挑战都可以得到解决。让我们通过在工作流程中构建 AI 代理来改进我们的工具。

AI 代理的工作流程：不仅仅是生成式 AI

AI 模型可以连接或"链接"以构建工作流程，其中一个模型的输出成为下一个模型的输入。这就像 Zapier 或 IFTTT 这样的工具，但由 AI 驱动。与固定步骤不同，这个过程是动态的，能适应每种情况。这些工作流程并不总是依赖于像 ChatGPT 这样的生成式 AI。实际上，它们经常不依赖——生成式 AI 可能太慢且成本高。

以下是我们的邮件工具可能的工作方式：

输入：嗨 Lutz，邀请你周四共进晚餐。你能来吗？祝好，Tim。

系统提示：分析邮件并确定回复所需的步骤。

系统输出： (1) 查看日历，确认用户是否有空。(2) 查找与 Tim 的往来邮件和以往的晚餐邀请。(3) 根据过去的行为预测用户参加的可能性。(4) 创建三份回复草稿：一份接受，一份婉拒，一份询问更多细节。

系统执行：执行列出的步骤。

输出：向用户呈现这三个回复选项。

这就是链式 AI 模型的工作方式。它克服了许多早期的问题。但大语言模型只是众多工具中的一个。

所有工具都需要集成和质量检查。例如，我们的设置涉及：

系统集成：查看日历和提取数据不是 AI，但需要系统连接。

上下文搜索：使用 AI 检索相关的过往互动（称为 RAG 或检索增强生成）。

传统 AI：预测参加可能性使用经典的数据分析。

用户设计：提供多个选项改善了可用性和控制。

简而言之，这是关于产品工作——创造可靠和有价值的解决方案。

2025 年 - 企业级 AI 代理

2025 年将是 AI 代理的一年。AI 将简化、增强或自动化各行各业的工作流程。但不会有一个"杀手级应用"。如果存在这样的应用，它很可能是搜索——请参见我对搜索的预测。相反，我们将看到较小的工作流程应用于客户服务（参见我在 ultimate.ai 的投资）、法律支持（参见 flank.io）或销售（参见我的公司 r2decide.com）等领域。

要构建这些解决方案，工程师和产品经理需要专注于创造价值。在我的课程"设计和构建 AI 解决方案"中，我教授了一个实用框架，用于为媒体、金融、医疗保健、电子商务和其他行业的企业客户创造价值：

1. 定义业务目标。 2. 收集和清理数据。 3. 开发代理工作流程。 4. 与用户测试。 5. 创建反馈循环。

这听起来很简单，但需要考虑许多因素，包括解决偏见和伦理问题等风险。最重要的是，重点必须放在价值创造上。让我们一起构建。