上下文工程的关键及发展趋势

人机与认知实验室

2025-07-20 00:00科技领域创作者

上下文工程（Context Engineering）是指设计和构建一个动态系统，以正确的格式在正确的时间为大语言模型（LLM）提供恰当的信息和工具，从而使其能够可靠地完成指定任务。它不仅关注静态的提示词设计，更注重系统性、动态性和信息的精准性。具体而言，上下文工程包括以下几个核心要素：
①用正确的信息以确保模型获取到完成任务所需的关键信息；②用正确的工具提供模型在执行任务时可能需要的各种功能支持。
③用正确的格式以清晰、简洁、结构化的方式呈现信息。上下文工程超越了传统的提示工程，涉及上下文检索与生成、上下文处理、上下文管理等多个基础组件，并且通过检索增强生成（RAG）、记忆系统、工具集成推理、多智能体系统等系统级实现，构建复杂的应用场景。它强调动态生成和管理上下文，在不同的任务和场景中，根据需求实时调整。

上下文工程的关键在于首先对问题进行有效的分解，这能为后续的处理工作提供清晰的方向和基础。然后，要根据具体的任务需求和问题特点，恰当调用大中小不同规模的模型，以发挥各模型的优势。在实际操作过程中，还需要进行不同尺度的试错调整，以便及时发现问题并进行优化。同时，多智能体的组织协同也至关重要，通过合理组织和协同多个智能体，可以实现更高效的任务执行和问题解决。这四个方面相互关联、相互影响，共同构成了上下文工程的核心要素。

1、问题的有效分解

首先要精准地界定问题所涉及的范围和边界，把复杂的大问题拆解成多个相对独立且易于处理的小问题，如在一个智慧交通系统项目中，大问题是“如何缓解城市交通拥堵”，将其分解为“交通流量监测”、“信号灯智能调控”、“公共交通优先通行策略”等小问题。其次，要确定并识别问题的不同层次和相互关系，有些问题是基础性的，需要优先解决；有些问题则是依赖于其他问题的解决结果。比如在工业生产优化中，“设备故障预测”是基础问题，“生产流程重构”则建立在设备可靠运行的基础上。

2、大中小模型的恰当调用

大模型通常具有广泛的知识和强大的通用能力，适用于需要处理大量复杂信息和复杂逻辑推理的场景。如在自然语言处理中的机器翻译任务，大模型可以利用其海量的多语言语料和复杂的语言结构知识，生成较为准确的翻译结果。同时，中小模型则在特定领域或特定任务上有一定的优势。小模型可以针对特定问题进行优化，具有较高的执行效率和针对性，如在图像识别中，对于某种特定缺陷的检测，可以训练一个小模型，使其对这种缺陷的特征高度敏感，从而快速准确地完成检测任务。

3、不同尺度的试错调整

在整体项目或方案设计阶段，从宏观上尝试不同的思路和方法，评估其可行性和效果。比如在城市规划中，尝试不同的功能区划分方案，通过模拟分析其对交通、环境、居民生活等方面的影响，及时发现和纠正不合理的方案。另外，微观尺度的优化也很重要，在具体任务或模型训练过程中，对参数、算法等进行细致的调整，以机器学习模型训练为例，通过不断地调整学习率、正则化参数等，使模型在训练数据上的表现逐步提高，并且在验证数据上也能保持较好的泛化能力。

4、多智能体的组织协同

在多智能体系统中，明确每个智能体的角色和任务非常重要，在一个智能物流系统中，有负责货物运输的智能运输机器人、负责仓库管理的智能仓储机器人、负责路径规划的智能导航系统等，它们各自承担不同的任务。建立有效的通信和协作机制，使智能体之间能够实时共享信息、协调行动，可以采用集中式控制、分布式协作等多种方式。在智能物流系统中，智能运输机器人需要与智能仓储机器人和智能导航系统实时通信，根据仓储机器人的发货指令和导航系统的路径规划，准确地将货物运输到指定地点。

未来上下文工程的发展趋势是实现人机环境系统智能，通过问题的有效分解、大中小模型的恰当调用、不同尺度的试错调整和多智能体的组织协同，让系统能够更好地理解和适应复杂的现实环境，实现与人的高效协同，从而为用户提供更智能、更精准的服务和解决方案。