近日,加州理工学院的研究团队在《Science Robotics》上发表了一项重要研究成果。他们提出了一种名为“谱展开树搜索”(Spectral Expansion Tree Search,简称SETS)的实时规划算法,让机器人能够在复杂环境中自主规划动作,而不必依赖预先设计或离线学习的固定程序。
从自动驾驶到太空探索,让机器人具备高效可靠的自主决策能力一直是机器人领域的终极目标。但在高维连续空间中精确求解决策问题会遇到“维数灾难”。现有方法往往需要针对具体问题设计专门算法,或是依赖大量离线训练数据。而SETS则开创性地将连续动力系统与离散决策树搜索相结合,为机器人实时规划开辟了新思路。
▍实时规划:从理论突破到实验验证
SETS的核心创新在于利用局部线性化系统的谱特征,构建了一个低复杂度的离散表示来近似连续世界。与传统的均匀离散化相比,这种基于系统自然运动模式的表示方法可以大大减小决策树的分支因子和时域深度,从而实现指数级的规模压缩。
研究团队在理论上证明,SETS算法能够在有限时间内收敛到全局最优解的界限。这一理论保证适用于具有确定性、可微动力学的连续状态-动作空间系统,涵盖了欠驱动非线性动力学、非凸奖励函数等广泛应用场景。
为了验证算法的实用性,研究人员在三个不同的机器人平台上进行了实验,展示了SETS在地面、空中和太空领域的广泛适用性。
▍无人机闯风场:复杂环境下的实时决策
在第一个实验中,研究人员让一架四旋翼无人机在布满风场和移动障碍物的3D环境中完成多目标监控任务。实验场地是一个3米见方的立方体空间,配备了能产生可控气流的“真实天气风洞”系统。
这个任务对规划算法提出了极高要求:无人机需要在考虑12维状态空间、空气动力学干扰、多个目标点和密集障碍物的情况下,实时生成可行轨迹。传统的分层规划方法难以处理这种复杂的动力学交互问题。
SETS每5秒规划一次未来10秒的轨迹,通过反馈控制实现闭环。实验结果显示,无人机成功在37秒内访问了所有目标点,同时巧妙地利用或规避不同强度的气流。这种"发现而非设计"的行为模式,体现了SETS在复杂环境下自主决策的强大能力。
▍人机协同:让履带车安全通过赛道
第二个实验场景是一辆履带式车辆在人机协同模式下穿越复杂地形。这个实验是DARPA LINC研究项目的一部分,在桑迪亚国家实验室的机器人车辆测试场进行。
测试赛道包含湿滑斜坡、各类障碍物和狭窄的之字形通道,对车辆的操控提出了严峻挑战。与传统的位置规划不同,SETS需要在保持车辆安全的同时,尽可能跟随驾驶员的速度和方向指令。
实验中,系统还要应对随机的执行器性能衰减:每隔约10秒,驱动电机的控制限制就会降低25%。SETS通过分析局部线性化系统的谱特征,能够高效地理解和适应这种性能变化。在专业驾驶员的对比测试中,启用SETS辅助后能够完全避免安全事故的发生。
▍太空追捕战:多航天器协同网捕的智能突破
在众多实验中,SETS算法在航天器任务中的应用格外引人注目。研究团队设计了一个极具挑战性的太空场景:多个航天器需要通过协同控制一张网来捕获并重定向一个不合作目标。这个任务在失重环境下进行,需要精确的轨道规划和多机器人协同。
传统的航天器轨道规划通常采用预设的轨迹或分层优化方法,但在处理多航天器协同任务时往往力不从心。而SETS算法展现出独特优势:它能够自动发现最优的协同策略,同时考虑每个航天器的动力学约束和整体任务目标。
在实验中,SETS实时生成控制指令,指导航天器编队完成捕获任务。算法通过分析局部线性化系统的谱特征,找到了既能保证捕获网张力适中、又能确保目标安全重定向的最优轨迹。这种方法不仅提高了任务成功率,还最大限度地减少了推进剂消耗。
这一应用展示了SETS算法在高精度空间任务中的潜力,为未来的在轨服务、空间碎片清理等任务提供了新的技术方案。
▍结语与展望
总结来说,这项研究为机器人自主决策开辟了新的方向。SETS不仅能处理复杂的动力学约束,还能实时适应环境变化,为未来机器人的通用自主控制提供了可能性。从无人机到地面车辆,再到航天器,SETS展现出强大的通用性和实用价值。这种基于动力学本质的规划方法,可能会推动机器人技术在探索、运输等领域的进一步发展。
正如论文第一作者Benjamin Rivière所说:“我们的目标是让机器人能够自主发现最优行为,而不是遵循预设的程序。”这种思路或将带来机器人控制领域的范式转换。
论文标题:
Monte Carlo tree search with spectral expansion for planning with dynamical systems
论文链接:
https://www.science.org/doi/epdf/10.1126/scirobotics.ado1010