Loosely Synchronized Rule-Based Planning for Multi-Agent Path Finding with Asynchronous Actions

Shuai Zhou, Shizhe Zhao, Zhongqiang Ren·December 16, 2024

Summary

这篇论文介绍了在异步行动的多智能体路径规划(MAPF)中使用搜索方法(LSS)和规则基于规划(PIBT)的新规划器,以牺牲解决方案质量换取可扩展性。LSRP算法通过将时间纳入状态空间并使用PIBT来解决异步行动的多智能体路径规划(MAPF-AA),通过缓存机制处理具有相近但不同开始时间的智能体,实现高效协调。LSRP在特定图条件下确保可达性,与现有方法相比,在解决更多智能体时运行时间更短,尽管完成时间稍长。LSRP、PIBT和LSS是处理异步行动的多智能体路径规划的算法。LSRP通过深度优先方式迭代规划多个智能体的动作,直到所有智能体达到目标。它维护联合状态列表、动作字典,并更新智能体的优先级。它提取下一个规划时间戳和需要动作的智能体子集,检查缓存动作,并使用ASY-PUSH程序为没有缓存动作的智能体规划动作。LSRP算法在有持续冲突的有向图中规划多智能体路径查找,使用优先级方法,智能体尝试移动到目标。如果顶点被占用,则通过递归调用ASY-PUSH确定智能体是否可以被推。此过程计算等待和移动动作的时间戳,并在字典Φ中缓存未来动作以实现高效规划。LSRP算法通过考虑持续冲突和缓存动作优于PIBT,后者立即在顶点可用时移动智能体。LSRP和Causal PIBT是多智能体路径规划算法。LSRP被动规划,记录执行期间的智能体依赖关系,而Causal PIBT主动规划,考虑已知动作持续时间。这两种算法具有相似的基本思想,但解决不同的问题。LSRP确保在环形图中优先智能体在限定时间内达到目标,而Causal PIBT在已知持续时间的情况下规划动作。LSRP-SWAP扩展引入了交换操作,以解决仅通过简单推操作无法解决的问题。实验结果表明,LSRP-SWAP算法在处理多达1000个智能体时表现出色,尽管解决方案质量有所降低。在稀疏地图中,LSRP和LSRP-SWAP表现出良好的可扩展性,而在拥挤环境中,LSRP-SWAP优于其他算法,显示交换操作的优势。论文开发了处理异步行动的多智能体路径规划的规则基于规划器,并验证了在各种地图中处理高达千个智能体的能力,尽管牺牲了解决方案质量。未来工作旨在开发一个在运行时间限制内可以提高解决方案质量的任何时间规划器。这些规划器在解决方案成本和完成时间方面优于基线,比例约为4倍和1.25倍。考虑异步行动导致解决方案通常比忽略此类行动时便宜30%至75%。

Key findings

7

引言
背景
多智能体路径规划(MAPF)的挑战
异步行动的多智能体路径规划(MAPF-AA)的背景
目标
提出LSRP算法及其扩展LSRP-SWAP
通过牺牲解决方案质量来提高可扩展性
方法
LSRP算法概述
LSRP算法的引入
LSRP与PIBT和LSS的关系
LSRP算法细节
数据结构与维护
联合状态列表
动作字典
智能体优先级更新
动作规划流程
下一个规划时间戳提取
缓存动作检查
ASY-PUSH程序应用
LSRP算法特性
处理持续冲突的有向图
使用优先级方法规划路径
递归调用ASY-PUSH确定智能体移动
LSRP算法性能
在特定图条件下的可达性保证
与现有方法相比的运行时间优势
在更多智能体情况下的性能表现
LSRP-SWAP算法
LSRP-SWAP算法介绍
LSRP-SWAP的引入背景
交换操作的引入
LSRP-SWAP算法细节
解决问题的扩展能力
在处理大量智能体时的性能
实验与验证
实验设计
地图类型与智能体数量
性能指标与比较
结果分析
LSRP与LSRP-SWAP在不同地图条件下的表现
与基线算法的比较
未来工作
规划器开发方向
提高解决方案质量的任何时间规划器
考虑异步行动的解决方案成本优化
结论
LSRP算法及其扩展LSRP-SWAP的贡献
对异步行动的多智能体路径规划的未来展望
Basic info
papers
artificial intelligence
multiagent systems
Advanced features
Insights
这篇论文主要介绍了什么算法用于解决异步行动的多智能体路径规划问题?
LSRP算法如何通过缓存机制处理具有相近但不同开始时间的智能体?
LSRP算法在处理不同地图条件下的多智能体路径规划时,表现如何?