当前位置: X-MOL 学术arXiv.cs.AI › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Polynomial-Time Algorithms for Multi-Agent Minimal-Capacity Planning
arXiv - CS - Artificial Intelligence Pub Date : 2021-05-04 , DOI: arxiv-2105.01225
Murat Cubuktepe, František Blahoudek, Ufuk Topcu

We study the problem of minimizing the resource capacity of autonomous agents cooperating to achieve a shared task. More specifically, we consider high-level planning for a team of homogeneous agents that operate under resource constraints in stochastic environments and share a common goal: given a set of target locations, ensure that each location will be visited infinitely often by some agent almost surely. We formalize the dynamics of agents by consumption Markov decision processes. In a consumption Markov decision process, the agent has a resource of limited capacity. Each action of the agent may consume some amount of the resource. To avoid exhaustion, the agent can replenish its resource to full capacity in designated reload states. The resource capacity restricts the capabilities of the agent. The objective is to assign target locations to agents, and each agent is only responsible for visiting the assigned subset of target locations repeatedly. Moreover, the assignment must ensure that the agents can carry out their tasks with minimal resource capacity. We reduce the problem of finding target assignments for a team of agents with the lowest possible capacity to an equivalent graph-theoretical problem. We develop an algorithm that solves this graph problem in time that is \emph{polynomial} in the number of agents, target locations, and size of the consumption Markov decision process. We demonstrate the applicability and scalability of the algorithm in a scenario where hundreds of unmanned underwater vehicles monitor hundreds of locations in environments with stochastic ocean currents.

中文翻译:

多Agent最小容量规划的多项式时间算法

我们研究使合作完成共享任务的自治代理的资源容量最小化的问题。更具体地说,我们考虑为一组在随机环境中资源受限的情况下运作并具有共同目标的同构代理进行高层规划:给定一组目标位置,请确保某个代理几乎可以肯定地无限次地访问每个位置。我们通过消费马尔可夫决策过程来规范代理商的动态。在消费马尔可夫决策过程中,代理具有有限容量的资源。代理程序的每个操作都可能消耗一定数量的资源。为了避免耗尽,代理可以在指定的重新加载状态下将其资源补充到最大容量。资源容量限制了代理的功能。目的是将目标位置分配给业务代表,每个业务代表仅负责重复访问分配的目标位置的子集。此外,分配必须确保代理可以以最小的资源容量执行任务。我们减少了为具有同等图论问题的能力最低的代理团队寻找目标分配的问题。我们开发了一种算法,可以及时解决此图问题,即代理数量,目标位置和消耗马尔可夫决策过程的大小为\ emph {多项式}。我们演示了在随机海流环境中数百个无人水下航行器监视数百个位置的情况下该算法的适用性和可扩展性。并且每个代理仅负责重复访问指定的目标位置子集。此外,分配必须确保代理可以以最小的资源容量执行任务。我们减少了为具有同等图论问题的能力最低的代理团队寻找目标分配的问题。我们开发了一种算法,可以及时解决此图问题,即代理数量,目标位置和消耗马尔可夫决策过程的大小为\ emph {多项式}。我们演示了在随机海流环境中数百个无人水下航行器监视数百个位置的情况下该算法的适用性和可扩展性。并且每个代理仅负责重复访问指定的目标位置子集。此外,分配必须确保代理可以以最小的资源容量执行任务。我们减少了为具有同等图论问题的能力最低的代理团队寻找目标分配的问题。我们开发了一种算法,可以及时解决此图问题,即代理数量,目标位置和消耗马尔可夫决策过程的大小为\ emph {多项式}。我们演示了在随机海流环境中数百个无人水下航行器监视数百个位置的情况下该算法的适用性和可扩展性。分配必须确保代理可以以最小的资源容量执行任务。我们减少了为具有同等图论问题的能力最低的代理团队寻找目标分配的问题。我们开发了一种算法,可以及时解决此图问题,即代理数量,目标位置和消耗马尔可夫决策过程的大小为\ emph {多项式}。我们演示了在随机海流环境中数百个无人水下航行器监视数百个位置的情况下该算法的适用性和可扩展性。分配必须确保代理可以以最小的资源容量执行任务。我们减少了为具有同等图论问题的能力最低的代理团队寻找目标分配的问题。我们开发了一种算法,可以及时解决此图问题,即代理数量,目标位置和消耗马尔可夫决策过程的大小为\ emph {多项式}。我们演示了在随机海流环境中数百个无人水下航行器监视数百个位置的情况下该算法的适用性和可扩展性。我们开发了一种算法,可以及时解决此图问题,即代理数量,目标位置和消耗马尔可夫决策过程的大小为\ emph {多项式}。我们演示了在随机海流环境中数百个无人水下航行器监视数百个位置的情况下该算法的适用性和可扩展性。我们开发了一种算法,可以及时解决此图问题,即代理数量,目标位置和消耗马尔可夫决策过程的大小为\ emph {多项式}。我们演示了在随机海流环境中数百个无人水下航行器监视数百个位置的情况下该算法的适用性和可扩展性。
更新日期:2021-05-05
down
wechat
bug