Bayesian Optimization with Safety Constraints: Safe and Automatic Parameter Tuning in Robotics,arXiv - CS - Systems and Control

当前位置： X-MOL 学术 › arXiv.cs.SY › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

Bayesian Optimization with Safety Constraints: Safe and Automatic Parameter Tuning in Robotics
arXiv - CS - Systems and Control Pub Date : 2016-02-14 , DOI: arxiv-1602.04450
Felix Berkenkamp, Andreas Krause, Angela P. Schoellig

Robotic algorithms typically depend on various parameters, the choice of which significantly affects the robot's performance. While an initial guess for the parameters may be obtained from dynamic models of the robot, parameters are usually tuned manually on the real system to achieve the best performance. Optimization algorithms, such as Bayesian optimization, have been used to automate this process. However, these methods may evaluate unsafe parameters during the optimization process that lead to safety-critical system failures. Recently, a safe Bayesian optimization algorithm, called SafeOpt, has been developed, which guarantees that the performance of the system never falls below a critical value; that is, safety is defined based on the performance function. However, coupling performance and safety is often not desirable in robotics. For example, high-gain controllers might achieve low average tracking error (performance), but can overshoot and violate input constraints. In this paper, we present a generalized algorithm that allows for multiple safety constraints separate from the objective. Given an initial set of safe parameters, the algorithm maximizes performance but only evaluates parameters that satisfy safety for all constraints with high probability. To this end, it carefully explores the parameter space by exploiting regularity assumptions in terms of a Gaussian process prior. Moreover, we show how context variables can be used to safely transfer knowledge to new situations and tasks. We provide a theoretical analysis and demonstrate that the proposed algorithm enables fast, automatic, and safe optimization of tuning parameters in experiments on a quadrotor vehicle.

中文翻译：

具有安全约束的贝叶斯优化：机器人中的安全和自动参数调整

机器人算法通常取决于各种参数，这些参数的选择会显着影响机器人的性能。虽然可以从机器人的动态模型中获得参数的初始猜测，但通常在真实系统上手动调整参数以实现最佳性能。优化算法，例如贝叶斯优化，已被用于自动化该过程。然而，这些方法可能会在优化过程中评估不安全的参数，从而导致安全关键系统故障。最近开发了一种安全的贝叶斯优化算法，称为SafeOpt，它可以保证系统的性能永远不会低于临界值；也就是说，安全是基于性能功能来定义的。然而，在机器人技术中，耦合性能和安全性通常是不可取的。例如，高增益控制器可能实现较低的平均跟踪误差（性能），但可能会过冲并违反输入约束。在本文中，我们提出了一种通用算法，该算法允许与目标分离的多个安全约束。给定一组初始安全参数，该算法最大化性能，但仅评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。高增益控制器可能实现低平均跟踪误差（性能），但可能会过冲并违反输入约束。在本文中，我们提出了一种通用算法，该算法允许与目标分离的多个安全约束。给定一组初始安全参数，该算法最大化性能，但仅评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。高增益控制器可能实现低平均跟踪误差（性能），但可能会过冲并违反输入约束。在本文中，我们提出了一种通用算法，该算法允许与目标分离的多个安全约束。给定一组初始安全参数，该算法最大化性能，但仅评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。但可能会超调并违反输入约束。在本文中，我们提出了一种通用算法，该算法允许与目标分离的多个安全约束。给定一组初始安全参数，该算法最大化性能，但仅评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。但可能会超调并违反输入约束。在本文中，我们提出了一种通用算法，该算法允许与目标分离的多个安全约束。给定一组初始安全参数，该算法最大化性能，但仅评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。我们提出了一种通用算法，该算法允许与目标分离的多个安全约束。给定一组初始安全参数，该算法最大化性能，但仅评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。我们提出了一种通用算法，该算法允许与目标分离的多个安全约束。给定一组初始安全参数，该算法最大化性能，但仅评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。该算法最大限度地提高了性能，但只评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。该算法最大限度地提高了性能，但只评估满足所有约束安全的高概率参数。为此，它通过利用高斯过程先验方面的规律性假设来仔细探索参数空间。此外，我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。我们展示了如何使用上下文变量将知识安全地转移到新的情况和任务中。我们提供了理论分析并证明所提出的算法能够在四旋翼飞行器的实验中快速、自动和安全地优化调整参数。

更新日期：2020-04-08

点击分享查看原文

点击收藏

阅读更多本刊最新论文

全部期刊列表>>