当前位置: X-MOL 学术arXiv.cs.RO › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
策略分解:具有次优估计的近似最优控制
arXiv - CS - Robotics Pub Date : 2021-03-03 , DOI: arxiv-2103.02716
Ashwin Khadke, Hartmut Geyer

数值计算全局策略以优化复杂动力系统的最佳控制问题在大多数情况下都是棘手的。结果,已经开发了许多近似方法。但是,当前的方法都无法量化所得到的控制效果不及可捉摸的全局最优解的程度。在这里,我们提出策略分解,一种具有显式次优估计的近似方法。我们的方法将最优控制问题分解为低维子问题,将其最优解重新组合以构建整个系统的控制策略。存在许多这样的组合,我们引入了值误差及其LQR和DDP估计值,以预测可能组合的次优性并确定将其最小化的组合的优先级。用撑竿子 以3链接平衡Biped和N链接平面操纵器为例,我们发现估算值正确地确定了最佳组合,从而在不花费显着代价的情况下,在计算出最优控制的时间的一小部分就产生了控制策略。循环性能。尽管将需要进行更多的研究来找到应对政策分解的组合方法,但结果表明,该方法可能是逼近棘手系统中最优控制的有效替代方法。



"点击查看英文标题和摘要"

更新日期:2021-03-05
down
wechat
bug