当前位置: X-MOL 学术J. Intell. Robot. Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Image-based Action Generation Method using State Prediction and Cost Estimation Learning
Journal of Intelligent & Robotic Systems ( IF 3.1 ) Pub Date : 2021-08-24 , DOI: 10.1007/s10846-021-01465-4
Yu Ishihara 1 , Masaki Takahashi 2
Affiliation  

This study proposes an image-based action generation method using a controller that is trained with experiences autonomously collected by a robot. Operating a robot using its state or point in coordinate space is not always easy for human operators to control. This is because humans do not interpret the world as a coordinate space. Depending on the task, inputs such as voice-input or image-input are easier for human operators to use when managing a robot. Accordingly, we studied an image-based control method of robotic agents. Designing an image-based controller by hand for different tasks and input images is highly complex. Therefore, a controller which can be automatically trained from experiences collected by a robot is strongly preferred. In addition, when considering the operation of a robot in a real environment, the controller should guarantee the safety of a robot’s behavior in a way that is configurable and understandable by the human operator. However, most previous approaches trained the controller end-to-end, which does not guarantee the safety of the behavior learned by the controller. Instead of training the controller end-to-end, we train state prediction and cost estimation functions to solve the action generation as a path planning problem. By doing so, we can explicitly design and specify the undesired state of a robot in the configuration space. The results show that the proposed method can be used to provide safe navigation to different goal positions in a realistic living room-like environment with an hour of training data.



中文翻译:

使用状态预测和成本估计学习的基于图像的动作生成方法

这项研究提出了一种基于图像的动作生成方法,该方法使用一个控制器,该控制器通过机器人自主收集的经验进行训练。使用机器人的状态或坐标空间中的点来操作机器人对于人类操作员来说并不总是容易控制。这是因为人类不会将世界解释为坐标空间。根据任务的不同,人类操作员在管理机器人时更容易使用语音输入或图像输入等输入。因此,我们研究了一种基于图像的机器人代理控制方法。为不同的任务和输入图像手动设计基于图像的控制器非常复杂。因此,可以从机器人收集的经验中自动训练的控制器是非常受欢迎的。另外,在考虑机器人在真实环境中的操作时,控制器应以人类操作员可配置和可理解的方式保证机器人行为的安全性。然而,以前的大多数方法都是端到端地训练控制器,这并不能保证控制器学习到的行为的安全性。我们不是端到端地训练控制器,而是训练状态预测和成本估计函数来解决作为路径规划问题的动作生成。通过这样做,我们可以在配置空间中明确设计和指定机器人的不良状态。结果表明,所提出的方法可用于在具有一小时训练数据的逼真的类似客厅的环境中提供到不同目标位置的安全导航。大多数以前的方法都是端到端地训练控制器,这并不能保证控制器学习到的行为的安全性。我们不是端到端地训练控制器,而是训练状态预测和成本估计函数来解决作为路径规划问题的动作生成。通过这样做,我们可以在配置空间中明确设计和指定机器人的不良状态。结果表明,所提出的方法可用于在具有一小时训练数据的逼真的类似客厅的环境中提供到不同目标位置的安全导航。大多数以前的方法都是端到端地训练控制器,这并不能保证控制器学习到的行为的安全性。我们不是端到端地训练控制器,而是训练状态预测和成本估计函数来解决作为路径规划问题的动作生成。通过这样做,我们可以在配置空间中明确设计和指定机器人的不良状态。结果表明,所提出的方法可用于在具有一小时训练数据的逼真的类似客厅的环境中提供到不同目标位置的安全导航。我们训练状态预测和成本估计函数来解决作为路径规划问题的动作生成。通过这样做,我们可以在配置空间中明确设计和指定机器人的不良状态。结果表明,所提出的方法可用于在具有一小时训练数据的逼真的类似客厅的环境中提供到不同目标位置的安全导航。我们训练状态预测和成本估计函数来解决作为路径规划问题的动作生成。通过这样做,我们可以在配置空间中明确设计和指定机器人的不良状态。结果表明,所提出的方法可用于在具有一小时训练数据的逼真的类似客厅的环境中提供到不同目标位置的安全导航。

更新日期:2021-08-25
down
wechat
bug