1. 首页>人工智能 >正文

在现实世界中安全地学习运动技能

导读 深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态...

深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态和动作。因此,Google Research 最近的一篇论文介绍了一种 RL 框架,用于学习腿部运动,同时满足训练期间的安全约束。

该框架由两个政策组成。“安全恢复策略”将机器人从接近不安全的状态中恢复,“学习者策略”执行所需的控制任务。该算法的有效性在三个运动任务上得到证明。对于高效的步态和走秀任务,实现了没有跌倒且无需手动重置的策略。

只用四次跌倒训练了一条两条腿的平衡任务。该论文表明,在现实世界中自主安全地学习腿部运动技能是可能的。

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢