学习行为模型

根据低层模型(如传感器、驱动器和控制器)来预测机器人的高级行为往往较为困难。虽然你可能了解到机器人会因障碍物而转向,但在充满人的房间里,机器人将如何表现则不易预见。

建模机器人的整体行为对于预测其在不同环境中的表现非常重要。此外,一旦获得良好的模型,便可用于在线优化机器人的控制参数。

Infantes 等人使用动态贝叶斯网络(Dynamic Bayesian Networks)进行机器人行为建模。这一方法在 Rackham RWI B21R 博物馆导览机器人上进行测试,如下图所示,该机器人需要在一个开放的环境中导航,周围有许多人。该网络捕捉与机器人的参数、环境变量、机器人状态变量和任务变量相关的信息。随后,模型被用来优化机器人在特定环境中的行为。在学习过程中,机器人因避免故障、提高速度和表现出“人性化”的良好行为而获得奖励。使用这种方法,机器人故障率降低,速度更快,且人类接受度高于那些手动调整参数的机器人。

未来,Infantes 等人计划利用这种方法学习其他机器人任务,比如抓取物体或与人类互动。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注