在没有精确真实值的情况下学习贝叶斯滤波器

在之前的文章中,我们提到,例如卡尔曼滤波器的贝叶斯滤波器可以用于估计机器人状态。通常,这需要有一个模型来描述机器人传感器测量与要观察状态之间的关系,以及一个模型来预测机器人控制输入对其状态的影响。当对这些模型了解不足时,机器学习技术可以自动寻找合适的模型。

在Ko等人设想的场景中,目标是基于遥控命令和来自惯性测量单元(IMU,见下图中红框)的测量推断赛车在赛道上的位置(状态)。IMU提供了俯仰、滚转和偏航的转速以及三维加速度。由于赛道上的“轨道”使车子能够转弯,赛车的速度是唯一被控制的参数。为了开始,Ko等人通过驾驶赛车绕赛道行驶,记录遥控命令、IMU测量和通过上方摄像机估计的真实位置。随后,这些数据被用于训练概率模型(高斯过程模型),最终集成于贝叶斯滤波器中。

然而,真实位置的需求需要额外的努力和额外的硬件,比如上方摄像机。为了解决这个问题,Ko等人扩展了他们的方法,以处理在没有、很少或有噪声的真实位置情况下训练模型的情形。

结果显示,即使在没有真实位置的情况下,他们成功地追踪了赛车,表现优于现有的最先进方法。作者还展示了所开发的方法如何使赛车或机器人手臂能够根据专家演示重放轨迹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注