动态规划将一个多步决策问题拆分成若干子问题,并且保证子问题的最优解能推出完整问题的最优解。所以,动态规划可以得到采样空间下的最优路径解。本章介绍的动态窗口法(Dynamic Window Approach, DWA)与动态规划类似,也是将从起点到终点的多步决策问题拆分成一系列子问题——从采样的候选解中求得代价最低的作为当前最优解。不同的是,DWA是求解一步运行一步直至终点,每一步最优并不能保证全局最优,DWA可能会陷入局部极小值。
一、DWA的原理——在动作空间采样
我在ROS1(机器人操作系统,Robot Operating System)中初次认识DWA2 3,它是ROS中一个典型的局部规划器。
1.1 离散优化方法框架
DWA在每个决策周期内对动作空间(主要包括线速度与角速度构成的二维动作空间)进行采样得到当前状态下的候选轨迹簇,最后根据设定的成本函数评价出最优的轨迹,基本步骤如下图所示。
上图也被我(=v=)称为离散优化框架。与连续优化方法不同,离散优化方法通过采样获得候选解