典型文献
基于强化学习的扑翼飞行器路径规划算法
文献摘要:
针对扑翼飞行器机动性能弱的问题,提出一种在未知环境下示教学习辅助的强化学习局部路径规划算法(IL-PPO2).首先,基于扑翼飞行器的受限视角的双目感知系统,提出一种心形避障算法,降低避障时对扑翼飞行器控制精度的要求,提高避障鲁棒性;其次,根据心形避障算法的特性,提出一种U型障碍的避障策略;最后,提出一种示教学习辅助的强化学习局部路径规划算法,将心形避障算法与局部路径规划算法相结合,实现扑翼飞行器的局部路径规划.仿真结果表明:与TD3fD强化学习算法相比,IL-PPO2算法能够缩短模型训练时间,路径规划效率与成功率明显高于TD3fD算法;与动态窗口法(DWA)相比,IL-PPO2算法能够提高路径规划的成功率,并且有效融合心形算法,提高路径的平滑程度.
文献关键词:
扑翼飞行器;局部避障;U型障碍;专家系统;强化学习;路径平滑
中图分类号:
作者姓名:
王思鹏;杜昌平;郑耀
作者机构:
浙江大学航空航天学院,杭州310027
文献出处:
引用格式:
[1]王思鹏;杜昌平;郑耀-.基于强化学习的扑翼飞行器路径规划算法)[J].控制与决策,2022(04):851-860
A类:
TD3fD
B类:
扑翼飞行器,路径规划算法,机动性,未知环境,示教学习,局部路径规划,PPO2,双目,感知系统,心形,避障算法,飞行器控制,控制精度,避障策略,强化学习算法,模型训练,训练时间,规划效率,动态窗口法,DWA,提高路径,有效融合,合心,局部避障,专家系统,路径平滑
AB值:
0.239535
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。