典型文献
基于强化学习的变电站巡检路径规划算法
文献摘要:
针对变电站巡检机器人需要在多种复杂变电站环境下进行快速部署和执行检测点遍历巡检任务的需求,提出了一种基于强化学习和多层神经网络的巡检路径规划算法.在强化学习框架下,提出了基于多层感知器的状态-行为预测模型,以实现根据在线感知和历史经验信息对当前最优的行为决策进行预测.通过对算法训练过程中的奖励函数进行有效设计,使用近端策略优化(Proximal Policy Optimization,PPO)对模型进行训练,诱导机器人同时实现检测点遍历和障碍物规避的目标.在主流仿真环境平台Open AI Gym上搭建仿真环境并进行实验验证.验证结果表明,所提出算法能够在多种类型变电站完成检测点遍历巡检路径规划任务.
文献关键词:
强化学习;多层神经网络;变电站巡检;路径规划
中图分类号:
作者姓名:
马松玲;陈起源;康佳欢
作者机构:
西安建筑科技大学机电工程学院,陕西 西安710000
文献出处:
引用格式:
[1]马松玲;陈起源;康佳欢-.基于强化学习的变电站巡检路径规划算法)[J].计算机仿真,2022(12):103-107,120
A类:
B类:
强化学习,巡检路径规划,路径规划算法,变电站巡检机器人,变电站环境,快速部署,检测点,遍历,多层神经网络,多层感知器,行为预测,经验信息,行为决策,算法训练,训练过程,奖励函数,有效设计,近端策略优化,Proximal,Policy,Optimization,PPO,障碍物规避,仿真环境,Open,Gym,多种类型
AB值:
0.349607
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。