典型文献
基于改进A2C目标驱动的室内无地图导航方法
文献摘要:
室内无先验地图场景下的目标驱动式导航是机器人领域的公认难题,近年来兴起的深度强化学习方法为该问题的求解提供了新思路,同时也产生了诸如模型泛化能力不足、难以收敛的新问题.为解决上述问题,提出了一种基于深度强化学习的视觉目标驱动式室内无地图导航方法,设计了一种新的稠密奖励机制,同时引入目标驱动模型并嵌入深度残差网络进行场景特征提取,通过Actor-Critic强化学习算法进行模型训练.以室内导航模拟器Ai2thor为仿真环境,通过对比实验验证了算法具有更快的训练收敛速率及良好的泛化性能.
文献关键词:
深度强化学习;室内导航;视觉目标驱动模型;A2C模型
中图分类号:
作者姓名:
王彦臻;胡晗;李文倩;袁士博;和望利
作者机构:
华东理工大学信息科学与工程学院,上海200237;华东理工大学能源化工过程智能制造教育部重点实验室,上海200237
文献出处:
引用格式:
[1]王彦臻;胡晗;李文倩;袁士博;和望利-.基于改进A2C目标驱动的室内无地图导航方法)[J].控制工程,2022(03):474-479
A类:
Ai2thor,视觉目标驱动模型
B类:
A2C,地图导航,导航方法,先验地图,深度强化学习,强化学习方法,模型泛化,泛化能力,稠密,奖励机制,嵌入深度,深度残差网络,场景特征提取,Actor,Critic,强化学习算法,模型训练,室内导航,航模,模拟器,仿真环境,收敛速率,泛化性能
AB值:
0.348768
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。