首站-论文投稿智能助手
典型文献
一种基于功用性图的目标推抓技能自监督学习方法
文献摘要:
提出了一种基于功用性图的目标推抓技能自监督学习方法.首先,给出了杂乱环境下面向目标推抓任务的机器人技能自监督学习问题描述,将工作空间中机器人推抓操作的决策过程定义为一个全新的马尔可夫决策过程(MDP),分别训练视觉机制模块与动作机制模块.其次,在视觉机制模块中融合自适应参数与分组拆分注意力模块设计了特征提取网络RGSA-Net,可由输入网络的原始状态图像生成功用性图,为目标推抓操作提供良好的前提.然后,在动作机制模块中搭建了基于演员—评论家(actor-critic)框架的深度强化学习自监督训练框架DQAC,机器人根据功用性图执行动作后利用该框架进行动作评判,更好地实现了推、抓之间的协同.最后,进行了实验对比与分析,验证了本文方法的有效性.
文献关键词:
推抓技能学习;功用性图;自监督学习;自适应参数;拆分注意力机制
作者姓名:
吴培良;刘瑞军;毛秉毅;史浩洋;陈雯柏;高国伟
作者机构:
燕山大学信息科学与工程学院,河北秦皇岛066004;河北省计算机虚拟技术与系统集成重点实验室,河北秦皇岛 066004;北京信息科技大学自动化学院,北京 100192
文献出处:
引用格式:
[1]吴培良;刘瑞军;毛秉毅;史浩洋;陈雯柏;高国伟-.一种基于功用性图的目标推抓技能自监督学习方法)[J].机器人,2022(04):385-398
A类:
功用性图,RGSA,DQAC,推抓技能学习,拆分注意力机制
B类:
自监督学习,杂乱环境,面向目标,学习问题,工作空间,马尔可夫决策过程,MDP,视觉机制,动作机制,自适应参数,注意力模块,模块设计,特征提取网络,Net,入网,状态图,图像生成,演员,评论家,actor,critic,深度强化学习,自监督训练,实验对比,对比与分析
AB值:
0.280915
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。