首站-论文投稿智能助手
典型文献
基于规划步数自适应Dyna-Q的多功能雷达干扰决策方法
文献摘要:
针对基于强化学习的干扰决策方法存在着收敛速度过慢的问题,在Dyna-Q算法的基础上提出一种规划步数自适应的Dyna-Q干扰决策算法.在保证干扰策略有效性的前提下,提升强化学习算法的收敛速度,使算法能以更快的速度学习到最优干扰策略.实验与仿真结果表明:该算法能实现多功能雷达干扰的实时有效,也可扩展到其他强化学习应用领域,具有一定借鉴价值.
文献关键词:
多功能雷达;干扰决策;强化学习;Dyna-Q;自适应
作者姓名:
朱霸坤;朱卫纲;李伟;李佳芯;杨莹
作者机构:
航天工程大学电子与光学工程系,北京 101416
文献出处:
引用格式:
[1]朱霸坤;朱卫纲;李伟;李佳芯;杨莹-.基于规划步数自适应Dyna-Q的多功能雷达干扰决策方法)[J].兵工自动化,2022(07):1-4
A类:
B类:
步数,Dyna,多功能雷达,雷达干扰,干扰决策,决策方法,收敛速度,过慢,决策算法,干扰策略,强化学习算法,可扩展,学习应用,借鉴价值
AB值:
0.308706
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。