基于规划步数自适应Dyna-Q的多功能雷达干扰决策方法|朱霸坤;朱卫纲;李伟;李佳芯;杨莹 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于规划步数自适应Dyna-Q的多功能雷达干扰决策方法

文献摘要：

针对基于强化学习的干扰决策方法存在着收敛速度过慢的问题,在Dyna-Q算法的基础上提出一种规划步数自适应的Dyna-Q干扰决策算法.在保证干扰策略有效性的前提下,提升强化学习算法的收敛速度,使算法能以更快的速度学习到最优干扰策略.实验与仿真结果表明:该算法能实现多功能雷达干扰的实时有效,也可扩展到其他强化学习应用领域,具有一定借鉴价值.

文献关键词：

多功能雷达;干扰决策;强化学习;Dyna-Q;自适应

中图分类号：

[1] 无线电电子学、电信技术（TN） / 电子对抗（干扰及抗干扰）（TN97） / 雷达电子对抗（TN974）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 自动化技术及设备（TP2） / 自动化系统（TP27） / 自动控制、自动控制系统（TP273）

作者姓名：

朱霸坤;朱卫纲;李伟;李佳芯;杨莹

作者机构：

航天工程大学电子与光学工程系,北京 101416

文献出处：

兵工自动化

引用格式：

[1]朱霸坤;朱卫纲;李伟;李佳芯;杨莹-.基于规划步数自适应Dyna-Q的多功能雷达干扰决策方法)[J].兵工自动化,2022(07):1-4

A类：

B类：

步数,Dyna,多功能雷达,雷达干扰,干扰决策,决策方法,收敛速度,过慢,决策算法,干扰策略,强化学习算法,可扩展,学习应用,借鉴价值

AB值：

0.308706

相似文献

利用强化学习开展比例导引律的导航比设计

李庆波;李芳;董瑞星;樊瑞山;谢文龙-上海机电工程研究所, 上海201109

考虑目标机动和落角约束的二阶滑模制导律

王思卓;范世鹏;林德福;刘经纬-北京理工大学宇航学院,北京100081;北京理工大学中国-阿联酋智能无人系统"一带一路"联合实验室, 北京100081

面向多目标参数整定的协同深度强化学习方法

罗森林;魏继勋;刘晓双;潘丽敏-北京理工大学信息与电子学院, 北京 100081

基于深度强化学习的无人机通信抗干扰算法

张惠婷;张然;刘敏提;丁元明-辽宁省通信网络与信息处理重点实验室, 辽宁大连 116622;大连大学信息工程学院, 辽宁大连 116622;西安电子科技大学雷达信号处理国家实验室, 西安 710071

协作多智能体深度强化学习研究综述

邹启杰;蒋亚军;高兵;李文雪;张汝波-大连大学信息工程学院,辽宁大连 116000;大连民族大学机电工程学院,辽宁大连 116000

基于强化学习的雷达干扰决策技术综述

朱霸坤;朱卫纲;李伟;杨莹;高天昊-航天工程大学,研究生院,北京 101000;航天工程大学,电子与光学系,北京 101000

改进型神经网络在雷达误差补偿中的应用

施裕升;王晓科;刘鑫;杨革文;高方君-上海机电工程研究所,上海 201000;上海航天技术研究院,上海 201000

基于改进DDPG的空战行为决策方法

殷宇维;王凡;吴奎;胡剑秋-江苏自动化研究所,江苏连云港 222061

基于深度强化学习潜艇攻防对抗训练指挥决策研究

郭洪宇;初阳;刘志;周玉芳-江苏自动化研究所,江苏连云港 222061

基于强化学习的雷达抗复合干扰

许佰涛;刘冬利;侯建强;李祎帆-海军大连舰艇学院学员五大队大连 116018;海军大连舰艇学院信息系统系大连 116018

基于强化学习提升双GNSS测向精度方法研究

刘佳铭;段静玄;张学良;林静-海装上海局驻上海地区第五代表室上海 200135;中国舰船研究设计中心武汉 430064

基于聚类分析方法的多功能雷达工作模式识别

翟龙军;但波;宋伟健;高山-海军航空大学烟台 264001

舰艇编队对预警机雷达干扰效果分析

夏宏阳;林晓烘;程志锋;叶灵军-海军工程大学,湖北武汉 430033

多智能体协同决策方法研究

张峰;李明强;唐思琦;金丹-中国电子科技集团公司信息科学研究院,北京 100046

基于强化学习的无人机智能任务分配方法

费陈;郑晗;赵亮-武警士官学校基础部,杭州 311400

基于算法支撑的电子战军事建模理论与应用研究

崔伟;崔钢;房磊-空军航空大学,吉林长春130022

基于两级卷积神经网络的相控阵雷达行为识别

周姝婧;陈凯翔;许强-中国船舶集团有限公司第八研究院,江苏扬州225101

FAHP-CRITIC欺骗干扰设备效能评估仿真分析

尹继泽;邓杏松-中国船舶集团有限公司第八研究院,江苏扬州 225101

基于强化学习的连续型机械臂自适应跟踪控制

江达;蔡志勤;刘忠振;彭海军;吴志刚-大连理工大学,辽宁大连116024;工业装备结构分析国家重点实验室,辽宁大连116024

基于随机策略搜索的多机三维路径规划方法

张森;张孟炎;邵敬平;普杰信-河南科技大学信息工程学院,河南洛阳471023

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。