基于SAC算法的无人机自主空战决策算法|李波;白双霞;孟波波;梁诗阳;李曾琳|西安现代控制技术研究所,陕西西安 710065 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于SAC算法的无人机自主空战决策算法

文献摘要：

针对无人机在空战过程中的自主决策问题,以无人机1v1攻防为背景提出了无人机近距空战模型.采用Markov决策过程建立了无人机自主机动模型,提出基于Soft Actor Critic(SAC)算法的无人机自主空战决策算法,以无人机空战态势数据作为输入,输出无人机机动指令,使得无人机通过完成指定指令,率先锁定敌方无人机并抢先攻击.最后,设计仿真实验,通过对比双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient Algorithm,TD3)算法,验证了基于SAC算法的无人机空战决策算法在增强策略探索的情况下,学习速度大幅度提高,使无人机在任意初始态势下主动占据优势,并成功打击目标,有效提高了无人机在空战决策过程中的自主性.

文献关键词：

无人机;空战决策算法;Soft Actor Critic;Markov决策过程

中图分类号：

[1] 航空、航天（V） / 航空（V2） / 各类型航空器（V27） / 无人驾驶飞机（V279）

[2] 武器工业（TJ） / 战车、战舰、战机、航天武器（TJ8） / 战机（TJ85）

[3] 航空、航天（V） / 航空（V2） / 航空仪表、航空设备、飞行控制与导航（V24） / 飞行控制系统与导航（V249）

作者姓名：

李波;白双霞;孟波波;梁诗阳;李曾琳

作者机构：

西北工业大学电子信息学院,陕西西安 710129;西安现代控制技术研究所,陕西西安 710065;洛阳电光设备研究所,河南洛阳 471000

文献出处：

指挥控制与仿真

引用格式：

[1]李波;白双霞;孟波波;梁诗阳;李曾琳-.基于SAC算法的无人机自主空战决策算法)[J].指挥控制与仿真,2022(05):24-30

A类：

空战决策算法,1v1

B类：

SAC,自主空战,自主决策,决策问题,攻防,近距,Markov,决策过程,主机,机动模型,Soft,Actor,Critic,敌方,抢先,双延迟深度确定性策略梯度,Twin,Delayed,Deep,Deterministic,Policy,Gradient,Algorithm,TD3,增强策略,策略探索,学习速度,大幅度提高,打击目标

AB值：

0.292841

相似文献

基于模糊PID的无人机空中加油轨迹跟踪控制

蔺玺坤;梁晓龙;任宝祥;侯岳奇;张志浩;齐铎-空军工程大学空管领航学院,西安 710051;陕西省电子信息系统综合集成重点实验室, 西安 710051

基于深度强化学习的无人机通信抗干扰算法

张惠婷;张然;刘敏提;丁元明-辽宁省通信网络与信息处理重点实验室, 辽宁大连 116622;大连大学信息工程学院, 辽宁大连 116622;西安电子科技大学雷达信号处理国家实验室, 西安 710071

基于区块链的无人机集群抗干扰通信模型

王浩同;刘白林;刘智平;李藕;赵涛-新型网络与检测控制国家地方联合工程实验室,西安 710021;西安工业大学计算机科学与工程学院,西安 710021;西北机电工程研究所,陕西咸阳 712099

基于改进NSGA-II算法的多目标无人机路径规划

樊娇;雷涛;董南江;王锐-陕西科技大学电子信息与人工智能学院,西安 710021;国防科技大学系统工程学院,长沙 410073

诱饵干扰下无人机集群攻击阈值控制方法