典型文献
基于SAC算法的无人机自主空战决策算法
文献摘要:
针对无人机在空战过程中的自主决策问题,以无人机1v1攻防为背景提出了无人机近距空战模型.采用Markov决策过程建立了无人机自主机动模型,提出基于Soft Actor Critic(SAC)算法的无人机自主空战决策算法,以无人机空战态势数据作为输入,输出无人机机动指令,使得无人机通过完成指定指令,率先锁定敌方无人机并抢先攻击.最后,设计仿真实验,通过对比双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient Algorithm,TD3)算法,验证了基于SAC算法的无人机空战决策算法在增强策略探索的情况下,学习速度大幅度提高,使无人机在任意初始态势下主动占据优势,并成功打击目标,有效提高了无人机在空战决策过程中的自主性.
文献关键词:
无人机;空战决策算法;Soft Actor Critic;Markov决策过程
中图分类号:
作者姓名:
李波;白双霞;孟波波;梁诗阳;李曾琳
作者机构:
西北工业大学电子信息学院,陕西 西安 710129;西安现代控制技术研究所,陕西 西安 710065;洛阳电光设备研究所,河南 洛阳 471000
文献出处:
引用格式:
[1]李波;白双霞;孟波波;梁诗阳;李曾琳-.基于SAC算法的无人机自主空战决策算法)[J].指挥控制与仿真,2022(05):24-30
A类:
空战决策算法,1v1
B类:
SAC,自主空战,自主决策,决策问题,攻防,近距,Markov,决策过程,主机,机动模型,Soft,Actor,Critic,敌方,抢先,双延迟深度确定性策略梯度,Twin,Delayed,Deep,Deterministic,Policy,Gradient,Algorithm,TD3,增强策略,策略探索,学习速度,大幅度提高,打击目标
AB值:
0.292841
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。