典型文献
基于值分解的多智能体深度强化学习综述
文献摘要:
基于值分解的多智能体深度强化学习是众多多智能体深度强化学习算法中的一类,也是多智能体深度强化学习领域的一个研究热点.它利用某种约束将多智能体系统的联合动作值函数分解为个体动作值函数的某种特定组合,能够有效解决多智能体系统中的环境非稳定性和动作空间指数爆炸等问题.文中首先说明了进行值函数分解的原因;其次,介绍了多智能体深度强化学习的基本理论;接着根据是否引入其他机制以及引入机制的不同将基于值分解的多智能体深度强化学习算法分为3类:简单因子分解型、基于IG M(个体-全局-最大)原则型以及基于注意力机制型;然后按分类重点介绍了几种典型算法并对算法的优缺点进行对比分析;最后简要阐述了所提算法的应用和发展前景.
文献关键词:
值函数分解;多智能体深度强化学习;注意力机制;IG M原则
中图分类号:
作者姓名:
熊丽琴;曹雷;赖俊;陈希亮
作者机构:
陆军工程大学指挥控制工程学院 南京210007
文献出处:
引用格式:
[1]熊丽琴;曹雷;赖俊;陈希亮-.基于值分解的多智能体深度强化学习综述)[J].计算机科学,2022(09):172-182
A类:
值函数分解
B类:
值分解,多智能体深度强化学习,多多,深度强化学习算法,学习领域,多智能体系统,动作值函数,动作空间,引入机制,单因子,因子分解,IG,注意力机制,应用和发展
AB值:
0.160061
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。