典型文献
藏族久棋的一种两阶段计算机博弈算法
文献摘要:
为了进一步提升布局的质量以提升藏族久棋博弈智能体程序棋力,提出了藏族久棋的一种两阶段计算机博弈算法,为藏族久棋的布局阶段设计了基于卷积神经网络和蒙特卡洛树搜索的自对弈算法,通过卷积神经网络指导蒙特卡洛树进行搜索,训练出最优模型并生成质量更高的着法;为战斗阶段设计了基于领域知识的Alpha-Beta剪枝算法.通过设计分阶段算法的方式将深度强化学习与领域知识相结合,试图解决藏族久棋博弈算法研究棋谱数据匮乏、博弈智能体的棋力水平较低等问题.实验结果表明:基于两阶段算法的博弈智能体程序与全局使用Alpha-Beta剪枝算法的博弈程序、人类一段棋手进行对弈,分别取得了65%、60%的胜率.基于两阶段算法的博弈智能体程序在一定程度上具备了"学习"和"思考"的能力,棋力得到了提升.
文献关键词:
藏族久棋;卷积神经网络;蒙特卡洛树搜索;自对弈;Alpha-Beta剪枝
中图分类号:
作者姓名:
李霞丽;陈彦东;杨子熠;张焱垠;吴立成
作者机构:
中央民族大学 信息工程学院, 北京 100081
文献出处:
引用格式:
[1]李霞丽;陈彦东;杨子熠;张焱垠;吴立成-.藏族久棋的一种两阶段计算机博弈算法)[J].重庆理工大学学报,2022(12):110-120
A类:
藏族久棋,自对弈
B类:
两阶段,计算机博弈,博弈算法,智能体,棋力,蒙特卡洛树搜索,练出,最优模型,着法,领域知识,Alpha,Beta,剪枝算法,分阶段,深度强化学习,识相,图解,算法研究,棋谱,谱数据,数据匮乏,棋手,胜率
AB值:
0.24783
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。