当前位置:首页 > 科技文档 > 体育 > 正文

基于强化监督协同学习的斗地主博弈策略研究

摘要: 斗地主是中国民间最流行的纸牌玩法之一,具有不完全信息博弈和随机博弈的特征。在斗地主博弈过程中,既有攻守双方的对抗又有同伴之间的合作,是目前最复杂的博弈类型之一。分析了斗地主的博弈过程,从参与者、历史集合、参与者函数、信息空间、自然概率分布函数和参与者的偏好等6个方面描述了斗地主的博弈模型。模型为研究斗地主计算机博弈的理论或程序算法提供了理论依据和参考。研究将强化学习的DDQN(... (共6页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报