当前位置:首页 > 科技文档 > 数学 > 正文

对手类型未知情况下的两人零和马尔科夫博弈决策

控制理论与应用 页数: 8 2024-11-15
摘要: 本文研究一类典型的非完全信息博弈问题—–对手类型未知的两人零和马尔科夫博弈,其中对手类型多样且每次博弈开始前无法得知对手类型.文中提出了一种基于模型的多智能体强化学习算法—–对手辨识的极大极小Q学习(DOMQ).该算法首先建立对手相关环境的经验模型,再使用经验模型学习纳什均衡策略,己方智能体在实际博弈中根据经验模型判断对手类型,从而使用相应的纳什均衡策略,以保证收益下限.本文所... (共8页)

开通会员,享受整站包年服务