当前位置:首页 > 科技文档 > 数学 > 正文

基于无模型策略梯度强化学习的未知随机系统最优控制

自动化学报 页数: 11 2025-10-10
摘要: 针对一类未知动力学马尔科夫随机系统的最优控制问题,提出两种无模型策略梯度强化学习算法.首先,针对模型信息部分未知的马尔科夫随机系统,基于系统采样数据和耦合李雅普诺夫方程推导出无模型策略梯度的解析形式,并提出一种部分无模型策略梯度强化学习最优控制算法,实现对预设性能指标的直接最小化.由于求解耦合李雅普诺夫方程和计算策略梯度的必要数据均可从系统采样数据同一轨迹提取,而无需再额外收集... (共11页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报