当前位置:首页 > 科技文档 > 航空航天 > 正文

基于深度强化学习调参的制导控制一体化方法

航空学报 页数: 12 2025-07-01
摘要: 针对高超声速飞行器制导控制参数动态优化问题,提出一种基于双延迟深度确定性策略梯度(TD3)算法的深度强化学习调参方法。首先,建立了高超声速飞行器的运动模型与制导控制一体化模型,并设计了基于反步法的控制器,通过Lyapunov稳定性证明了其一致最终有界;然后,将控制器参数优化问题转化为马尔可夫决策过程模型,基于TD3算法实现了数据驱动的控制器参数在线自适应优化。该方法构建了融合模... (共12页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报