当前位置:首页 > 科技文档 > 动力工程 > 正文

基于深度确定性策略梯度算法的综合能源系统自动发电控制

高电压技术 页数: 13 2025-03-26
摘要: “双碳”目标推动大规模新能源并网并引入强随机扰动,使传统控制方法难以获得多区域协同的最优解;尽管强化学习可应对该问题,但其在智能体与环境交互中产生的过度估计偏差及奖励噪声仍会影响控制性能。为此,提出一种面向综合能源系统的多智能体协同自动发电控制算法,即基于行为克隆的综合价值估计双延迟深度确定性策略梯度算法来获取多区域协同最优解,其通过行为克隆引入策略约束,以缓解在与环境交互时所... (共13页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报