首页
汉语
专业
百科
科普
文档
教育
全部分类
汉字
翻译
图片
医学
人物
历史
名言
古诗词
教育
曲谱
APP
学习中心
海量资源,尽在掌握
搜索
当前位置:
首页
>
科技文档
>
数学
> 正文
基于无模型策略梯度强化学习的未知随机系统最优控制
自动化学报
页数: 11
2025-10-10
摘要:
针对一类未知动力学马尔科夫随机系统的最优控制问题,提出两种无模型策略梯度强化学习算法.首先,针对模型信息部分未知的马尔科夫随机系统,基于系统采样数据和耦合李雅普诺夫方程推导出无模型策略梯度的解析形式,并提出一种部分无模型策略梯度强化学习最优控制算法,实现对预设性能指标的直接最小化.由于求解耦合李雅普诺夫方程和计算策略梯度的必要数据均可从系统采样数据同一轨迹提取,而无需再额外收集... (共11页)
下载PDF原文【1193K】
开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击
申诉举报
实用文档
PPT模板
word合同
综合范文
年终总结
工作总结
工作计划
工作方案
简历模板
职业规划
工作策划
自我介绍
自我鉴定
转正申请
教学计划
教学设计
教学心得
教学反思
教学总结
实习报告
述职报告
实践报告
调查报告
辞职报告
开题报告
心得体会
试用期
欢迎词
祝酒词
答谢词
观后感
发言稿
演讲稿
主持稿
请假条
感谢信
介绍信
读后感
建议书
责任书
协议书
申请书
意向书
委托书
表扬信
检举信
道歉信
慰问信
求职信
保证书
倡议书
承诺书
说课稿
检讨书
试题
课件
教案
合同
贺词
科技文档
数学
力学
化学
金融
证券
保险
投资
会计
审计
园艺
林业
旅游
体育
物理学
生物学
天文学
气象学
海洋学
地质学
新能源
金属学
农艺学
农作物
管理学
领导学
自然科学
系统科学
资源科学
无机化工
有机化工
燃料化工
化学工业
材料科学
矿业工程
冶金工业
安全科学
环境科学
工业通用
机械工业
无线电子
电信技术
铁路运输
汽车工业
船舶工业
动力工程
电力工业
农业科学
农业工程
植物保护
动物医学
教育理论
学前教育
初等教育
中等教育
高等教育
职业教育
成人教育
自然地理
地球物理
经济统计
农业经济
工业经济
交通经济
企业经济
文化经济
信息经济
贸易经济
财政税收
市场研究
科学研究
互联网
自动化
轻工业
核科学
服务业
石油然气
服务业
野生动物
水产渔业
硬件
仪器仪表
航空航天
武器军事
公路运输
水利水电
建筑科学
软件
医学文档
医药学
中医学
中药学
外科学
儿科学
肿瘤学
内分泌
心血管
中西医
医学教育
预防医学
基础医学
临床医学
泌尿科学
妇产科学
神经病学
精神病学
口腔科学
特种医学
急救医学
政策法规
呼吸系统
消化系统
皮肤性病
眼耳鼻喉
感染性病