首站-论文投稿智能助手
典型文献
基于强化学习的部分线性离散时间系统的最优输出调节
文献摘要:
针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题,提出了仅利用在线数据的基于强化学习的数据驱动控制方法.首先,该问题可拆分为一个受约束的静态优化问题和一个动态规划问题,第一个问题可以解出调节器方程的解.第二个问题可以确定出控制器的最优反馈增益.然后,运用小增益定理证明了存在非线性不确定性离散时间部分线性系统的最优输出调节问题的稳定性.针对传统的控制方法需要准确的系统模型参数用来解决这两个优化问题,提出了一种数据驱动离线策略更新算法,该算法仅使用在线数据找到动态规划问题的解.然后,基于动态规划问题的解,利用在线数据为静态优化问题提供了最优解.最后,仿真结果验证了该方法的有效性.
文献关键词:
输出调节;离散时间系统;强化学习;非线性未知动态
作者姓名:
庞文砚;范家璐;姜艺;LEWIS Frank Leroy
作者机构:
东北大学流程工业综合自动化国家重点实验室 沈阳 110819 中国;德克萨斯大学阿灵顿分校 沃斯堡 76118 美国
文献出处:
引用格式:
[1]庞文砚;范家璐;姜艺;LEWIS Frank Leroy-.基于强化学习的部分线性离散时间系统的最优输出调节)[J].自动化学报,2022(09):2242-2253
A类:
最优输出调节,非线性未知动态
B类:
强化学习,分线,离散时间系统,有线,外部干扰,线性系统,数据驱动控制,拆分,受约束,静态优化,优化问题,动态规划,规划问题,解出,调节器,方程的解,反馈增益,小增益定理,定理证明,系统模型,离线,新算法,最优解
AB值:
0.269947
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。