典型文献
基于迭代规划的P2混合动力能量管理策略
文献摘要:
基于强化学习的能量管理策略具有环境和驾驶员的自适应性,但是存在采样效率较低、开发阶段无法保证算法可靠性的问题.尝试将动态规划算法融入基于模型的强化学习框架中——实时收集工况数据和动力系统数据用于更新预测模型,并使用动态规划求解最优策略,通过决策树算法挖掘其中最优控制规则,用以迭代能量管理策略.一方面,动态规划对完整工况重新解算极大增强了样本效率,且具有较好的可靠性和可解释性.另一方面,通过数据采集和更新实现能量管理策略的对驾驶工况和系统老化的自适应性,能够有效应对极端工作环境、动力系统元器件老化等传统能量管理策略会失效的场景.实验结果表明,在未知驾驶工况下,可以达到全局最优解的92%以上的管理效果;而且可以有效通过类似工况改善能量管理策略,例如日常通勤场景.当动力系统参数发生改变时,通过策略迭代也可以有效地调整能量管理策略.
文献关键词:
动态规划;自适应;能量管理策略;插电式混合动力汽车;强化学习
中图分类号:
作者姓名:
罗来军;隋巧梅;郭楠鸿
作者机构:
联创汽车电子有限公司,上海201206;上海交通大学动力装置与自动化研究所,上海200240
文献出处:
引用格式:
[1]罗来军;隋巧梅;郭楠鸿-.基于迭代规划的P2混合动力能量管理策略)[J].传动技术,2022(03):3-11
A类:
基于模型的强化学习
B类:
P2,力能,能量管理策略,略具,驾驶员,自适应性,采样效率,开发阶段,动态规划算法,算法融入,工况数据,动力系统,系统数据,规划求解,最优策略,决策树算法,最优控制,控制规则,新解,样本效率,可解释性,驾驶工况,对极,元器件,全局最优解,管理效果,通勤,系统参数,数发,策略迭代,插电式混合动力汽车
AB值:
0.312984
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。