传动技术 ›› 2022, Vol. 36 ›› Issue (3): 3-11.

• •    下一篇

基于迭代规划的P2混合动力能量管理策略

罗来军, 隋巧梅, 郭楠鸿   

  1. 联创汽车电子有限公司;上海交通大学动力装置与自动化研究所;
  • 出版日期:2022-09-30 发布日期:2022-09-30
  • 基金资助:
    上汽基金项目(编号1722)

  • Online:2022-09-30 Published:2022-09-30

摘要: 基于强化学习的能量管理策略具有环境和驾驶员的自适应性,但是存在采样效率较低、开发阶段无法保证算法可靠性的问题。尝试将动态规划算法融入基于模型的强化学习框架中——实时收集工况数据和动力系统数据用于更新预测模型,并使用动态规划求解最优策略,通过决策树算法挖掘其中最优控制规则,用以迭代能量管理策略。一方面,动态规划对完整工况重新解算极大增强了样本效率,且具有较好的可靠性和可解释性。另一方面,通过数据采集和更新实现能量管理策略的对驾驶工况和系统老化的自适应性,能够有效应对极端工作环境、动力系统元器件老化等传统能量管理策略会失效的场景。实验结果表明,在未知驾驶工况下,可以达到全局最优解的92%以上的管理效果;而且可以有效通过类似工况改善能量管理策略,例如日常通勤场景。当动力系统参数发生改变时,通过策略迭代也可以有效地调整能量管理策略。

关键词: 动态规划, 自适应, 能量管理策略, 插电式混合动力汽车, 强化学习

中图分类号: