金融界2025年4月30日消息,国家知识产权局信息显示,中国电力科学研究院有限公司申请一项名为“一种基于强化学习的电网仿真环境调度优化方法及系统”的专利,公开号CN119886450A,申请日期为2025年1月。
专利摘要显示,本发明公开了一种基于强化学习的电网仿真环境调度优化方法及系统,设计多目标奖励函数体系以及结合奖励的约束限制的双重保险机制。在A3C算法的训练过程中,结合高比例新能源并网的实际条件进行修改,通过引入电网安全性指标,能够有效地维护电力系统的安全稳定运行,并进行被动式的动作筛选缩小单步的动作空间维度,加快强化学习的收敛速度,增强A3C算法在电网调度优化中的实时性。然后,通过结合经济成本、发电机组的输出限制和输电线路的容量限制等,确保算法在训练过程中能够全面考虑并有效处理这些约束条件。通过这种规范化的约束处理机制,使得生成的调度策略不仅符合电力系统的实际运行要求,还能在多种复杂约束条件下实现优化。
本文源自金融界