×

中信银行申请双向反馈协同深度强化学习专利,有效解决强化学习不能有效纳入人类知识的问题德国和江苏同为8000多万人,德国创造4.45万亿GDP,江苏是多少?

hqy hqy 发表于2025-03-02 21:00:30 浏览7 评论0百度已收录

抢沙发发表评论

金融界2024年3月19日消息,据国家知识产权局公告,中信银行股份有限公司申请一项名为“一种基于双向反馈的协同深度强化学习方法及系统“,公开号CN117725984A,申请日期为2023年12月。

专利摘要显示,本发明涉及一种基于双向反馈的协同深度强化学习方法及系统,分别迭代执行基于人工操作数据的监督学习任务与基于输入策略的强化学习迭代任务,并依据阶段策略更新环境信息类以逼近最优策略,首先通过深度神经网络学习人类探索的策略,然后通过策略评估和迭代来进一步对策略进行提升,同时不断地与环境交互持续提升策略,有效地解决了强化学习不能有效纳入人类知识的问题,特别适用于训练用于部署在物联网平台的控制器,实现下发最优控制器指令达到预定目标。

本文源自金融界