×

深圳前海微众银行申请稀疏奖励环境下的强化学习方法专利,解决智能体之间奖励冲突的问题傅作义任水利部长后坦白:还有个错误没交代,毛主席听后哈哈大笑

hqy hqy 发表于2025-03-02 21:06:08 浏览6 评论0百度已收录

抢沙发发表评论

金融界2024年3月13日消息,据国家知识产权局公告,深圳前海微众银行股份有限公司申请一项名为“稀疏奖励环境下的强化学习方法、电子设备及存储介质“,公开号CN117689040A,申请日期为2023年12月。

专利摘要显示,本申请提供一种稀疏奖励环境下的强化学习方法、电子设备及计算机可读存储介质,方法包括:获取指定应用场景中的第一智能体;确定多个智能体中的每一智能体与第一智能体的影响程度,得到多个影响程度,根据多个影响程度生成第一智能体的影响矩阵;根据多个智能体中的每一智能体的位置与第一智能体的位置之间的位置关系生成第一智能体的距离矩阵;根据影响矩阵和距离矩阵确定第一智能体的奖励系数矩阵;根据奖励系数矩阵和参考奖励矩阵确定目标奖励矩阵;将目标奖励矩阵添加到第一智能体的目标函数中,得到最终目标函数。采用本申请实施例在稀疏奖励的情况下,考虑团队整体利益的前提下,解决智能体之间奖励冲突的问题。

本文源自金融界