金融界2024年3月13日消息,据国家知识产权局公告,深圳前海微众银行股份有限公司申请一项名为“稀疏奖励环境下的强化学习方法、电子设备及存储介质“,公开号CN117689040A,申请日期为2023年12月。
专利摘要显示,本申请提供一种稀疏奖励环境下的强化学习方法、电子设备及计算机可读存储介质,方法包括:获取指定应用场景中的第一智能体;确定多个智能体中的每一智能体与第一智能体的影响程度,得到多个影响程度,根据多个影响程度生成第一智能体的影响矩阵;根据多个智能体中的每一智能体的位置与第一智能体的位置之间的位置关系生成第一智能体的距离矩阵;根据影响矩阵和距离矩阵确定第一智能体的奖励系数矩阵;根据奖励系数矩阵和参考奖励矩阵确定目标奖励矩阵;将目标奖励矩阵添加到第一智能体的目标函数中,得到最终目标函数。采用本申请实施例在稀疏奖励的情况下,考虑团队整体利益的前提下,解决智能体之间奖励冲突的问题。
本文源自金融界