金融界2024年10月24日消息,国家知识产权局信息显示,玄象极悟(北京)科技有限公司申请一项名为“基于概率模型集成的深度强化学习方法、装置和电子设备”的专利,公开号 CN 118798305 A,申请日期为2024年5月。
专利摘要显示,本申请涉及一种基于概率模型集成的深度强化学习方法、装置和电子设备,包括选取损耗函数,分别获取状态参数和动作参数,输入所述损耗函数,得到状态转换预测结果,获取若干概率预测模型,将所述状态参数、所述动作参数和所述损耗函数输入若干所述概率预测模型后,集成若干所述概率预测模型。通过该方法,能够有效的捕获偶然不确定性和处理认知不确定性,在能够处理认知不确定性后,能够让使用的样本数量大大减小。另一方面,能够更加适应初始训练数据集小后续训练样本数据集大的情况,并且能够适应数据集不连续的情况,极大减弱了过拟合问题,整体上更好的适应复杂系统的动态性。