×

浪潮软件科技申请基于改进深度确定性策略梯度算法的机器人运动控制专利,加快收敛速度并提升最终运动控制策略的性能三国中程昱、郭嘉合体比不上他,占益州斩夏侯渊都是他的功劳,诸葛亮曹操都佩服他

hqy hqy 发表于2025-04-07 00:50:49 浏览8 评论0百度已收录

抢沙发发表评论

金融界2024年11月29日消息,国家知识产权局信息显示,浪潮软件科技有限公司申请一项名为“基于改进深度确定性策略梯度算法的机器人运动控制方法”的专利,公开号 CN 119036475 A,申请日期为2024年10月。

专利摘要显示,本发明公开了基于改进深度确定性策略梯度算法的机器人运动控制方法,属于深度强化学习和机器人运动控制技术领域,通过自适应经验回放机制,对经验缓冲池中的经验数据进行筛选;通过经验数据的优先级采样策略,提升经验数据的利用效率;所述自适应经验回放机制,基于机器人的状态空间和动作空间的维度,设计多个经验缓冲区,并设计各缓冲区之间分类阈值的计算方式;所述经验数据的优先级采样策略,采用时间差分误差和即时奖励相结合的方式,计算出经验缓冲池中每个经验数据的样本优先级,将经验数据分发到不同的经验缓冲区。本发明加快收敛速度并提升最终运动控制策略的性能,增强机器人对复杂环境动态的适应能力和行为控制策略的稳定性。