AI
江苏星昊包装科技申请一种优化标签关键指标的近端策略优化强化学习方法专利,提高粘附性和标签的整体结构稳定性
hqy 发表于2025-02-27 浏览5 评论0
金融界2025年2月22日消息,国家知识产权局信息显示,江苏星昊包装科技有限公司申请一项名为“一种优化标签关键指标的近端策略优化强化学习方法”的专利,公开号CN 119494360 A,申请日期为2024年11月。
AI
贵州电网申请基于深度强化学习的电动汽车集群调度策略及系统专利,降低城市电网系统的负荷压力
hqy 发表于2025-02-27 浏览2 评论0
本文源自:金融界
金融界2025年2月22日消息,国家知识产权局信息显示,贵州电网有限责任公司申请一项名为“一种基于深度强化学习的电动汽车集群调度策略及系统”的专利,公开号CN 119494485 A,申请日期为2024年9月。
AI
强化学习 Scaling Law 遭挑战:数据量非关键,质量与相关性才是核心
hqy 发表于2025-02-27 浏览4 评论0
AI
强化学习不愧“顶会收割机”!2大创新思路带你上分,毕业不愁!
hqy 发表于2025-02-27 浏览6 评论0
强化学习之父Richard Sutton悄悄搞了个大的,提出了一个简单思路:奖励聚中。这思路简单效果却不简单,等于是给几乎所有的强化学习算法上了一个增强buff,所以这篇论文已经入选了首届强化学习会议(RLC 2024),对于强化学习领域的同学来说,非常值得一读。
AI
一文看懂什么是强化学习?应用场景和主流算法
hqy 发表于2025-02-27 浏览8 评论0
AI
学习二十届三中全会心得体会:深刻领会、强化学习、聚焦重点
hqy 发表于2025-02-27 浏览7 评论0
今天分享给大家的是二十届三中全会内容心得体会精彩范文,作者从事写作十余年,经常听到身边笔友说写作的时候没有范文作参考,没有思路搭框架,尤其是遇到单位领导催的比较急的稿子,心里如热锅上的蚂蚁急得团团转。我们在这里给大家分享精彩范文,让大家告别加班熬夜,请大家多多指点。全文框架如下:
AI
1分钟明白什么是强化学习
hqy 发表于2025-02-27 浏览7 评论0
强化学习是一种机器学习方法,用于通过学习如何做出决策来解决目标导向的问题。在强化学习中,一个代理与环境交互,通过尝试不同的动作来最大化它所接收到的奖励。
AI
什么是强化学习?
hqy 发表于2025-02-27 浏览8 评论0
强化学习(reinforcement learning,RL)讨论的问题是智能体(agent)怎么在复杂、不确定的环境(environment)中最大化它能获得的奖励。如图1.1 所示,强化学习由两部分组成:智能体和环境。在强化学习过程中,智能体与环境一直在交互。智能体在环境中获取某个状态后,它会利用该状态输出一个动作(action),这个动作也称为决策(decision)。然后这个动作会在环境中被执行,环境会根据智能体采取的动作,输出下一个状态以及当前这个动作带来的奖励。智能体的目的就是尽可能多地从环境中获取奖励。
AI
一文看懂什么是强化学习?(基本概念+应用场景+主流算法+案例)
hqy 发表于2025-02-27 浏览5 评论0
导读
AI
商汤绝影发布“强化学习”端到端自动驾驶方案,上海车展将实现实车部署
hqy 发表于2025-02-27 浏览6 评论0
商汤绝影发布了基于世界模型协同交互的端到端技术路线R-UniAD,这一技术路线从模仿学习发展到强化学习,预计将超越人类驾驶表现。商汤绝影将在上海车展上重磅发布R-UniAD的实车部署计划。