AI
西部智能网联申请针对多车强化学习的决策方法专利,提升多车行驶决策安全性
hqy 发表于2025-04-27 浏览10 评论0
本文源自:金融界
金融界2025年4月24日消息,国家知识产权局信息显示,西部科学城智能网联汽车创新中心(重庆)有限公司申请一项名为“针对多车强化学习的决策方法、装置、存储介质及设备”的专利,公开号CN119807896A,申请日期为2024年12月。
AI
中信证券|强化底线思维,充分备足预案:政治局会议学习体会
hqy 发表于2025-04-27 浏览14 评论0
来源:中信证券研究
文|杨帆 明明 姜娅 于翔 玛西高娃
AI
南京码讯申请基于强化学习的边缘计算资源分配优化专利,实现边缘计算资源分配的智能化优化
hqy 发表于2025-04-27 浏览17 评论0
本文源自:金融界
金融界2025年4月26日消息,国家知识产权局信息显示,南京码讯光电技术有限公司申请一项名为“一种基于强化学习的边缘计算资源分配优化方法及系统”的专利,公开号CN119862029A,申请日期为2024年12月。
AI
阳泉市乾盛科技申请基于强化学习制备降尘剂专利,能够不断学习优化
hqy 发表于2025-04-27 浏览14 评论0
本文源自:金融界
金融界2025年4月26日消息,国家知识产权局信息显示,阳泉市乾盛科技有限公司申请一项名为“基于强化学习制备降尘剂的控制系统、方法及设备”的专利,公开号CN119861573A,申请日期为2025年3月。
AI
郑州大学产业技术研究院有限公司取得基于强化学习的探索方法、装置和智能设备专利
hqy 发表于2025-04-27 浏览17 评论0
本文源自:金融界
金融界2025年4月26日消息,国家知识产权局信息显示,郑州大学产业技术研究院有限公司取得一项名为“基于强化学习的探索方法、装置和智能设备”的专利,授权公告号 CN 114859932 B,申请日期为 2022 年 5 月 。

AI
【动态】强化总规学习认识,提升实施总规本领——2025年市规划资源系统青年干部培训班开展“上海2035”总规专题学习培训
hqy 发表于2025-04-27 浏览12 评论0
为深入学习领会市委主要领导在市规划资源局领导班子民主生活会上的讲话精神,落实局主要领导在2025年青年干部培训班开班式上的指示要求,进一步强化贯彻落实城市总规的思想自觉、行动自觉,4月23日下午,市规划资源系统青年干部培训班全体学员赴上海城市规划展示馆,开展“上海2035”城市总规现场教学培训。
AI
结合案例讲解什么是强化学习
hqy 发表于2025-04-27 浏览22 评论0
AI
强化学习的三大支柱:时序差分、贝尔曼方程与马尔可夫性质的剖析
hqy 发表于2025-04-27 浏览20 评论0
1、时序差分(TD)与贝尔曼方程的关系
时序差分(Temporal Difference, TD)方法与贝尔曼方程是强化学习中理论与算法的核心结合。
AI
李飞飞等领衔,来自七所高校“三代AI人”联合提出强化学习新框架
hqy 发表于2025-04-27 浏览14 评论0
00 后王子涵,是 DeepSeek 的前实习生,曾参与 DeepSeek-V2 的开发。其本科毕业于中国人民大学,目前在美国西北大学读博。
AI
强化学习框架重大突破:RAGEN如何让AI Agent在行动中深度思考?
hqy 发表于2025-04-27 浏览17 评论0
2025年,强化学习领域迎来重大突破——由斯坦福李飞飞团队与DeepSeek前核心成员Zihan Wang领衔的研究团队,成功复现并升级了R1强化学习框架,推出全新模块化系统RAGEN。这一框架不仅解决了多轮强化学习训练中“崩溃率高”“推理能力衰退”的行业痛点,更让AI Agent在复杂任务中展现出人类般的深度思考能力。本文独家揭秘RAGEN的技术内核,看它如何重塑AI的“决策思维”。