AI
龙粤环保申请污水处理智能控制方法专利,深度强化学习模型实时适应环境变化
hqy 发表于2025-06-10 浏览22 评论0
本文源自:金融界
金融界2025年6月7日消息,国家知识产权局信息显示,广州市龙粤环保机械设备有限公司申请一项名为“一种污水处理智能控制方法”的专利,公开号CN120097501A,申请日期为2025年03月。
AI
安戈普罗申请结合课程学习和强化学习的药物分子设计系统专利,提高药物候选分子的筛选效率和成功率
hqy 发表于2025-06-10 浏览27 评论0
本文源自:金融界
金融界2025年6月7日消息,国家知识产权局信息显示,北京安戈普罗科技有限公司申请一项名为“一种结合课程学习和强化学习的药物分子设计系统”的专利,公开号CN120108560A,申请日期为2025年04月。
AI
航天凯特申请基于深度强化学习的自适应机器人轨迹规划方法及系统专利,显著增强机器人在复杂动态环境中的运动规划能力与执行效率
hqy 发表于2025-06-10 浏览29 评论0
本文源自:金融界
金融界2025年6月7日消息,国家知识产权局信息显示,成都航天凯特机电科技有限公司申请一项名为“基于深度强化学习的自适应机器人轨迹规划方法及系统”的专利,公开号CN120095834A,申请日期为2025年05月。
AI
强化学习之父Richard Sutton智源大会最新演讲:欢迎来到经验时代!
hqy 发表于2025-06-10 浏览20 评论0
AI
Cursor核心成员圆桌:用强化学习训练编码超级模型 | 2万字全文·附视频
hqy 发表于2025-06-10 浏览33 评论0
未经许可不得转载,务必保留公众号名片
AI
英伟达首席科学家:美禁令导致人才都去了华为;机构:特定领域GenAI占比2030年将达50%;英伟达市值两个月攀升万亿美元
hqy 发表于2025-06-10 浏览26 评论0
图片系AI生成
AI
强化学习教育,筑牢成长根基
hqy 发表于2025-06-10 浏览24 评论0
在当今时代,学习教育的重要性愈发凸显,它宛如一盏明灯,照亮个人前行的道路,为社会发展注入源源不断的动力。
学习教育是个人成长的基石。从呱呱坠地起,我们便开启了学习之旅。在学校,系统的知识学习让我们掌握科学文化,构建起认知世界的框架。语文教会我们用优美文字表达情感,数学培养逻辑思维,自然科学带我们探索宇宙万物奥秘。步入社会后,持续的学习教育同样不可或缺。职业技能培训能让我们紧跟行业发展潮流,提升工作能力,在竞争激烈的职场中站稳脚跟。例如,程序员不断学习新的编程语言和算法,才能开发出更优质高效的软件;手工艺人通过学习新的技法和设计理念,使传统手艺焕发出新的生机。而且,道德与法治教育塑造我们的价值观和行为准则,引导我们成为有责任感、遵纪守法的公民。正是在学习教育的滋养下,个人不断完善自我,实现从懵懂无知到成熟睿智的蜕变。
AI
UCB提出无需外部奖励的强化学习方法,只靠自信就能学习复杂推理
hqy 发表于2025-06-10 浏览20 评论0
最近几个月来,可验证奖励强化学习(RLVR,Reinforcement Learning with Verifiable Rewards)愈发受到学界关注。相比起传统的基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback,)带来的高昂成本和人类偏见,RLVR 通过引入可自动验证的奖励信号(如数学问题的标准答案、代码测试用例的通过情况)在一定程度上降低了对人工标注的依赖,但是,其应用范围又受限于那些能够提供清晰、可验证奖励的特定领域,因此限制了模型在更广泛、更开放场景中的应用。

AI
算法人生(22):从“生成对抗网络”看“逆商提升”探秘彗星起源:奥尔特云的神秘面纱
hqy 发表于2025-06-10 浏览22 评论0
在之前的文章里,我们用了不少产品、运营的模型、方法在职业规划、人生上。这篇文章,我们用深度学习的方法——生成对抗网络,试试在提升我们自己的逆商上,是否有帮助。

AI
算法人生(23):跟着“生成对抗网络”思维走出“拖延”就能力和贤德而言,历史上的十大贤后该如何排名
hqy 发表于2025-06-10 浏览27 评论0
在之前的文章中,我们尝试用GANs做了目标设定,那是不是还可以应用到别的地方?这篇文章,我们用GANs来解决工作完成最大的敌人——拖延症的问题。