×

AI

清华大学:光芯片研究新进展 填补空白

hqy hqy 发表于2025-07-04 浏览3 评论0

【中国科学家在智能光芯片研究获新成果】清华大学电子工程系方璐教授课题组和自动化系戴琼海院士课题组于日前实现光计算系统大规模神经网络的高效精准训练。该研究成果于 8 月 7 日晚在线发表于《自然》期刊,两个课题组构建光子传播对称性模型,摒弃电训练反向传播范式,首创全前向智能光计算训练架构,研制通用光训练芯片“太极-II”,摆脱对离线训练的依赖,填补智能光计算在大规模训练这一核心拼图的空白。

深度神经网络中的梯度消失问题,如何解决?扁担女孩成绩出炉第2天,工作地点就遭围堵,游客的反馈令人寒心

AI

深度神经网络中的梯度消失问题,如何解决?扁担女孩成绩出炉第2天,工作地点就遭围堵,游客的反馈令人寒心

hqy hqy 发表于2025-07-04 浏览2 评论0

在深度神经网络中,梯度消失问题是一个常见且棘手的问题,它会导致网络训练效率低下,甚至完全无法学习。梯度消失主要发生在基于梯度的学习算法中,尤其是在深层网络中。本文将详细探讨梯度消失的原因以及多种有效的解决策略。

AI

上海燧原取得深度学习模型可逆化相关专利,提高反向传播计算的效率42岁尼格买提新疆老家曝光,千平豪宅好似宫殿,院子太惊艳

hqy hqy 发表于2025-07-04 浏览2 评论0

金融界 2024 年 9 月 17 日消息,天眼查知识产权信息显示,上海燧原科技股份有限公司取得一项名为“深度学习模型可逆化的全局优化方法、装置、设备及介质“,授权公告号 CN202410793018.5,申请日期为 2024 年 6 月。

AI

CUDA性能优化实战:7个步骤让并行归约算法提升10倍效率

hqy hqy 发表于2025-07-04 浏览2 评论0

本文深入探讨了一个经典的并行计算算法——并行归约(Parallel Reduction)的性能优化过程,通过七个渐进式的优化步骤,展示了如何将算法性能提升至极致。这项研究基于Mark Harris在NVIDIA网络研讨会中提出的优化方法,在重现这些优化技术的同时,进一步简化了概念阐述以便于理解。配套的GitHub代码库提供了完整的实现细节,为读者深入研究提供了详实的技术支撑。