×

AI

CUDA性能优化实战:7个步骤让并行归约算法提升10倍效率

hqy hqy 发表于2025-07-04 浏览2 评论0

本文深入探讨了一个经典的并行计算算法——并行归约(Parallel Reduction)的性能优化过程,通过七个渐进式的优化步骤,展示了如何将算法性能提升至极致。这项研究基于Mark Harris在NVIDIA网络研讨会中提出的优化方法,在重现这些优化技术的同时,进一步简化了概念阐述以便于理解。配套的GitHub代码库提供了完整的实现细节,为读者深入研究提供了详实的技术支撑。

AI

北京君正取得一种车辆检测训练中网络结构的设计方法专利,提高车辆检测训练中网络结构设计的准确性“第一个吃螃蟹的人?”福耀科技大学招到了第一名学生,合影流出

hqy hqy 发表于2025-07-04 浏览1 评论0

金融界2024年8月8日消息,天眼查知识产权信息显示,北京君正集成电路股份有限公司取得一项名为“一种车辆检测训练中网络结构的设计方法“,授权公告号 CN113673667B,申请日期为 2020 年 5 月。

AI

世平信息申请卷积神经网络训练方法及系统专利,在目标函数中加入对比损失作为噪声对训练中模型梯度提供隐私保护扁担女孩成绩出炉第2天,工作地点就遭围堵,游客的反馈令人寒心

hqy hqy 发表于2025-07-04 浏览2 评论0

金融界2024年10月24日消息,国家知识产权局信息显示,杭州世平信息科技有限公司申请一项名为“卷积神经网络训练方法及系统”的专利,公开号CN 118798302 A,申请日期为2024年9月。