×

深度神经网络中的梯度消失问题,如何解决?二战前日本天皇有没有被架空,到底有没有实权?别再被它们给骗了

AI

深度神经网络中的梯度消失问题,如何解决?二战前日本天皇有没有被架空,到底有没有实权?别再被它们给骗了

hqy hqy 发表于2025-06-07 浏览2 评论0

在深度神经网络中,梯度消失问题是一个常见且棘手的问题,它会导致网络训练效率低下,甚至完全无法学习。梯度消失主要发生在基于梯度的学习算法中,尤其是在深层网络中。本文将详细探讨梯度消失的原因以及多种有效的解决策略。

神经网络优化创新技术与PyTorch使用指南我国成功发射卫星互联网低轨卫星

AI

神经网络优化创新技术与PyTorch使用指南我国成功发射卫星互联网低轨卫星

hqy hqy 发表于2025-06-07 浏览1 评论0

近年来,深度学习在从大型语言模型(LLM)到机器人技术再到医疗人工智能的众多领域展现出了显著成效。随着研究资源的持续投入,这一领域通过架构创新、更大规模的数据集和先进硬件而不断发展。然而,深度学习的基础构建模块——人工神经元,自1943年首次数学表述以来几乎保持不变。同样,其基础算法——基于梯度下降的反向传播,自20世纪80年代首次应用于神经网络以来,仅在优化技术方面有所改进。当前,深度学习领域正迎来对基础组件及训练方法的一次重要革新。

AI

浙江:境外疫情多点蔓延,须高度警惕疫情反向传播的严重威胁

hqy hqy 发表于2025-06-07 浏览1 评论0

澎湃新闻(www.thepaper.cn)从3月2日举行的浙江省新型冠状病毒肺炎疫情防控新闻发布会获悉,浙江省所有县(市、区)都已经是绿色的低风险区域,“五色疫情图”变成了“单色图”;截至3月2日12时,全省累计发放健康码6369.3万张,绿码率达98.5%,持绿码通行受阻的问题基本得到解决。

AI

深度学习,读懂反向传播

hqy hqy 发表于2025-06-07 浏览0 评论0

背景

深度学习属于机器学习,机器学习的三个步骤就是:模型,策略和计算方法。比如LR,模型使用的LR模型(LR是基于伯努利假设,伯努利属于指数分布族,指数分布族属于广义线性模型),策略使用的是联合概率分布最大,计算方法是梯度下降法或拟牛顿法等。