AI
deepseekr1-671b性能测试
hqy 发表于2025-06-07 浏览0 评论0
1、简介
在H3C LinSeerCube 大模型一体机上面,操作系统为Ubuntu22.04.3 LTS,服务器cpu为192C,内存为1.5T,存储为:8.5T,显卡为h20-3e 单卡为141G显存,共8块卡。通过vllm部署的deepseek-r1-671b,以及通过ollama部署了deepseek-r1-70b以及qwq-32b模型。

AI
百度副总裁谢广军就女儿网络隐私泄露事件公开致歉三国后期,如果魏延和姜维联手,能否斩杀张郃
hqy 发表于2025-06-07 浏览2 评论0
百度副总裁谢广军日前通过微信朋友圈发布声明,就其13岁女儿在网络争执中泄露他人隐私信息的行为向公众致歉。声明称,涉事未成年人因情绪失控,在海外社交平台发布他人隐私信息,导致自身信息被反向曝光,引发网络舆论风波。谢广军表示作为父亲未能有效履行监护职责,未及时引导女儿正确处理网络纠纷,并呼吁公众停止传播相关内容,给予未成年人改正空间。
AI
中国科学家取得智能光芯片研究新进展古人打仗,为何弓箭手要把箭拿去便池浸泡?专家:浸泡才有杀伤力
hqy 发表于2025-06-07 浏览1 评论0
钛媒体App 8月8日消息,清华大学电子工程系方璐教授课题组和自动化系戴琼海院士课题组日前实现了光计算系统大规模神经网络的高效精准训练。该研究成果以“光神经网络全前向训练”为题,于北京时间8月7日晚在线发表于《自然》期刊。
AI
清华大学:光芯片研究新进展 填补空白如果张辽加入蜀汉,那么五虎上将应该踢出谁?
hqy 发表于2025-06-07 浏览2 评论0
【中国科学家在智能光芯片研究获新成果】清华大学电子工程系方璐教授课题组和自动化系戴琼海院士课题组于日前实现光计算系统大规模神经网络的高效精准训练。该研究成果于 8 月 7 日晚在线发表于《自然》期刊,两个课题组构建光子传播对称性模型,摒弃电训练反向传播范式,首创全前向智能光计算训练架构,研制通用光训练芯片“太极-II”,摆脱对离线训练的依赖,填补智能光计算在大规模训练这一核心拼图的空白。

AI
无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24普京谈列宁:一生最大的错误,就是把一个统一国家改造成联盟
hqy 发表于2025-06-07 浏览2 评论0
林之秋 投稿

AI
深度神经网络中的梯度消失问题,如何解决?二战前日本天皇有没有被架空,到底有没有实权?别再被它们给骗了
hqy 发表于2025-06-07 浏览2 评论0
在深度神经网络中,梯度消失问题是一个常见且棘手的问题,它会导致网络训练效率低下,甚至完全无法学习。梯度消失主要发生在基于梯度的学习算法中,尤其是在深层网络中。本文将详细探讨梯度消失的原因以及多种有效的解决策略。

AI
梯度消失问题的原因大清刺马案,案子的疑团众多,真相被层层的掩盖,最后草草收场
hqy 发表于2025-06-07 浏览2 评论0

AI
神经网络优化创新技术与PyTorch使用指南我国成功发射卫星互联网低轨卫星
hqy 发表于2025-06-07 浏览1 评论0
近年来,深度学习在从大型语言模型(LLM)到机器人技术再到医疗人工智能的众多领域展现出了显著成效。随着研究资源的持续投入,这一领域通过架构创新、更大规模的数据集和先进硬件而不断发展。然而,深度学习的基础构建模块——人工神经元,自1943年首次数学表述以来几乎保持不变。同样,其基础算法——基于梯度下降的反向传播,自20世纪80年代首次应用于神经网络以来,仅在优化技术方面有所改进。当前,深度学习领域正迎来对基础组件及训练方法的一次重要革新。

AI
不走寻常路,如何用ChatGPT做反向营销?乾隆后宫的神秘舒妃:出身名门却命运多舛
hqy 发表于2025-06-07 浏览0 评论0
在所有的营销套路中,都是告诉我们如何顺着产品的特色去进行营销传播,如果是负面、反向的,该怎么办?这篇文章,作者分享了反向营销的方法,可以通过ChatGPT之类的产品完成,希望可以帮到大家。
AI
上海燧原取得深度学习模型可逆化相关专利,提高反向传播计算的效率你该珍惜我的
hqy 发表于2025-06-07 浏览2 评论0
金融界 2024 年 9 月 17 日消息,天眼查知识产权信息显示,上海燧原科技股份有限公司取得一项名为“深度学习模型可逆化的全局优化方法、装置、设备及介质“,授权公告号 CN202410793018.5,申请日期为 2024 年 6 月。