大模型的「aha moment」不是装腔作势,内部信息量暴增数倍!机器之心Pro2025-07-03 17:13辽宁机器之心Pro2025-07-03 17:13辽宁导读
hqy 发表于2025-07-04 19:25:42 浏览2 评论0百度已收录
抢沙发发表评论
大模型解题时的「Hmm…」「Wait, let me think」并非表演!最新研究首次用信息论揭示:这些思考词出现的瞬间,模型大脑中正确答案的信息量会飙升数倍,形成「信息高峰」。基于此,研究者提出无需训练即可显著提升推理性能的方法,代码已开源。
内容由AI智能生成
有用