×

ICML 2025|如何在合成文本数据时避免模型崩溃?机器之心Pro2025-05-14 15:08北京机器之心Pro2025-05-14 15:08北京导读

hqy hqy 发表于2025-05-16 10:33:43 浏览9 评论0百度已收录

抢沙发发表评论

导读
•DeepSeek带你速览精华
合成数据正重塑AI训练,但失控使用将引发"模型崩溃"。上交大团队提出Token-Level Editing技术,通过微编辑真实数据生成"半合成"语料,在预训练、持续学习和微调阶段全面超越传统方法,最高提升13.6%任务性能,从数学上确保误差不失控。
内容由DeepSeek模型生成
有用