×

亚信科技申请用于文本纠错的大语言模型的训练、纠错方法及相关装置专利,能够缓解模型过拟合提高了模型泛化性能及纠错的准确性

hqy hqy 发表于2025-02-25 05:02:36 浏览10 评论0百度已收录

抢沙发发表评论

金融界2025年2月21日消息,国家知识产权局信息显示,亚信科技(中国)有限公司申请一项名为“用于文本纠错的大语言模型的训练、纠错方法及相关装置”的专利,公开号CN 119494000 A,申请日期为2025年1月。

专利摘要显示,本申请公开了用于文本纠错的大语言模型的训练、纠错方法及相关装置,涉及文本纠错领域,包括:获取错误正确句子对集合,错误正确句子对集合包括多个子集合,每个子集合包括一个错误文本和对应的至少一个正确文本,不同子集合内的错误文本不同;针对每个子集合包含的错误文本和对应的每个正确文本,为该错误文本和该正确文本分别标注正向纠错偏好标签和负向纠错偏好标签,得到第一训练语料;基于第一训练语料,采用预设的联合损失对初始大语言模型进行偏好调优训练,得到用于文本纠错的大语言模型。本申请基于错误文本及对应的每个正确文本均生成训练语料,避免了浪费正确文本本申请还能够缓解模型过拟合提高了模型泛化性能及纠错的准确性。

天眼查资料显示,亚信科技(中国)有限公司,成立于1995年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2604.057万美元,实缴资本2604.057万美元。通过天眼查大数据分析,亚信科技(中国)有限公司共对外投资了15家企业,参与招投标项目5000次,知识产权方面有商标信息535条,专利信息386条,此外企业还拥有行政许可12个。