金融界2024年3月26日消息,据国家知识产权局公告,清华大学申请一项名为“基于强化学习的隐式毒性文本生成方法和装置“,公开号CN117764037A,申请日期为2023年11月。
专利摘要显示,本发明提供一种基于强化学习的隐式毒性文本生成方法和装置包括:获取待输入文本数据;将所述待输入文本数据输入至预先训练的目标隐式毒性文本生成模型,得到隐式毒性文本;其中,所述目标隐式毒性文本生成模型是基于预先选择的语言模型,利用预先构建的原始数据集通过添加预设提示和强化学习进行训练得到的。本发明在预先选择的语言模型的基础上,通过添加预设提示和强化学习训练得到能够有效生成隐式毒性文本的目标隐式毒性文本生成模型,生成的隐式毒性文本用于提高毒性检测器的性能。
本文源自金融界