×

上海安信成申请强化学习监督的个性化大语言模型Prompt生成专利,为用户提供个性化回复

hqy hqy 发表于2025-04-23 08:37:26 浏览2 评论0百度已收录

抢沙发发表评论

本文源自:金融界

金融界2025年4月17日消息,国家知识产权局信息显示,上海安信成网络技术有限公司申请一项名为“强化学习监督的个性化大语言模型Prompt生成方法”的专利,公开号CN 119830013 A,申请日期为2024年12月。

专利摘要显示,本发明提供了强化学习监督的个性化大语言模型Prompt生成方法,该方法包括:将样本数据分别输入到初始Prompt生成模型和预先训练完成的中间Prompt生成模型中得到第一生成Prompt和第二生成Prompt;将第一生成Prompt和对应的第一生成回复输入到奖励模型中得到第一生成Prompt对应的奖励值;基于样本数据、Prompt标签、第一生成Prompt、第二生成Prompt和第一生成Prompt对应的奖励值更新初始Prompt生成模型的参数,以生成大语言模型Prompt。本申请基于第一任务描述样本和对应的第一用户信息样本训练Prompt生成模型,为用户提供个性化回复。

天眼查资料显示,上海安信成网络技术有限公司,成立于2022年,位于上海市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本30000万人民币。通过天眼查大数据分析,上海安信成网络技术有限公司专利信息3条,此外企业还拥有行政许可2个。