×

脸萌申请使用生成式语言模型对图像语义标记专利,生成并输出与关注区域相关联的语义标签

hqy hqy 发表于2025-05-24 01:45:33 浏览3 评论0百度已收录

抢沙发发表评论

金融界2025年5月22日消息,国家知识产权局信息显示,脸萌有限公司申请一项名为“使用生成式语言模型对图像的语义标记”的专利,公开号CN120014642A,申请日期为2024年11月。

专利摘要显示,本申请的实施例涉及使用生成式语言模型对图像的语义标记。一种计算系统包括被配置为接收图像的一个或多个处理设备。处理设备还被配置为计算标识图像中包括的关注区域的分割掩模。在特征提取器处,处理设备还被配置为基于图像来计算编码图像特征。处理设备还被配置为接收文本指令。在视觉重采样器处,处理设备还被配置为基于分割掩模、编码图像特征和文本指令来计算掩模查询。在生成式语言模型处,处理设备还被配置为接收包括掩模查询和文本指令的自然语言查询。基于自然语言查询,在生成式语言模型处,处理设备还被配置为生成并输出与关注区域相关联的语义标签。

本文源自金融界