本文源自:金融界
金融界2025年1月15日消息,国家知识产权局信息显示,云南省大数据有限公司申请一项名为“基于预训练语言模型的数据资源自动挂接方法及系统”的专利,公开号 CN 119293032 A,申请日期为 2024 年 12 月。
专利摘要显示,本发明提供了基于预训练语言模型的数据资源自动挂接方法及系统,属于数据管理领域。该方法包括以下步骤:获取用户填写的数据资源信息。划分三种类别的属性三元组。利用预训练语言模型生成新的数据资源信息的属性三元组向量表示,再使用余弦相似度与已有数据资源计算相似度。使用排序算法生成相似度排序在前 10的数据资源列表将新的数据资源选择排序后相似度最高的数据资源进行自动挂接。系统包括数据资源获取模块、属性三元组生成模块、相似度计算模块、数据筛选模块和数据挂接模块。该方法和系统能有效进行数据清洗和预处理,去除重复、错误或不完整的数据项,确保数据一致性和完整性。
天眼查资料显示,云南省大数据有限公司,成立于2023年,位于昆明市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本50000万人民币,实缴资本50000万人民币。通过天眼查大数据分析,云南省大数据有限公司参与招投标项目133次,专利信息8条,此外企业还拥有行政许可5个。