×

九章云极申请基于智能计算中心算力的数据爬取专利,能够实现高爬取效率以及高爬取准确度

hqy hqy 发表于2025-05-02 02:09:21 浏览7 评论0百度已收录

抢沙发发表评论

本文源自:金融界

金融界2025年5月1日消息,国家知识产权局信息显示,北京九章云极科技有限公司申请一项名为“基于智能计算中心算力的数据爬取方法、训练方法及装置”的专利,公开号CN119884457A,申请日期为2024年12月。

专利摘要显示,本发明提供一种基于智能计算中心算力的数据爬取方法、训练方法及装置,其中数据爬取方法包括:步骤S1:接收交互端发送的目标区域,目标区域为用户通过交互端在目标网页上框选的区域;步骤S2:响应于目标区域,获取预设的爬取策略,爬取策略包括:爬取深度以及需要爬取的数据的数据类型;并且,调用部署于智能计算中心的数据爬取大语言模型,按照爬取深度与数据类型爬取目标区域内各链接的数据,组合爬取到的各链接的数据,得到第一数据集合;步骤S3:清除第一数据集合中的异常数据,以完成清除异常数据的第一数据集合作为第二数据集合。本发明能够实现高爬取效率以及高爬取准确度。

天眼查资料显示,北京九章云极科技有限公司,成立于2013年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本4338.249万人民币。通过天眼查大数据分析,北京九章云极科技有限公司共对外投资了15家企业,参与招投标项目145次,财产线索方面有商标信息149条,专利信息166条,此外企业还拥有行政许可3个。