近日,为深入实施人工智能发展行动计划,山东省政府办公厅印发《关于支持人工智能全产业链创新发展的若干政策措施》,明确提出实施“数据集”建设行动,统筹省级资金支持公共数据汇聚治理、历史数据电子化、高质量数据集建设、数据流通交易,激发数据要素市场活力,为人工智能产业高质量发展注入新动能。
在人工智能技术蓬勃发展的当下,高质量数据集已成为驱动行业大模型应用落地的“核心燃料”。作为国内领先的大数据服务运营商,浪潮卓数大数据致力于发挥自身海量数据积淀优势和数据治理、标注技术能力,打造了企业征信、电商经济两大行业高质量数据集,不仅为AI模型的训练与优化提供了坚实“养料”,更通过场景化应用推动金融、商贸等行业的数智化转型。
企业征信数据集 破解金融风控难题
在金融领域,数据合规流通与精准风控是行业痛点。浪潮卓数大数据依托征浪潮信资质,打造的企业征信数据集,覆盖全国3.7亿市场主体,涵盖工商基础信息、企业经营、司法信息、资质等31大类基础维度数据,以及电商、客户分层、产业链、精选商机、重大项目等10大类特色场景数据,数据明细达160亿条,可应用于企业信用评估、风险预警等传统金融风控领域,助力金融机构构建“DATA+AI”双轮驱动的智能风控体系。
在今年4月举办的数字中国建设峰会上,浪潮卓数大数据重磅发布了专为银行业打造的AI驱动型尽调工具——企业尽调智能体。该产品依托大模型底座与企业征信数据集,深度融合自然语言处理、知识图谱与实时数据整合能力,通过系统自动抓取与人工录入相结合的方式,高效采集并分析企业数据,精准识别财务报表异常、经营风险、司法涉诉、关联方等潜在风险点,可助力银行实现尽调效率与质量双提升,为信贷决策提供“快、准、全”的支持。
电商经济数据集 构筑数字商务新基座
电商经济的爆发式增长对数据实时性与全面性提出了更高要求。浪潮卓数大数据打造的电商经济数据集,以15TB体量覆盖全网150+电商平台,汇聚700亿条数据资源,涵盖40大类、800细分品类,每月动态监测商品数据达10亿量级,构建了国内领先的电商数据监测体系。今年3月,该数据集获得了山东省“数据要素×”创新应用项目高质量数据集奖补,成为省内数据要素市场化的示范案例。
电商经济数据集创新采用“预训练+领域微调”的大模型标注技术,并与DeepSeek等开源大模型深度结合,可精准分析各省、市、县网络零售态势,为主管部门研判电商发展趋势、企业优化市场布局提供决策支撑。目前,已经应用在电商市场趋势预测、跨境电商数据分析、智能商务助手、政府监管与政策制定、企业经营智能决策支持等场景,相关成果在山东、青海、重庆等地形成示范效应,助推消费扩容提质、企业迁移培育产、业资源对接等。
此外,基于浪潮模数工坊智能体平台和电商经济数据集,浪潮卓数大数据商务万象上线了“电子商务数据服务智能体”,已为多地省级商务部门提供“管、搜、问、读、写”服务。
数据与AI相互赋能,将催生新业态、新动能,成为数字经济高质量发展的核心引擎。浪潮卓数大数据通过高质量数据集的建设与场景化落地,不仅为行业大模型提供了“高质量原料”,更在金融、电商等关键领域形成可复制的数智化解决方案,持续释放数据要素的乘数效应。
未来,随着人工智能技术的不断发展和数据要素市场的逐步完善,浪潮卓数大数据将继续发挥在数据资源、数据治理等方面的优势,深化与各行业融合,推动更多创新应用落地,赋能省内重点领域高质量发展。