今天分享的是:人工智能专题:人工智能行业研究报告全文
报告共计:24页
2025年2月9日,经济合作与发展组织(OECD)发布《基于数据抓取训练的人工智能中的知识产权问题》报告,深入剖析了人工智能技术快速发展背景下,数据抓取在模型训练中的应用及其对知识产权体系的冲击。数据抓取指利用自动化软件工具或脚本从网络、在线数据库及其他来源,自动提取人工智能训练数据的过程,是收集人工智能训练数据的常用方法。但未经同意或未向权利持有人支付费用的抓取活动,可能涉及多种知识产权和其他类似权利的侵权问题,包括版权、数据库信息产权、商标权、名誉权等。当前约70%的人工智能训练数据集缺乏清晰的来源许可信息,2023年一项对1800个常用数据集的审计发现,部分数据集包含盗版内容。美国作家协会、《纽约时报》等机构已对OpenAI、微软等企业提起诉讼,指控其未经许可使用受版权保护内容训练人工智能,欧盟、日本等地也出现类似案件。
人工智能数据抓取生态系统包括研究机构和学术界、AI数据聚合商、科技公司和平台运营商等。研究机构和学术界通常使用数据抓取来收集用于学术和科学目的的数据,但在抓取数据时可能面临复杂的法律挑战;AI数据聚合商收集并使抓取的数据可供第三方使用;科技公司和平台运营商既是数据抓取的来源,也是常规的数据抓取者,其经常成为数据抓取的目标,会实施反抓取技术和服务条款限制,以规范或阻止对其数据的未经授权访问 。
现行知识产权法律体系多制定于人工智能技术普及之前,难以适应数据抓取引发的复杂问题,各国法律对“合理使用”“文本与数据挖掘(TDM)例外”等关键概念的解释存在显著差异,法律碎片化导致跨国企业面临合规难题。为平衡人工智能创新与权利保护,OECD提出制定自愿性“数据抓取行为准则”、开发标准化技术工具、设计标准合同条款、提升公众意识四大政策方向 。
以下为报告节选内容