×

著作权法是AI偏见的致因?乔治城法学院Levendowski教授观点

hqy hqy 发表于2025-02-26 13:16:38 浏览8 评论0百度已收录

抢沙发发表评论

著作权法是导致人工智能(AI)产生或加剧偏见的主要原因,还是能消除AI偏见的良药?美国学者阿曼达·莱文多夫斯基(Amanda Levendowski)于2018年在《华盛顿法学评论》所发表的文章《How Copyright Law Can Fix Artificial Intelligence’s Implicit Bias Problem(著作权法如何改进人工智能的潜在偏见问题)》讨论了这一问题。本期,我们为大家分享这篇文章的主要观点。

乔治城大学法学院副教授Amanda Levendowski

现行著作权法如何导致AI产生偏见?

随着AI的应用不断普及,我们看到越来越多的AI系统反映或加剧了社会偏见,从种族主义的面部识别到性别歧视的自然语言处理。这些偏见有可能掩盖AI的技术成果和潜在益处。

Levendowski教授认为,AI通常通过阅读、观看和倾听人类创作的作品来向人类学习“思考”,进而成为新“人类”。著作权法限制了AI偏见缓解技术的应用,例如通过反向工程、算法审查程序以及限制竞争等分析了现行版权制度对制造更不公平的AI系统带来的影响力。同时,由于著作权法使AI制造者更倾向于优先选择容易获取、法律风险低等作品进行AI学习训练,以此更增加了AI带有偏见的几率。

解决AI偏见的出路:援引合理使用规则

(一)著作权合理使用四要素

事实上,合理使用原则早被用于解决平衡竞争和使用问题与公平理念之间的矛盾。1841年,美国最高法院前大法官约瑟夫·斯托雷通过对英国早期判例的总结和分析,归纳出了美国合理使用判断的多要素法。这些要素后来被列入美国著作权法第107条,规定为判断著作权合理使用的四要素:

使用(作品)的目的和性质;

受著作权保护作品的性质;

使用(作品)的数量与实质部分(内容)与受著作权保护的整部作品之间的关系;

使用(作品行为)对受著作权保护作品的价值与潜在市场产生的影响。

(二)AI可以通过合理使用改善偏见 

Levendowski教授在文章中详细分析了上述判断合理使用的四个要素,并详细分析了AI系统如何通过合理使用原则来提升对著作权作品的利用,从而解决改善AI偏见的问题。

1.AI将著作权保护作品作为数据使用的行为具有高度的“转换性”

第一个因素审查使用的“目的和性质”,包括使用是否具有“商业性质”。

大法官Pierre  Leval认为,合理使用必须具有转换性,并且应当和原材料不同的方式或目的来使用引用内容。如果引用的内容被用作原材料,但在创造新的见解和理解的过程中具有转换性,也被认为符合合理使用规则。

转换性使用是指传播新的不同于原作的作品,或者扩大了原作的效用,从而服务于版权的总体目标。并非所有制作用于AI系统训练数据的受保护作品的复制品都会具有转换性。但是,将受保护作品复制为减轻AI系统偏见的途径可以被视为对人类内在偏见的重要批判和评论。因此,

利用著作权作品对AI进行训练,不是简单的拷贝原著作权作品,而是利用原著作权作品进行再创造的行为,根据“评论或批评”原作品的合理使用规则这样的“转型”目的,极有可能不构成侵权。

将著作权作品作为数据使用的行为也具有很强的转换性。将受著作权保护的作品作为数据使用,也就是大法官所说的“原材料”。

2. AI利用作品事实性特征进行学习和分析

第二个因素要求对“著作权作品的性质”进行审查,这一要素经常被边缘化

“事实作品比虚构作品更有可能被认定为合理使用”,法院对这一点的理解过于直白,忽略了第二个因素所提出的广泛、多学科的问题。

A. V. ex rel. Vanderhye v. iParadigms一案中,大法官Traxler指出,与在诉讼中使用受著作权保护作品被视为合理使用的方式相同,将创造性作品用于事实目的并不会在合理使用的判断中对被告不利。

将受著作权保护的作品转化为数据是类似的。使用虚构作品作为AI系统的训练数据,以学习有关语言或图像的抽象概念,“与受著作权保护的作品的任何创造性成分都无关”。

这意味着,AI训练侧重于理解语言和图像的结构、模式和概念,而不是创作者的创意。AI主要是使用事实信息进行训练,可以考虑适用合理使用原则。

3. 拷贝整部作品训练AI是否适用合理使用视个案而定

第三个因素分析的是使用(作品)的数量与实质部分(内容)与受著作权保护的整部作品之间的关系。

涉及创新计算技术的案件通常涉及对文学和视觉作品的大规模复制,法院一致认为,为特定目的进行整体复制是必要的。对于创造整体复制的受著作权保护文学和视觉作品,并非总是属于公平使用。但当这些作品未向公众展示,或者至少未完全展示时,法院通常更愿意承认复制整体作品是合理的。

但用于训练AI的数据很少被公开发布。虽然这种不透明性可能会强化公司主张使用受著作权保护的作品作为AI训练数据应当属于合理使用的论点,但审计和改进具有偏见的训练数据的能力取决于至少部分训练数据的公开可用性。

也有观点认为,即使这些数据被公开发布,是为了识别AI中的偏见,并有可能教导其他AI变得更加公正。

因此,对于这一因素的判断要个案而定。

4. AI训练数据不损害受著作权保护作品的商业市场

第四个因素的核心是使用(作品行为)对受著作权保护作品的价值与潜在市场产生的影响。

美国法院尤其关注二次使用是否“可能成为原作的市场替代品”,在Hathi Trust案中,法院明确表示,转换性作品具有与原作品不同的新功能,不是其替代品。法院仅考虑来自“传统、合理或可能开发的市场”的潜在许可收入损失。

因此将受著作权保护的作品用作AI系统的训练数据并非是原作品的替代品或是与原作品形成市场竞争关系,关于这一要素可能通过合理使用原则的测试。

结论

AI系统存在偏见是因为人类存在偏见。AI系统通过阅读、观看和聆听人类创作的作品学习成为过于人类化。

本文考察了著作权法如何通过创造或推动存在偏见的AI系统,从根本上引导AI朝着有偏见的方向发展。著作权法有能力使AI

系统存在偏见,但著作权法也有深刻的力量来消除这些偏见。

合理使用实质上可以促进创建更公正的AI系统。但这种改变至此并未结束。区分什么是法律所允许的与什么是道德上可接受的仍然是一个严肃的问题,这需要AI制造者、政策制定者、甚至可能是律师们认真的参与和深思熟虑的反思。

作者简评

在实践中在涉及AI

侵权,大部分当事人都倾向于以“合理使用”为自己辩护。著作权法对于合理使用的四要素判断规定较为灵活,这同时也为美国法院在处理相关案件时有更灵活广泛的裁量空间。

比如,在“谷歌图书馆案”中,当著作权法与创新之间发生冲突,法院选择合理使用为大数据AI的创新与发展开辟了小径。这是否意味着在美国合理使用的边界AI创新技术的影响下有些松动。

也有观点认为,为了促进创新,应允许AI研发人员充分利用现有的材料,编辑、创建更多的新数据库,促进AI技术的发展,同时减少使用版权材料的交易成本。

海外有些国家甚至为了新技术的创新直接在法律中扩展了合理使用的边界。例如,日本著作权法规定,若通过计算机进行数据分析等并因此创造了新知识或信息,从而促进作品利用,在有合理目的必要范围内,可以利用现有作品;且另外还规定实施上述行为的人,可以在准备工作必要的范围内,复制、传播或分发现有作品的复制件。当然,日本对计算机数据分析也不是完全没有限制,也有一系列规定不得侵犯现有作品著作权。尽管如此,也引起了大量著作权人的不满。

随着AI时代的快速发展,合理使用制度在司法实践中的地位可能明显升高,或者其结构也可能会重新平衡。然而目前的著作权法是否能够迎接AI带来的挑战以确保信息获取的合理使用还是一个未知数。

本期作者:恩卡尔·加尔恒,北京科技大学法律硕士,研究兴趣为知识产权法学。

下期预告: USPTO对的NFT治理的最新动向

扩充同主题阅读,了解往期相关精彩内容

USPTO引导使用人工智能发明的最新指南

春节特辑:知产人不可错过的8部电影

美国商业秘密法的过度适用与治理

联席效应与法官政策偏好是如何影响专利诉讼结果的?

《纽约时报》:OpenAI、微软,你们侵犯我著作权了!

英国高院:人工智能可成为方法专利客体

美国《人工智能辅助发明的发明人指南》解析

USPTO发布《人工智能辅助发明的发明人指南》:使用人工智能不阻碍获得专利

著作权创造力视域下的生成式人工智能创作活动