×

美国《AI基础模型透明度法案》Q&A

hqy hqy 发表于2025-03-02 08:00:25 浏览31 评论0百度已收录

抢沙发发表评论

《AI基础模型透明度法案》的背景是什么?

2023年12月底,美国众议员安娜·埃修(Anna Eshoo)和唐·拜尔(Don Beyer)提出了一项名为《AI基础模型透明度法案》(AI Foundation Model Transparency Act)法案,该法案将要求联邦贸易委员会(Federal Trade Commission)设定关于人工智能模型的何种信息应易于向公众提供的标准。《AI基础模型透明度法案》还将要求公司与联邦贸易委员会分享模型训练数据。

该法案的目的是什么?

应对公众使用基础模型时遇到的不准确、不精确或有偏见的信息问题。减少因版权侵犯而引发的诉讼和公众关注。在不损害开发者知识产权的前提下,为用户提供必要的信息,以便理解和使用这些模型。

什么是基础模型?

基础模型是一种人工智能模型,它具有以下特征:

广泛训练数据:基础模型在广泛的数据集上进行训练。

自我监督:这类模型通常采用自我监督学习(self-supervision)的方法,这意味着它们可以在没有明确标注的情况下从数据中学习。

大量参数:基础模型通常包含数十亿个参数,这使得它们能够捕捉复杂的模式和关系。

广泛应用:它们可以在多种不同的上下文中应用,具有很高的通用性。

高性能:基础模型在执行可能对安全、国家安全、公共健康或安全造成严重风险的任务时,展现出或可以被轻松修改以展现出高水平的性能。

这些模型因其强大的学习和应用能力,在各种领域中都有广泛的应用,包括但不限于自然语言处理、图像识别、语音识别等。然而,由于它们的复杂性和训练数据的广泛性,也存在潜在的风险,如偏见、不准确性和安全性问题,这也是法案强调透明度的原因。

法案会如何确保基础模型的透明度?

法案通过以下方式确保基础模型的透明度:

制定透明度标准:法案要求联邦贸易委员会(FTC)在与国家标准与技术研究所(NIST)、版权办公室和科技政策办公室协商后,制定透明度标准。这些标准将规定基础模型的部署者需要公开的特定信息。

信息公开要求:法案要求部署基础模型的实体向FTC提交关于模型训练数据、模型训练机制以及是否在推理过程中收集用户数据的信息。同时,这些实体还需要将这些信息以特定的形式和方式公开,包括在它们的网站上以及在FTC托管的网站上。

信息内容:法案详细列出了需要公开的信息类型,包括但不限于训练数据的来源和组成、数据治理程序、数据标签和验证过程、模型的预期目的和限制、性能评估、计算资源使用情况等。

公开形式和方式:法案规定了信息公开的形式和方式,包括在提供模型的实体网站上的公开信息,以及在FTC托管的网站上的公开信息。此外,还要求使用机器可读格式,并提供信息的URL。

定期评估和更新:FTC需要每两年评估一次已建立的标准,并根据需要进行更新,以确保透明度要求与技术发展和公众需求保持同步。

执行和报告:法案赋予FTC执行新规定的权力,并要求其在法案生效后两年内提交关于标准建立、实施和执行的报告。

预算拨款:法案授权为FTC执行本法案拨款,以确保有足够的资源来执行透明度要求。

通过这些措施,法案旨在提高基础模型的透明度,使公众能够更好地理解这些模型的工作原理,以及它们在处理数据和生成输出时可能存在的偏见和风险。

违反法案的后果是什么?

违反法案可能会导致以下后果:

视为不公平或欺诈行为:违反法案中规定的透明度标准的,将被视为违反了《联邦贸易委员会法》(Federal Trade Commission Act)第18(a)(1)(B)节关于不公平或欺诈行为的规定。

执行权力:FTC将执行这些规定,并且可以采取与执行《联邦贸易委员会法》中其他规定相同的方式、手段和管辖权。

处罚:违反规定的实体将受到《联邦贸易委员会法》中规定的处罚,这可能包括罚款、禁令或其他法律允许的救济措施。

报告要求:FTC需要在法案生效后两年内向相关国会委员会提交关于标准建立、实施和执行的报告,这可能包括对违反行为的审查和评估。

预算拨款:法案授权为FTC执行本法案拨款,这表明政府将提供资源以确保法案的有效执行。

这些后果旨在确保基础模型的开发者和部署者遵守透明度要求,以保护消费者和公众利益,同时促进人工智能技术的负责任发展。

法案对外国的大模型是否有特殊的要求?

法案通常适用于在其管辖范围内运营的实体。如果外国的大模型在美国境内提供服务,或者其服务对美国市场有显著影响,那么这些模型的开发者或部署者可能需要遵守美国的相关法律和规定。

法案中提到的“覆盖实体”(Covered Entity)定义为任何提供基础模型使用或服务的个人、合伙企业或公司,这些模型的输出实例或用户数量达到一定的阈值。如果外国的大模型满足这些条件,它们可能被视为覆盖实体,并需要遵守法案中的透明度要求。

在实际操作中,如何将这些要求适用于外国实体可能会涉及到国际法律和政策的复杂性,包括但不限于数据保护、知识产权和跨境数据流动等方面的问题。因此,具体如何执行这些规定可能需要进一步的法律解释和国际合作。

公司向消费者和FTC提供哪些信息?

根据法案公司需要向消费者和FTC公开以下信息:

训练数据的来源:包括个人数据收集和信息,以及数据收集和保留的方式。

训练数据的描述:训练数据的大小和组成,包括人口统计信息、语言信息和其他属性信息,同时考虑隐私保护。

数据治理程序:数据治理的详细流程,包括数据如何被编辑或过滤。

数据标签和验证过程:数据是如何被标记的,以及如何评估标签过程的有效性。

模型的预期用途和限制:模型的预期用途,以及预见到的局限性或风险。

模型性能评估:模型在公共或行业标准基准上的表现,以及在高风险情况下的应对措施。

与风险管理框架的一致性:模型的透明度如何与NIST的AI风险管理框架或其他类似联邦政府批准的共识技术标准保持一致。

计算资源使用情况:训练和操作基础模型所需的计算资源。

其他必要信息:FTC认为必要的其他信息,以提高基础模型的透明度。

这些信息的公开旨在增加公众对AI模型的理解和透明度,帮助消费者做出知情决策,并确保模型的公正性和安全性。powered by Kimi Chat