图丨Pexels
2025年1月,首份《国际人工智能安全报告》发布。继2024年5月发布中期报告后,96位来自不同领域的人工智能(AI)专家为这份首份完整报告贡献了力量,其中包括由30个国家、经济合作与发展组织(OECD)、欧盟(EU)以及联合国(UN)提名的国际专家咨询小组。
该报告旨在提供科学信息,为明智的政策制定提供支持,但并不推荐具体政策。尽管该报告关注人工智能风险与安全,但人工智能也为个人、企业和社会带来诸多潜在益处。只有在妥善管理风险的前提下,全球民众才能安全地充分享受人工智能的诸多潜在益处。该报告专注于识别这些风险,并评估减轻风险的方法,而并非全面评估人工智能所有可能的社会影响,包括其众多潜在益处。
该报告聚焦通用人工智能,报告将重点限制在近年来发展尤为迅速、但与之相关的风险却较少被研究和理解的一类人工智能上,即通用人工智能,它能够执行各种各样的任务。报告总结了关于三个核心问题的科学证据:通用人工智能能做什么?通用人工智能存在哪些风险?针对这些风险有哪些缓解技术?
该报告发现,其所聚焦的通用人工智能的能力近年来迅速提升,且在近几个月进一步提高。几年前,最优秀的大语言模型(LLMs)很少能生成连贯的段落文本。如今,通用人工智能可以编写计算机程序、生成定制的逼真图像,并进行长时间的开放式对话。自中期报告(2024年5月)发布以来,新模型在科学推理和编程测试中明显表现出更好的性能。
许多公司目前正在投资开发通用人工智能智能体,这是进一步发展的一个潜在方向。通用人工智能系统可以在几乎无需人类监督的情况下自主行动、规划和分配任务以实现目标。
未来几个月和几年内,通用人工智能能力的进一步提升速度可能从缓慢到极快不等。进展将取决于公司是否能够迅速部署更多数据和计算能力来训练新模型,以及以这种方式“扩展”模型是否能够克服其当前的局限性。近期研究表明,至少在未来几年内,快速扩展模型在物理上仍具有可行性。但重大的能力提升可能还需要其他因素,例如难以预测的新研究突破,或者公司最近采用的新型扩展方法的成功。
通用人工智能已造成的一些危害已得到充分证实。这些危害包括诈骗、非自愿亲密图像(NCII)和儿童性虐待材料(CSAM)、对特定人群或特定观点存在偏见的模型输出、可靠性问题以及隐私侵犯。研究人员已开发出针对这些问题的缓解技术,但到目前为止,没有任何技术组合能够完全解决这些问题。自中期报告发布以来,与通用人工智能系统相关的歧视新证据揭示了更微妙的偏见形式。
随着通用人工智能能力的增强,更多风险的证据正逐渐显现。这些风险包括大规模劳动力市场影响、借助人工智能进行的黑客攻击或生物攻击,以及社会对通用人工智能失去控制等。专家们对这些风险的现有证据解读各异:一些人认为此类风险还需几十年才会出现,而另一些人则认为通用人工智能可能在未来几年内就导致社会层面的危害。通用人工智能能力的最新进展,尤其是在科学推理和编程测试方面,为借助人工智能进行黑客攻击和生物攻击等潜在风险提供了新证据,导致一家大型人工智能公司将其最佳模型的生物风险评估从“低”提升至“中”。
风险管理技术尚处于起步阶段,但有望取得进展。开发人员可以采用、监管机构也可以要求使用各种技术方法来评估和降低通用人工智能带来的风险,但这些方法都存在局限性。例如,目前用于解释通用人工智能模型为何产生特定输出的可解释性技术仍然非常有限。然而,研究人员在解决这些局限性方面正在取得一些进展。此外,研究人员和政策制定者越来越多地尝试将风险管理方法标准化,并在国际上进行协调。
通用人工智能发展的速度和不可预测性给政策制定者带来了“证据困境”。鉴于有时发展迅速且出乎意料,政策制定者常常不得不在缺乏大量科学证据的情况下,权衡即将到来的人工智能进展的潜在益处和风险。在此过程中,他们面临两难境地。一方面,基于有限证据的先发制人风险缓解措施可能最终被证明无效或不必要。另一方面,等待更有力的风险迫在眉睫的证据,可能会使社会措手不及,甚至使缓解措施变得不可能。公司和政府正在开发早期预警系统和风险管理框架,这可能会减轻这种困境。其中一些在有新的风险证据时触发特定的缓解措施,而另一些则要求开发人员在发布新模型之前提供安全性证据。
研究人员普遍认为,在以下问题上取得进展将有所帮助:未来几年通用人工智能能力将以多快的速度提升,研究人员如何可靠地衡量这一进展?触发缓解措施的合理风险阈值是多少?政策制定者如何最好地获取与公共安全相关的通用人工智能信息?研究人员、科技公司和政府如何可靠地评估通用人工智能开发和部署的风险?通用人工智能模型内部是如何工作的?如何设计通用人工智能以使其可靠运行?
人类的选择将决定人工智能的未来。通用人工智能技术的未来充满不确定性,即使在不久的将来,也似乎有可能出现多种发展轨迹,包括非常积极和非常消极的结果。这种不确定性可能引发宿命论。但社会和政府如何应对这种不确定性的决策,将决定人们将走上哪条道路。
资料来源丨gov.uk
本文由生物安全情报网编译,仅用于学术分享,转载请注明出处
阅读原文献请点击“阅读原文”