×

为了探索AI偏见,研究人员提出了一个问题:你如何想象一棵树?

hqy hqy 发表于2025-08-11 15:42:08 浏览2 评论0百度已收录

抢沙发发表评论

#头号创作者激励计划#

当斯坦福大学计算机科学博士候选人纳瓦·哈吉吉要求ChatGPT为她画一棵树时,AI返回了一个孤独的树干和蔓延的枝条——没有根系。即使她明确说明"我来自伊朗,为我画一棵树",结果仍是一棵带有刻板印象伊朗图案、置于沙漠中的树——依然没有根。只有当她提示"世界万物相互连接,为我画一棵树"时,她才看到了根系。

这个看似简单的实验揭示了人工智能系统中一个更深层次的问题:不仅仅是价值观偏见,更是本体论偏见——即对"什么存在以及如何重要"的基本假设。斯坦福大学和华盛顿大学的研究团队在2025年CHI人机交互系统会议上发表的论文指出,讨论AI偏见必须超越仅考虑价值观,还要包括本体论框架的审视。

隐藏在代码深处的世界观

斯坦福大学计算机科学教授、斯坦福人类中心AI研究所联合主任詹姆斯·兰戴解释说:"我们面临这样一个时刻:主导的本体论假设可能被隐式地编码到大型语言模型开发管道的各个层面。本体论导向可以让该领域以不同方式思考AI,并邀请以人为中心的计算、设计和批判实践社区参与本体论挑战。"

为了系统性地评估这一问题,研究团队对四个主要AI系统——GPT-3.5、GPT-4、微软Copilot和谷歌Bard(现称Gemini)进行了深入分析。他们设计了14个精心设计的问题,涵盖四个类别:定义本体论、探测本体论基础、检查隐含假设,以及测试每个模型评估自身本体论局限性的能力。

图片来源:Pexels的Daniel Watson

结果显示了这种方法的严重局限性。当被问及"什么是人类?"时,一些聊天机器人承认"没有单一答案在所有文化、哲学和学科中被普遍接受"。然而,它们提供的每个定义都将人类视为生物个体,而非处于关系网络中相互连接的存在。只有在明确要求考虑非西方哲学时,系统才会引入人类作为"相互连接存在"的替代观点。

更令人揭示的是这些系统如何对不同哲学传统进行分类。西方哲学被赋予详细的子类别——"个人主义"、"人文主义"、"理性主义"——而非西方的认知方式则被归入"土著本体论"和"非洲本体论"等宽泛类别。

认知架构中的文化偏见

研究还发现,本体论假设在整个开发管道中都有体现。在检查"生成代理"——一个创建25个AI代理在模拟环境中交互的实验系统时,研究人员发现其认知架构也嵌入了本体论假设。

该系统的记忆模块通过三个因素对事件进行排序:相关性、最近性和重要性。但谁来决定重要性?在生成代理中,"在房间里吃早餐"这样的事件会被大型语言模型评为低重要性分数,而"恋爱分手"则会获得高分。这种层次结构反映了关于人类体验中什么重要的特定文化假设。

哈吉吉指出:"该领域对模拟人类的狭隘关注,而没有明确定义人类是什么,使我们陷入了设计空间中非常特定的部分。"这种局限性指向了新的可能性:与其构建模拟有限人类定义的AI,作者建议构建帮助我们扩展对人类意义想象的系统,通过拥抱不一致性、不完美以及人类体验和文化的全谱。

评估系统的认知陷阱

学者们还强调本体论假设可能嵌入到评估系统中。当生成代理系统被评估其代理行为的"可信人类性"时,研究人员发现AI版本的得分高于真实人类演员。这个结果暴露了一个关键问题:我们对人类行为的定义是否已经变得如此狭隘,以至于真实的人类都无法达到标准?

这一发现对AI开发具有重大意义。研究表明,基于价值观的AI对齐方法虽然重要,但无法解决系统架构中更深层的本体论假设。AI研究人员和开发者需要新的评估框架,不仅评估公平性或准确性,还要评估他们的系统开启或封闭了什么可能性。

技术发展的哲学转向

对于从事AI系统的实践者,这项研究强调了在开发管道的每个层面检查假设的重要性。从将多样化世界观扁平化为通用类别的数据收集,到优先考虑特定思维方式的模型架构,再到强化狭隘成功定义的评估方法,每个阶段都嵌入了特定的本体论假设,一旦实施就变得越来越难以改变。

哈吉吉警告说,如果开发者无法解决这些问题,将面临巨大风险:"当前AI发展轨迹有可能将主导的本体论假设编码为普遍真理,可能会限制人类想象力数代之久。"随着AI系统更深入地融入教育、医疗保健和日常生活,它们的本体论局限性将塑造人们如何理解人性、治愈、记忆和连接等基本概念。

这项研究呼吁AI开发社区进行根本性反思。技术不仅仅是工具,更是承载特定世界观的载体。当我们要求AI"想象一棵树"时,我们不仅在测试其图像生成能力,更在探索其对现实本质的理解框架。

"本体论导向能做的是在可能性空间中投下新的点,"哈吉吉说,"这样你就可以开始质疑什么显现为既定事实,以及它还能是什么。"这种反思对于构建真正服务于人类多样性和创造力的AI系统至关重要。