通智测试——基于动态具身物理社会交互环境的通用人工智能测试

北京大学朱松纯研究团队在中国工程院院刊《Engineering》2024年3月刊发《通智测试——基于动态具身物理社会交互环境的通用人工智能测试》一文，指出随着生成式预训练Transformer模型系列的发布，通用人工智能再次被推到了人工智能领域最受瞩目的前沿。然而，如何定义和评估通用人工智能的问题仍不明确。文章指出，对于通用人工智能的评估应植根于动态物理和社会互动的具身环境（DEPSI）。具体而言，文章提出了定义通用人工智能的五个关键特征，以通智测试作为通用人工智能的评估系统。通智测试描述了一个以价值和能力为导向的测试系统，该系统通过动态物理社会具身交互环境，划分了通用人工智能五个级别的里程碑，致力于构建无限测试任务。文章还将通智测试与经典的人工智能测试工具进行了多方面的对比，并提出了一个系统化的评估体系，以促进人工智能的标准化、定量化和客观化的基准制定和评估。

关键词：

通用人工智能 ; 通用人工智能标准 ; 通用人工智能测试 ; 具身人工智能 ; 价值对齐 ; 图灵测试 ; 因果