
北京大学朱松纯研究团队在中国工程院院刊《Engineering》2024年3月刊发《通智测试——基于动态具身物理社会交互环境的通用人工智能测试》一文,指出随着生成式预训练Transformer模型系列的发布,通用人工智能再次被推到了人工智能领域最受瞩目的前沿。然而,如何定义和评估通用人工智能的问题仍不明确。文章指出,对于通用人工智能的评估应植根于动态物理和社会互动的具身环境(DEPSI)。具体而言,文章提出了定义通用人工智能的五个关键特征,以通智测试作为通用人工智能的评估系统。通智测试描述了一个以价值和能力为导向的测试系统,该系统通过动态物理社会具身交互环境,划分了通用人工智能五个级别的里程碑,致力于构建无限测试任务。文章还将通智测试与经典的人工智能测试工具进行了多方面的对比,并提出了一个系统化的评估体系,以促进人工智能的标准化、定量化和客观化的基准制定和评估。
关键词:
通用人工智能 ; 通用人工智能标准 ; 通用人工智能测试 ; 具身人工智能 ; 价值对齐 ; 图灵测试 ; 因果
开放获取论文:
doi:10.1016/j.eng.2023.07.006