OpenAI开源两款gpt-oss系列推理大模型能力接近o3和o4-mini

快科技8月6日消息，OpenAI近期发布了开源模型系列gpt-oss，此次发布包括两款开源模型——gpt-oss-120b和gpt-oss-20b，是针对不同应用需求特化的高效AI模型。

gpt-oss系列特点

gpt-oss-120b：适用于大规模、高性能推理任务，包含1170亿个参数，且有5.1亿个活跃参数，专为单个H100 GPU优化。

gpt-oss-20b：专为低延迟和本地化应用设计，包含210亿个参数，活跃参数为3.6亿，适合在资源有限的环境下运行。

这两个模型都能为开发者提供完整的推理链条，并允许开发者对模型的推理过程进行监控和调试，提升了输出结果的可靠性和可解释性。更重要的是，gpt-oss系列支持强大的代理功能，能够执行功能调用、网页浏览和Python代码等操作，使其在复杂应用中表现出色。

推理能力与优化

gpt-oss系列不仅在标准任务中表现出色，其推理能力的优化也让它在多个实际应用中成为首选。两个模型的参数调整可以根据具体需求灵活设置，支持低、中、高三种推理力度，满足不同延迟需求的应用场景。开发者还可以根据具体需求，进行模型微调，以进一步优化其在特定任务中的表现。

模型对比：

在多个标准化测试中，gpt-oss系列的表现相当突出，尤其是在MMLU、GPQA、以及竞赛数学等领域。以下是gpt-oss-120b和gpt-oss-20b与gpt-o3和o4-mini的对比数据：

OpenAI的gpt-oss系列模型凭借其强大的推理能力和广泛的应用场景，成为了开发者手中的有力工具。其开源特性、强大的定制能力和优化的推理性能，使其在AI开发和应用中具有巨大的潜力。随着AI技术的不断发展，gpt-oss系列无疑为更多的开发者提供了探索、创新和实现突破的可能。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：极城

HQY