×

OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini

hqy hqy 发表于2025-08-06 12:35:32 浏览2 评论0百度已收录

抢沙发发表评论

快科技8月6日消息,OpenAI近期发布了开源模型系列gpt-oss,此次发布包括两款开源模型——gpt-oss-120b和gpt-oss-20b,是针对不同应用需求特化的高效AI模型。

gpt-oss系列特点

gpt-oss-120b:适用于大规模、高性能推理任务,包含1170亿个参数,且有5.1亿个活跃参数,专为单个H100 GPU优化。

gpt-oss-20b:专为低延迟和本地化应用设计,包含210亿个参数,活跃参数为3.6亿,适合在资源有限的环境下运行。

这两个模型都能为开发者提供完整的推理链条,并允许开发者对模型的推理过程进行监控和调试,提升了输出结果的可靠性和可解释性。更重要的是,gpt-oss系列支持强大的代理功能,能够执行功能调用、网页浏览和Python代码等操作,使其在复杂应用中表现出色。

推理能力与优化

gpt-oss系列不仅在标准任务中表现出色,其推理能力的优化也让它在多个实际应用中成为首选。两个模型的参数调整可以根据具体需求灵活设置,支持低、中、高三种推理力度,满足不同延迟需求的应用场景。开发者还可以根据具体需求,进行模型微调,以进一步优化其在特定任务中的表现。

模型对比:

在多个标准化测试中,gpt-oss系列的表现相当突出,尤其是在MMLU、GPQA、以及竞赛数学等领域。以下是gpt-oss-120b和gpt-oss-20b与gpt-o3和o4-mini的对比数据:

OpenAI的gpt-oss系列模型凭借其强大的推理能力和广泛的应用场景,成为了开发者手中的有力工具。其开源特性、强大的定制能力和优化的推理性能,使其在AI开发和应用中具有巨大的潜力。随着AI技术的不断发展,gpt-oss系列无疑为更多的开发者提供了探索、创新和实现突破的可能。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:极城