OpenAI周二发布了自2019年推出GPT-2以来首批开放权重语言模型。这两款纯文本模型分别命名为gpt-oss-120b和gpt-oss-20b,旨在为开发者、研究人员和企业提供更易运行和定制的低成本选项。
当人工智能模型的参数(即训练过程中优化输出和预测能力的要素)公开可用时,该模型即被视为开放权重。此类模型虽能提供透明度和控制权,但不同于开源模型——后者允许用户完全获取并修改源代码。
近年来,Meta、微软支持的Mistral AI以及中国初创企业DeepSeek等公司也相继发布了开放权重模型。
OpenAI总裁格雷格·布罗克曼在简报会上表示,"见证这个生态系统的成长令人振奋,我们很荣幸能参与其中并推动技术边界,进而观察其发展轨迹。"该公司与英伟达、超威半导体、Cerebras及Groq合作,确保模型能在多种芯片上稳定运行。
"OpenAI向世界展示了基于英伟达AI技术的可能性,如今他们正在开源软件领域推动创新,"英伟达CEO黄仁勋在声明中评价道。
此次发布备受期待,部分原因是公司曾多次推迟上线。OpenAI CEO萨姆·奥尔特曼七月在X平台发文称需要更多时间"进行额外安全测试并审查高风险领域",此前六月他也明确表示模型不会当月发布。
OpenAI周二声明已对开放权重模型实施全面安全训练与测试。在预训练阶段清除了有害的化学、生物、放射性与核武器相关数据,并模拟了恶意行为者可能进行的模型微调。
测试表明,经恶意调优的模型无法达到其"准备框架"设定的高能力阈值——这是该公司衡量和防范危害的评估体系。OpenAI还透露已邀请三个独立专家团队对恶意微调评估提供反馈。
用户可通过Hugging Face和GitHub等平台依据Apache 2.0许可证下载模型权重,并借助LM Studio、Ollama等程序在个人电脑运行。亚马逊云、Baseten和微软云也将提供模型服务。
这两款模型均具备高级推理、工具调用和思维链处理能力,适配从消费级硬件到云端乃至终端设备的各种环境。例如gpt-oss-20b可在笔记本电脑运行,作为能检索文件和辅助写作的个人助手。
"我们很荣幸将这项耗资数十亿美元的研究成果开放给全世界,让尽可能多的人掌握AI技术,"奥尔特曼在周二的声明中表示。
