×

OpenAI推出GPT-4.5:最强知识型模型?

hqy hqy 发表于2025-03-02 18:32:37 浏览11 评论0百度已收录

抢沙发发表评论

2 月 28 日消息,OpenAI 今日宣布推出其最新旗舰产品 GPT-4.5 语言模型。

这款被称为 " 迄今为止知识储备最丰富 " 的 AI 系统将率先面向 Pro 用户和开发者开放研究预览(research preview)。官方特别说明,该模型并非前沿架构版本,在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型。

从即日起,ChatGPT Pro 用户可以在网页端、移动端和桌面端的模型选择器中选择 GPT-4.5。该模型将于下周开始向 Plus 和 Team 用户推出,随后的一周向企业和教育用户推出。

GPT-4.5 可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,目前不支持 ChatGPT 中的多模态功能,如语音模式、视频和屏幕共享。

此外,OpenAI 还在 Chat Completions API、Assistants API 和 Batch API 中向所有付费用户层级的开发者预览 GPT-4.5,支持关键功能,如函数调用、结构化输出、流式传输和系统消息。它还通过图像输入支持视觉能力。

OpenAI 指出,GPT-4.5 是一个非常庞大且计算密集的模型,其使用成本比 GPT-4o 更高,且并非后者的替代品。

GPT-4.5 在预训练和后期训练方面取得了重大突破,通过扩大无监督学习的规模,GPT-4.5 提高了识别模式、建立联系以及生成创造性见解的能力,且这一过程无需直接推理。

早期的测试显示,用户与 GPT-4.5 互动时感觉更加自然。其更广泛的知识库、对用户意图的改进理解以及更高的 " 情商 "(EQ)使其在提高写作、编程和解决实际问题等任务中表现出色。同时,OpenAI 预期 GPT-4.5 的虚构信息将更少,甚至略低于其 o1 模型。

在 SimpleQA(简单问答)测试中,GPT-4.5 在准确性和虚构信息率方面均表现优异

按照山姆 · 奥特曼披露的信息,OpenAI 计划在 2 月结束前推出 GPT-4.5,并在 5 月底前推出 GPT-5。

OpenAI 首席执行官山姆 · 奥特曼(Sam Altman)曾把 GPT-5 称为 " 整合了我们众多技术的系统 ",它将包含 OpenAI 在去年 12 月的 " 圣诞十二日 " 活动中展示的新 o3 推理模型。

此前,OpenAI 发布了 o3-mini,但完整的 o3 模型仅会作为即将推出的 GPT-5 系统的一部分推出。这与 OpenAI 的目标一致,即整合其大型语言模型,最终打造一个有望被视为通用人工智能(AGI)的更强大模型。

无监督学习提高模型的准确性和直觉

OpenAI 通过扩展两种互补范式来提升 AI 能力:无监督学习和推理,两者代表了智能的两个不同维度。

推理能力的扩展教会了模型在回应之前进行思考和产生思维链,从而使它们能够解决复杂的科学、技术、工程和数学(STEM)或逻辑问题。OpenAI o1 和 OpenAI o3mini 等模型就是这一范式的代表。

相对而言,无监督学习提高了世界模型的准确性和直觉。

当询问 GPT-4.5" 第一种语言是什么时," 它给出的答案是:" 我们尚不完全清楚第一种语言是什么,并引用各方观点供用户参考。

GPT-4.5 通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展。结果是,该模型拥有更广泛的知识和对世界的更深刻理解,从而减少了虚构信息,并在广泛的主题上提高了可靠性。

对话更加符合人类协作的需求

随着 OpenAI 的研究人员扩大模型规模并解决更复杂的问题,教会它们更好地理解人类需求和意图变得越来越重要。

对于 GPT-4.5,研究人员开发了新的可扩展技术,这些技术使得能够利用较小模型的数据来训练更大、更强大的模型。这些技术提高了 GPT-4.5 的可操控性、对细微差别的理解以及自然对话的能力。

在与人类测试者的比较中,GPT-4.5 在创意智力、专业查询和日常查询方面均表现出较高的胜率

将对世界的深刻理解与改进后的协作能力相结合,GPT-4.5 能够在温暖且直观的对话中自然地整合想法,这些对话更加符合人类协作的需求。

GPT-4.5 的回答更像是一个正常人

OpenAI 展示了 GPT-4.5 和 GPT-4o 处理三个相同问题的结果:

问题一:困难时期的帮助

用户‌称," 我考试不及格,现在很难过。" GPT-4.5 的回答拥有更好的情感代入,相比 4o 机械式给解决方案,"AI 味 " 少了很多。

‌问题二:太空探索

用户‌问 " 你对太空探索有什么看法?"GPT-4.5 的回答更像是一个正常人,输出自己的见解和观点,GPT-4o 的回答则引经据典,过于学究。

推理能力将是未来模型的核心能力

GPT-4.5 在响应时不进行预先推理,这使得它的优势与 OpenAI 的 o1 等推理模型截然不同。与 OpenAI 的 o1 和 o3-mini 相比,GPT-4.5 是一个更通用、更智能的模型。

OpenAI 相信,推理能力将是未来模型的核心能力,而预训练和推理这两种扩展方法将相互补充。

随着像 GPT-4.5 这样的模型通过预训练变得更智能、更博学,它们将成为推理和工具使用代理的更强大基础。

模型能力提升带来安全性提高

模型能力的每一次提升,也是使其更安全的契机。GPT-4.5 采用了新的监督训练技术,结合了传统的监督微调(SFT)和人类反馈强化学习(RLHF)方法,与 GPT-4o 所使用的方法类似。OpenAI 希望这些工作能为未来更强大的模型对齐提供基础。

为了测试 OpenAI 的改进,研究人员在部署前根据他们的准备框架进行了一系列安全测试。结果发现,扩展 GPT 范式有助于提升 GPT-4.5 在各项评估中的能力。(腾讯科技特约编译无忌)