2 月 27 日,OpenAI 重磅推出最新人工智能模型,该公司称,这是其迄今为止最大、最棒的聊天模型。
其最引人注目的亮点,当属 " 活人感强 " 这一特性。OpenAI 表示,用户与 GPT-4.5 交互时感觉更为自然,模型展现出更高的 " 情商 "。
目前 GPT-4.5 仅面向每月 200 美元的 ChatGPT Pro 计划用户开放,公司计划下周开始向 Plus 和 Team 用户推出。
核心亮点:活人感更强!
OpenAI 仅用一场持续了不到 14 分钟的发布会介绍了 GPT-4.5 模型。
GPT-4.5 作为去年 5 月发布的 GPT-4o 模型的下一代产品,是 OpenAI 最后一款非推理模型。从 GPT-5 起,OpenAI 的推理和通用模型将实现融合。
OpenAI 称,GPT-4.5 将是其聊天机器人系统中最后一个不进行 " 思维链推理 " 的版本。
此次发布之后,OpenAI 后续模型可能会像人类一样,在回答问题前花费更多时间思考,而非即刻回应。
值得注意的是," 活人感更强 " 是 GPT-4.5 的一大显著亮点。
OpenAI 指出,用户与 GPT-4.5 交互时感觉更为自然,模型展现出更高的 " 情商 ",这让它在提高写作、编程和解决实际问题等任务中非常有用。
当用户表示,因考试失败而感到沮丧时,GPT-4.5 会像朋友一样给予安慰并倾听,展现出极高的情感理解与回应能力。反观 GPT-4o,面对相同情境,其反馈则显得较为机械。
OpenAI 研究副总裁 MiaGlaese 表示,该模型独特之处在于能进行热情、直观且自然流畅的对话,对用户需求的理解能力更强。
此外,OpenAI 在周四的博客文章中提到,GPT-4.5" 拥有更广泛的知识和对世界更深入的理解,减少了幻觉现象,在众多主题上的可靠性得以提高 "。
在与 GPT-4o 以及近期发布的推理模型 o3-mini 的性能对比中,GPT-4.5 优势明显。在简单问题回答准确率上,GPT-4.5 达到 62.5%,远超 GPT-4o 的 38.2% 和 o3-mini 的 15.0%;幻觉率方面,GPT-4.5 为 37.1%,低于 GPT-4o 的 61.8% 和 o3-mini 的 80.3%。
在人工智能模型基准测试中,GPT-4.5 在数学、科学等领域的表现优于 GPT-4o,在语言和多模态领域胜过 o3-mini,不过在科学和数学方面略逊一筹。
此外,GPT-4.5 具备通过搜索获取最新信息的能力,支持文件和图片上传,还可利用画布进行写作和编码。但目前不支持 ChatGPT 中的语音模式、视频和屏幕共享等多模式功能。
面临 GPU 荒
目前 GPT-4.5 仅面向每月 200 美元的 ChatGPT Pro 计划用户开放。OpenAI 表示,将努力在未来让更多用户能够使用该模型,公司计划下周开始向 Plus 和 Team 用户推出,再下周向 Enterprise 和 Edu 用户推出。
OpenAI 的首席执行官 Sam Altman 在 X 平台还发文指出,GPT-4.5 模型太大了,以至于公司正面临 GPU(运行和训练 AI 系统所需芯片)短缺问题。
他表示:" 这并非我们期望的运作方式,然而,导致 GPU 短缺的增长激增情况实在难以精准预测。" 不过,他也补充道,预计未来几周会补充上万块 GPU,以缓解当前的困境。
待下周 GPU 到位后,OpenAI 便会开始向每月支付 20 美元订阅费用的 Plus 用户推送 GPT-4.5。
值得关注的是,OpenAI 在全球范围内都面临着来自竞争者的压力。
在国内,人工智能初创公司 DeepSeek 推出的最新模型 DeepSeek-V3,在自然语言处理、代码生成、复杂推理等任务中表现优异,且训练成本仅为同类模型的十分之一。在国外,谷歌的 Gemini、Anthropic 的 Claude、微软的 CoPilot 以及埃隆・马斯克创建的 Grok3 等,也都在不同程度上对 OpenAI 构成挑战。
此前,OpenAI 宣布了 GPT-5 的相关计划。OpenAI 表示,不会将推理 / 编码模型作为独立产品发布,而是把相关功能整合进统一的 GPT-5 系统。GPT-5 的发布将实现 o(Omni)系列模型(如 GPT-4o)的 " 推理 " 能力与 GPT 模型语言能力的融合。
不过当被问到发布时间时,Altman 则表示,还要几个月。