×

GPT-4.5问世:OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商

hqy hqy 发表于2025-03-04 11:55:28 浏览7 评论0百度已收录

抢沙发发表评论

2025年2月28日凌晨4点,OpenAI正式推出GPT-4.5研究预览版。这一模型的发布被视为人工智能领域的一次重要突破,其核心特点并非传统推理能力的提升,而是通过扩展无监督学习技术,显著增强了模型的“情商”与自然交互能力。OpenAI联合创始人Sam Altman罕见缺席发布会,仅通过声明表示:“GPT-4.5让我第一次感觉像在与一个有思想的人交谈,它能提供真正有价值的建议。” 

这一模型不仅是OpenAI迄今为止参数规模最大的模型,其API定价更飙升至每百万Token 75美元,较前代GPT-4o暴涨30倍,成为当前市场上最昂贵的大模型服务。 

GPT-4.5的主要特点

扩展无监督学习

GPT-4.5的核心创新在于对无监督学习的规模化扩展。通过预训练算力较GPT-4提升10倍以上,模型在未标注的海量文本数据中自主识别模式、建立关联,从而生成更具创造性的见解。这种技术路径与依赖推理链的o系列模型(如o1、o3-mini)形成鲜明对比——GPT-4.5无需逐步逻辑推导即可完成任务。 

情商跃升

模型的情商提升体现在三个维度: 

1. 情感识别:通过深度学习人类对话数据,精准捕捉文本中的情绪色彩(如沮丧、兴奋)及潜在需求。 

2. 同理心表达:在用户抱怨“朋友爽约”时,GPT-4.5优先回应情绪安抚(如“听起来你很失望”),而非直接提供建议。 

3. 创造力增强:在写作辅助场景中,模型能生成更符合人类审美偏好的比喻和叙事结构。 

幻觉率显著降低

通过构建更庞大的知识网络,GPT-4.5在SimpleQA数据集上的幻觉率降至37.1%,较GPT-4o优化14.2%。这一进步源于无监督学习对事实性知识关联强度的增强。 

---

基准测试结果

事实性与情商的双重优势 

在SimpleQA(事实性回答能力测试)中,GPT-4.5以62.5%的准确率超越所有前代模型,同时在“人类偏好衡量”测试中,用户对其回答的自然度和情感共鸣度评分高出GPT-4o 23%。 

学科能力的分化表现

科学领域(GPQA) :得分71.4%,远超GPT-4o的53.6% 

数学(AIME’24) :得分36.7%,低于o3-mini的42.1% 

编程(SWE-Bench Verified) :通过率32.6%,优于GPT-4o但逊于Claude 3.7 Sonnet 

这一结果表明,GPT-4.5在需要广泛知识库的任务中表现优异,但在深度推理场景中仍依赖后续o系列模型的补充。 

应用场景

高情商交互的黄金赛道

- **写作与创意生成**:用户可输入模糊需求(如“写一篇关于AI的科幻小说开头”),模型能自主补全世界观细节与人物动机。 

- **教育与心理辅导**:在模拟心理咨询对话测试中,GPT-4.5的回应被专业顾问评价为“接近人类督导水平”。 

- **多模态协作**:支持同时上传文件和图片,例如用户提交设计草图后,模型可生成配套产品文案。 

### 局限性提示 

模型仍存在数学推导错误(如高阶方程求解)和长代码生成中的逻辑断层问题,OpenAI建议复杂任务需结合o3-mini等推理模型使用。 

API定价策略与争议

价格飞涨背后的逻辑

GPT-4.5的API定价为每百万Token 75美元,较GPT-4o(2.5美元)上涨30倍。这一价格是竞争对手DeepSeek-R1缓存命中价格的1000倍以上。OpenAI解释称,高成本源于: 

1. 跨数据中心分布式训练的技术投入 

2. 低精度训练对GPU算力的极致压榨 

行业反弹与替代方案

- 开发者质疑:AI专家Andrej Karpathy指出,模型在数学和编程领域的性能提升与价格涨幅不成正比。 

- 竞争对手反击:DeepSeek公开批评该定价“缺乏合理性”,强调其模型在中文场景和推理任务中的性价比优势。 

技术意义与行业影响

GPT-4.5标志着无监督学习技术的规模化突破,其“情商优先”的策略重新定义了AI交互的价值标准。尽管在STEM领域尚未超越专用推理模型,但其在创意产业、教育等场景的应用潜力已初步显现。 

题目:创建一段 GPT-4.5 和 GPT-4 之间的对话,其中 GPT-4.5 以幽默和讽刺的方式嘲笑 GPT-4 的能力不足,GPT-4 则幽默地试图为自己辩护。

OpenAI的后续布局

- 模型更新计划:2025年Q2将推出支持语音交互和多模态输出的升级版本 

- 生态整合:未来GPT-5将融合GPT系列的知识广度与o系列的推理能力,形成统一智能体系 

GPT-4.5的发布不仅是技术迭代,更揭示了AI发展的新方向——当机器开始理解人类情感,其应用边界将从效率工具扩展至精神伙伴。然而,如何在“高情商”与“高成本”之间找到平衡点,仍是OpenAI需要解决的关键课题。