
北京时间 2 月 18 日中午,埃隆・马斯克旗下 xAI 公司正式发布最新一代大模型 Grok 3。“Grok 3 具有极强推理能力,在我们迄今为止所做的测试中,其表现优于我们所知的任何已发布产品。” 马斯克称之为 “地球最聪明的 AI”,并表示 “我们有信心 Grok 3 会比其他任何 AI 都强,将成为 AI 领域真正的颠覆者”。
根据官方公布的测试数据,Grok3 和 Grok3 mini 在数学、科学、代码等性能上都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手。具备推理能力的 Grok3 Reasoning Beta 和 Grok 3 mini Reasoning 则是超越了类似的推理模型,包括 DeepSeek-R1 和 OpenAI 的 o3 mini 等。
在现场演示过程中,xAI 展示了 Grok 3 的推理 + 编程能力,其中一个问题是 “生成 3D 动画代码,演示从地球发射、着陆火星,然后在下一个发射窗口返回地球的过程”。经过近两分钟的思考,Grok 3 生成了可以直接跑起来的 python 代码,3D 动画可以运行,但是否正确还有待验证。
据悉,Grok 3 是 Grok 的第三代版本,被视作 OpenAI 最新的旗舰模型 o3 的竞品。马斯克强调,Grok3 可以减少 AI 幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练 Grok3 所使用的算力远多于此前的版本,并使用了大量合成数据。
不同于 DeepSeek 的算法优化路径(DeepSeek-V3 用 2048 个 H800 GPU,训练 2788 千小时),xAI 透露,Grok 3 的开发得益于用 8 个月时间建成的 Colossus 超级计算机,它由 10 万个英伟达的 H100 GPU 驱动,为训练提供了 2 亿个 GPU 小时,比 Grok 2 多了十多倍。
xAI 团队介绍,Grok 3 的性能比 Grok 2 提升了一个数量级,并引入了 “思维链”(Chain Of Thought)推理能力,让其能够像人类认知过程一样逐步处理复杂任务。不过,一切还处在早期阶段,Grok 3 仍在训练中。今天发布会现场展示的只是 Grok 3 推理模型的一部分。
马斯克透露,Grok 计划以聊天机器人的形态在 X 平台、独立网站以及 iOS 应用上与用户见面。虽然网页和 iOS 版本已准备就绪,但语音模式还需等待大约 1 周的时间才能正式上线。而且,为了满足开发者的需求,Grok 后续还会开放 API,方便开发者将其集成到更多的应用场景中,进一步释放 Grok 的潜力。
此外,有消息称,近日 xAI 公司正寻求一轮约 100 亿美元的融资,此轮融资将使公司估值达到约 750 亿美元。包括红杉资本、Andreessen Horowitz 以及 Valor Equity Partners 在内的现有投资者正在洽谈参与此次交易。
值得一提的是,就在 xAI 发布 Grok3 前的几个小时,其竞争对手公司 OpenAI 首席执行官兼联合创始人 Sam Altman 于凌晨在社交平台表示:“对于高要求的测试者来说,试用 GPT-4.5 的体验,远比我预期的要深刻得多!” 业内人士预计,这说明 GPT-4.5 已经进入测试阶段,离正式发布的时间非常近了。
在全球 AI 大模型竞争日趋白热化的当下,Grok 3 的发布无疑投下了一颗重磅炸弹。其强大的性能数据与独特的技术路径,为 AI 领域带来了新的变量。而 OpenAI 这边,虽未正式推出 GPT-4.5,但 Altman 的表态也让人对其充满期待。未来,这两大巨头在 AI 赛道上究竟会擦出怎样的火花,是 Grok 3 持续引领创新,还是 GPT-4.5 后来居上?AI 领域的格局又将如何演变?我们拭目以待。