嘿,科技迷们!美东时间周三,Meta给大家带来了一款超厉害的开源模型——V-JEPA 2。它就像是人工智能世界里的“智慧精灵”,能让AI更好地理解3D环境,还能推理物理世界的运作规律。

Meta自豪地宣称,V-JEPA 2可是一款世界模型哦。它从物理世界的逻辑中“偷师”,构建出内部虚拟环境,让AI像人类一样学习、规划和决策。这个拥有12亿参数的模型,经过超100万小时的视频训练,在物理世界里展现出了顶尖的视觉理解和预测能力。比如,它能知道桌上滚下的球会掉落,藏起来的物体不会凭空消失。
V-JEPA 2在自动驾驶汽车和送货机器人领域优势明显,因为这些场景环境复杂多变。而且它和其他模型不同,通过简化后的“潜在空间”推理。据说,它比英伟达的Cosmos模型快30倍呢。
Meta首席人工智能科学家Yann LeCunn说,让机器理解物理世界和理解语言差别很大。世界模型就像一个虚拟简化的现实世界,能帮助AI理解世界、预测行为后果。他还相信,世界模型将开启机器人技术新时代,让现实中的AI助手轻松帮人们做家务等。那么问题来了,V-JEPA 2真的能如预期般改变未来吗?