预见

xAI加入世界模型战局:马斯克的新赌局能成功吗?

作者: 预见大模型 人物 顶级公司 #顶级公司 #人物

原文链接: https://www.yjnt111.top/article/727

一、赌局又开始了

为什么“世界模型”最近突然被炒热?

这背后不仅有AI技术的瓶颈,也有资本市场的新机会。

就在10月12日,英国《金融时报》曝出一条引发全球AI圈震动的消息:

马斯克的AI初创公司xAI在今年夏天从芯片巨头英伟达挖走多名人工智能专家,组建专门团队,负责世界模型(World Model)研发。

据报道,这些研究人员的任务是让AI通过对大量视频和机器人数据的学习,掌握真实世界的物理规律。

换句话说,ChatGPT学语言,xAI要让AI学世界。

这听上去像是一次疯狂的跨界,但对马斯克来说,正合常理。

他赌的不仅是AI的智商,而是AI的“常识”——那种人类日常不假思索的因果理解:杯子为什么会倒、水为什么会洒、球为什么会滚。

如果AI能掌握这些常识,它就不再只是“说话的机器”,而可能成为理解、预测乃至控制物理世界的智能体。

二、从OpenAI到xAI

要理解马斯克这次为什么又押注世界模型,必须先回到他与OpenAI的那段往事。

2015年,马斯克是OpenAI的共同创始人之一,最初希望建立一个“开放的、造福人类的AI平台”。

但随着OpenAI走向商业化,与微软深度绑定,据多方报道,马斯克开始不满这一方向。

他认为AI不该被封闭巨头垄断,于是在2023年另起炉灶,成立了xAI。

他说,xAI的使命是“理解宇宙的真实本质”。

听起来玄乎,其实背后有他一贯的逻辑:

AI必须理解世界,才能改变世界。

成立一年多,xAI推出了聊天机器人Grok,主打“更真实、更不装”。

但Grok只是马斯克的“入场券”。

真正的战场,是“世界模型”——一个让AI像人一样具备物理常识、行动逻辑与空间感知的系统。

三、世界模型是什么?

要理解“世界模型”,可以打个比方。

如果说大语言模型(LLM)像是一个博学的学者,靠读无数本书来理解人类语言;

那么世界模型就像一个物理学家,靠观察世界去理解现实规律。

它通过训练海量视频、传感器与机器人交互数据,建立对现实世界的内部表征。

比如,它能学会:

·球体滚动会逐渐减速;

·杯子倾斜,液体会流出;

·当光线改变,影子会移动。

在技术原理上,这种模型依靠的是“预测与模拟能力”,并非真的“看见未来”,而是在学习连续帧之间的变化逻辑。

这类模型被认为是AI发展进入“具身智能(Embodied Intelligence)”阶段的关键一步。

只有AI能理解世界,机器人、自动驾驶、数字人、工业自动化这些真正能赚钱的场景,才可能被彻底打开。

四、为什么是现在?

马斯克选择在这个时点发起“世界模型战局”,并非冲动,而是天时地利俱备。

第一,他有数据。

据公开资料显示,特斯拉全球超过500万辆在售汽车,每天都在采集真实道路的图像、传感器与雷达数据。

这些数据堪称训练世界模型的“现实金矿”。

其他公司还在虚拟仿真中造数据,马斯克手中已经有了“地球录像带”。

第二,他有算力。

特斯拉自研的Dojo超级计算机,以及英伟达H100芯片集群,都能支撑视频级模型训练。

在当前AI芯片供给持续扩大的趋势下,训练“世界级AI”已不再是空谈。

第三,他有经验。

特斯拉自动驾驶的算法体系,本质上就是一种“世界模型雏形”——

AI通过感知环境、预测行人动作、判断道路变化来做出反应。

如今,xAI正尝试把这一能力泛化到更多领域。

所以,当外界看到马斯克又开始“讲故事”,他其实是在把多年的底层积累,转化为一场新的AI冒险。

五、从游戏开始,是必然

据知情人士消息,xAI为世界模型规划的第一个商业化落点是游戏领域,目标是让AI生成可交互的3D虚拟环境。

这一消息让市场瞬间热了起来。

因为这意味着,xAI不只是研究机构,而是在铺设一条通往商业化的现实路径。

为什么选择游戏?

因为游戏是一个“安全的现实世界”:

它有物理规则、有互动逻辑,却没有安全风险。

AI可以在游戏中不断试错、学习、修正。

对AI来说,游戏是虚拟的“训练营”。

在这些仿真环境中,AI能通过无数次模拟,学习速度、重力、碰撞、光照等真实物理规律。

如果它能在虚拟世界中生成完整的3D空间、自动设计剧情与动作逻辑,

那游戏开发成本将被彻底改写。

这不仅是技术突破,更是商业想象力的延伸。

正如一位业内人士所说:

“如果世界模型在游戏里能跑通,它就离现实世界不远了。”

当然,这一步依然是探索性的。

所以文中提到的“商业落点”并非现实收入,而是马斯克在布局下一阶段的验证场。

六、这场赌局有多难?

别被“能造游戏的AI”迷惑,这背后其实是AI界最难的一道题。

语言模型预测的是“下一个词”,

而世界模型预测的是“下一帧世界”。

每一帧视频背后都包含上亿个像素、数百个物理变量:光照、角度、力学、惯性……

模型不仅要预测,还要保持物理一致性——

水要流下去、球要反弹、光影要连续。

这让训练成本陡增。

据业内估计,世界模型的训练量级可能比语言模型高出数十倍。

不仅需要海量算力,还要高质量、多样化的视频与机器人交互数据。

更麻烦的是,这些数据并不像文本那样易于获取:

网络视频缺乏结构化标注,机器人数据昂贵而稀缺。

因此,即便是谷歌、OpenAI、英伟达这样的巨头,也都在小心试探。

可以说,这是AI历史上耗费巨大的一次尝试。

七、资本与竞争:第二战场已开

在这一波“世界模型热”中,几乎所有巨头都已上桌。

·Google DeepMind,推出Genie世界模型,能从图片生成互动式2D游戏;

·Meta,发布 V-JEPA 模型,更深入理解世界,自监督学习;

·OpenAI,在Sora中强调对物理世界的建模,推进视觉-动作融合方向;

·xAI,马斯克挖角英伟达团队研发世界模型。

不同于其他公司侧重算法创新,马斯克押的是“现实数据闭环”:

AI从车、机器人收集世界数据,再用这些数据训练更聪明的AI。

这种循环一旦跑通,将形成他人难以复制的护城河。

但风险同样巨大:

xAI成立仅一年多,团队规模和算力体量都不及OpenAI和DeepMind,

短期内盈利路径不清晰,长期效果仍待验证。

这场赌局既需要技术的耐力,也需要资本的耐心。

八、结语:赌未来的人

马斯克的每一场赌局,看起来都太大,太远,太冒险。

这一次,他赌的是AI能否从虚拟走向现实。

赌它是否能拥有“常识”,

是否能理解这个世界,而不仅是描述它。

这条路漫长、昂贵,却也可能是AI真正的终极之路。

如果赌赢,AI将从语言智能进化为世界智能;

如果赌输,其尝试本身也已构成行业实践的一部分。

而对所有关注AI的人来说,

重要并非这一探索的个体成败,

更值得关注的是,他所下注的方向,正与当下 AI 发展的深层需求相契合。

© 2025 AI资讯 - 用冷静的智慧预见下一个未知

京ICP备2025144713号-1

主体备案单位:北京预见花开网络科技有限公司