预见

李飞飞:AI不止大语言模型,空间智能应该被重视

作者: 预见大模型 AI技术 人物 #AI技术 #人物

原文链接: https://www.yjnt111.top/article/1079

在人工智能的世界里,很少有人像李飞飞这样具备如此独特的影响力。她既是科学家,又是思想者;既推动了视觉智能的崛起,也开始反思语言模型的边界。她近期发表了长文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》,在业界再次引发了关注。其中她对于空间智能和大语言模型发展的看法,也非常具备代表性。

“空间智能”:让AI重新接触现实

李飞飞提出的“空间智能”(Spatial Intelligence),是让AI从虚拟语料走向三维现实的关键路径。她认为,空间智能将彻底改变我们创造和交互现实与虚拟世界的方式 —— 它将重塑叙事、创意、机器人学、科学发现等领域。这正是 AI 的下一个前沿。

她将其定义为:机器在真实世界中感知、建模、推理和交互的能力。这种智能不依赖静态文本,而是源于AI对世界的动态理解。

比如,人类幼儿学习“椅子”这一概念,是通过触摸、坐下、摔倒、再尝试的体验获得的;而语言模型,只能从文本中“读到”椅子,却无法真正理解它的空间属性。这种差距,让AI与现实之间存在认知断层。

“婴儿在还未学会说话的数月甚至数年中,正是通过与环境的嬉戏互动来认识世界。所有这一切都在无意识间、自动地完成 —— 这种流畅性,是机器至今尚未具备的。”

因此,李飞飞强调,AI必须重新建立与物理世界的连接。这也是她提出“从文字到世界(From Words to Worlds)”的核心主张:让智能回到具象、具身、有物理边界的现实中去

大语言模型的局限与边界

李飞飞在文中系统分析了当前大语言模型的三大局限。

首先是“现实失配”。语言模型依赖文本语料训练,而文本仅是人类对现实的抽象描述。AI所理解的“物体”“场景”“行为”,多是符号化的影像,而非真实动态过程。这导致模型在应对复杂环境时表现脆弱。

“当前最先进的 AI 在阅读、写作、研究和数据模式识别方面表现出色,但在对物理世界的表征与交互上却存在根本性局限。”李飞飞提出了自己对大语言模型的一个质疑。当下,AI仍主要停留在语料层学习,无法真正理解物理世界的规律。例如,它能回答“鸟会飞吗”,但无法预测具体飞行路径,也无法感知空气阻力。

空间智能的应用

作为计算机视觉领域的奠基者之一,李飞飞的思考天然具有“空间视角”。她同时指出了空间智能未来能对现实的科学带来的三个方面的提升。

科学研究 中,具备空间智能的系统能够模拟实验、并行检验假设、探索人类难以到达的环境 —— 从深海到遥远的行星。这项技术将重塑气候科学、材料研究等领域的计算建模方式。通过将多维度的仿真与真实世界的数据采集相结合,这类工具可以降低计算壁垒,拓展每一个实验室的观察与理解边界。

医疗领域 ,空间智能将从实验室到病房,全面改变医学实践。在斯坦福,我与学生及合作伙伴多年来与医院、养老机构以及家庭患者紧密合作,这段经历让我更加坚信空间智能在医疗中的变革潜力。AI 可以通过多维建模加速药物发现;通过模式识别辅助放射科医生提升影像诊断的准确性;并通过环境感知式监护系统支持患者与护理者,而不削弱康复所需的人际联系。更不用说,具备空间智能的机器人也能在不同场景中,为医护人员与患者提供强大的帮助。

教育领域 ,空间智能能够让抽象或复杂的概念变得可感知、可体验,从而实现沉浸式学习。它还能创造出与人类大脑与身体学习机制高度契合的迭代式学习体验。在 AI 时代,更快、更高效的学习与再培训,对学生与成年人都至关重要。学生可以以多维视角探索细胞运作机制,或亲身「走入」历史事件;教师则能借助交互式环境实现个性化教学;而外科医生、工程师等专业人士则可在逼真的仿真环境中安全练习复杂技能。

她指出为了赋予机器这种能力,需要构建一种全新的“世界模型”。这种模型必须具备三种核心能力:首先是生成性 ,能够创造出在几何、物理和语义上都保持一致性的虚拟世界;其次是多模态性 ,能理解和整合文本、图像、动作等多种指令;最后是交互性 ,能根据动作输入预测世界的下一步变化。

李飞飞认为,如果要实现空间智能,需要的远不止大语言模型那样的体系,而是世界模型—— 一种新型生成式模型,能够在语义、物理、几何与动态等多重复杂世界中进行理解、推理、生成与交互。

AI将从依赖语言数据,转向理解真实世界的动态规律;从符号生成,走向空间推理;从被动响应,走向具象决策。一旦实现,AI的整体水平将迈上一个新的台阶,人工智能将从二维走向三维时代。

© 2025 预见 - 用冷静的智慧预见下一个未知

京ICP备2025144713号-1

主体备案单位:北京预见花开网络科技有限公司

微信扫码分享
微信扫码分享本文