李飛飛團隊在空間智能(Spatial Intelligence)領域的研究自2024年起取得了一系列突破性進展,其里程碑成果可歸納為以下核心方向:
一、理論框架提出與定義(2024年)
1、空間智能概念系統化
a.定義: 李飛飛首次明確空間智能為“機器在3D空間和時間中感知、推理和行動的能力”,強調其是超越語言智能的AI核心能力,對實現AGI至關重要。
理論意義: 提出空間智能是AI理解物理世界的底層基礎,與語言模型形成互補——語言處理符號序列,空間智能處理幾何、物理與動態交互。
二、關鍵技術突破(2024–2025年)
1、單圖生成3D世界模型(2024年12月)
技術內容: World Labs發布首個空間智能模型,僅需單張2D圖像即可生成高保真、可交互的3D場景,突破傳統NeRF技術對多視角輸入的依賴。
應用場景: 影視制作、游戲開發、建筑設計及AR/VR,大幅降低3D內容生成成本。
2、空間智能評估工具VSI-Bench(2025年4月)
設計細節: 基于288個真實場景視頻構建超5000個問答對,覆蓋居住、工業等多場景,測試任務包括空間布局推理、距離估算、動態預測等。
關鍵發現: Gemini-