世界模型创企Odyssey获亚马逊等巨头投资,估值达14.5亿美元

世界模型创企Odyssey获亚马逊等巨头投资,估值达14.5亿美元

在AI行业,大语言模型(LLM)的热潮尚未退去,但一股新的浪潮已经悄然兴起——世界模型(World Models)。本周,一家名为Odyssey的初创公司以14.5亿美元的估值完成新一轮融资,投资方包括亚马逊、红杉资本等知名机构,标志着世界模型赛道正式进入主流视野。

什么是世界模型?

与传统LLM基于海量文本数据进行语言概率预测不同,世界模型旨在构建能够理解物理世界内在规律、因果关系和空间逻辑的AI系统。它通过多模态数据(视觉、声音、触觉等)学习环境的动态演化,从而实现对未知情境的推理和预测。这一概念最早由AI先驱Yann LeCun提出,他将其视为实现通用人工智能的关键一步。

Odyssey的核心技术被称为“神经空间智能”,该平台能够从视频、传感器数据中提取时空结构,并生成可交互的3D环境模拟。其CEO在采访中表示:“我们正在构建一个操作系统级别的AI,它真正‘理解’现实世界是如何运转的。”

融资细节与战略意义

据消息人士透露,本轮融资为Odyssey的C轮融资,总金额约4.2亿美元,公司估值达14.5亿美元,较上一轮增长近3倍。亚马逊的加入尤为引人注目,此前该公司已在自动驾驶、机器人等领域大举投资,而世界模型恰好是这些应用的核心技术基础。

事实上,世界模型与LLM的关系并非替代而是互补。LLM擅长处理语言和符号逻辑,但在物理交互任务中常常出现“常识性错误”。例如,LLM可能知道“杯子掉在地上会碎”,但无法在3D空间中准确预测碎片飞溅的轨迹。而世界模型通过物理模拟和因果推理,能够弥补这一缺陷。

行业背景:从自动驾驶到元宇宙的底层引擎

近年来,自动驾驶公司如Waymo、特斯拉都在探索世界模型技术。特斯拉的FSD系统实际上就包含了一个简易的世界模型,用于预测周围交通参与者的行为。同样,游戏行业和元宇宙平台也开始利用世界模型生成逼真的虚拟环境。

然而,训练世界模型面临巨大挑战:需要极其庞大的高质量多模态数据集、高昂的计算成本,以及对物理规律精确建模的算法创新。Odyssey自2023年成立以来,已积累超过500万小时的真实世界视频数据,并开发了名为“Cosmos”的自监督学习框架,在多项基准测试中达到领先水平。

编者按:世界模型——AI的下一个“iPhone时刻”?

从GPT的爆发到世界模型的崛起,AI行业正在经历从“文本智能”向“物理智能”的延伸。LLM解决了“AI如何理解语言”,而世界模型回答了“AI如何理解现实”。如果说LLM是数字大脑的语言中枢,那么世界模型就是感觉和运动皮层。当两者深度融合,AI将真正具备在物理世界中自主行动和学习的能力。

Odyssey的估值飙升也反映出资本市场的判断:未来十年,世界模型可能创造比LLM更广阔的市场——从自动驾驶、工业机器人到医疗手术、家庭服务,几乎所有需要与环境交互的领域都将受益。不过,该领域仍处于早期阶段,技术标准、数据伦理和商业化路径都尚未成熟,创业者需警惕过度泡沫的风险。

本文编译自TechCrunch