23亿美元豪赌:用视频游戏训练AI真实直觉

23亿美元豪赌:用视频游戏训练AI真实直觉

在人工智能领域,数据是燃料,算法是引擎。但大多数AI的训练数据来自静态文本、图像或标注过的结构化数据集。General Intuition(通用直觉)公司却走了一条截然不同的路——它让AI玩视频游戏。这家刚刚完成3.2亿美元B轮融资的初创公司,总融资额已超过4亿美元,而其背后的长期投资承诺高达23亿美元。投资者显然相信,游戏中的动作数据能够赋予AI一种近似人类直觉的能力。

游戏即数据:为什么是视频游戏?

General Intuition由前DeepMind研究员Sarath Chandar和机器人专家Katie Bouman于2023年创立。他们的核心洞察是:视频游戏(尤其是动作RPG、即时战略和开放世界游戏)本质上是一个高保真度的模拟器,其中包含了丰富的因果链条和决策树。玩家需要实时感知环境、做出决策并承担后果,这种过程与真实世界中的导航、操作和协作高度相似。

“我们不是在教AI如何玩游戏,而是在教它如何‘思考’。”创始人Sarath Chandar在一次内部演示中表示,“游戏的每一个帧都包含了状态、动作和奖励——这正是强化学习所需要的完美数据。”

传统强化学习依赖人工设计的奖励函数和环境模拟器,费时费力且容易过拟合。而General Intuition的做法是直接利用现成游戏的录屏数据,通过逆向工程提取动作序列,然后使用自监督预训练和大规模模仿学习来训练一个‘基础行为模型’。其规模相当于一个视觉-动作版本的GPT。

23亿美元赌注的底层逻辑

这笔巨资并非一次性投入,而是根据里程碑分期支付。投资人包括Andreessen Horowitz、Sequoia Capital和沙特主权基金PIF。他们认为,如果General Intuition的方法成功,将打开一个全新的AI训练赛道——动作数据市场。实际上,该公司已经与多家游戏发行商达成协议,获取玩家匿名化后的操作数据。

在机器人领域,传统方法需要物理样机反复试错,成本高昂且风险大。而用游戏训练出的AI,可以直接在仿真环境中完成大部分学习,再通过少量真实世界微调即可部署。General Intuition计划将技术首先应用于仓储物流机器人,其次是人形机器人。

编者按:直觉AI的边界与隐忧

这一方向令人兴奋,但也存在显著挑战。游戏中的物理规则与现实世界并不完全相同(比如重力常数、材质摩擦系数等),AI在游戏中学会的‘直觉’可能会产生迁移误差。此外,数百万小时游戏数据中可能包含偏见、暴力或非最优策略,如何清洗与伦理审查是隐藏成本。

但不可否认,如果General Intuition成功,它可能颠覆整个机器人学习产业——从依赖昂贵真人示范和数据标注,转向利用海量游戏数据实现‘蛮力’式学习。这场23亿美元的赌局,或许正在为通用人工智能铺就一条意想不到的道路。

本文编译自TechCrunch