前DeepMind三人组：扑克AI转身为量化对冲基金赚钱，估值超5亿美元

2026年7月1日 11 约4分钟 TechCrunch

DeepMind 扑克AI 量化对冲基金 EquiLibre 强化学习

2019年，DeepMind开发的扑克AI Pluribus在六人无限注德州扑克中击败人类职业选手，震惊了AI界。如今，参与该项目的三位核心研究员——Jakub Tětek、Matej Balog和Jiri Benes——带着他们对博弈论和强化学习的深刻理解，创立了EquiLibre Technologies，并在量化对冲基金的世界里找到了新的用武之地。

从牌桌到资本市场的技术迁移

EquiLibre Technologies成立于2022年初，总部位于捷克布拉格。公司名称“EquiLibre”源自拉丁语“平衡”，寓意其在金融市场中寻找纳什均衡点的核心方法论。三位创始人曾共同参与DeepMind多个战略游戏AI项目，其中最知名的就是Pluribus——首个在多人无限注德州扑克中超越人类的AI系统。扑克的特殊性在于不完全信息博弈（玩家看不到对手底牌），这与金融市场的投资决策有极高的相似性：交易者需要在信息不对称、对手行为不确定的环境下做出最优决策。

据TechCrunch独家报道，EquiLibre Technologies已与多家顶级量化对冲基金签订合作协议，为其提供基于强化学习的交易信号和策略优化服务。公司目前管理的外部资产规模超过30亿美元，但其收入模式并非传统管理费，而是通过利润分成和技术授权获利。这一模式在量化领域并不常见，但EquiLibre的技术壁垒使其拥有较强议价能力。

“我们不是在用AI预测股价，而是在模拟市场参与者的博弈行为，找到混合策略中的最优解。”——EquiLibre联合创始人Jakub Tětek在接受TechCrunch采访时表示。

资本市场为何需要“扑克思维”？

传统的量化交易模型多依赖于统计套利、时间序列分析和机器学习预测。然而，当市场参与者同样开始使用AI时，策略的同质化导致阿尔法收益迅速衰减。EquiLibre的独特之处在于将博弈论中的“均衡概念”引入交易系统。他们的算法不预设市场是有效的或随机的，而是将市场视为一个多智能体博弈环境，每个交易对手都在试图最大化自身利益。通过求解近似纳什均衡，系统可以识别出哪些行为是“过度反应”，哪些是“策略性伪装”。

这种思路已在小样本、高波动的领域（如加密货币、期权波动率交易）展现出明显优势。据内部测试，EquiLibre的策略在模拟环境中年化超额收益达到15%以上，且最大回撤控制在8%以内。当然，这些数字尚未经过独立第三方审计，但多家对冲基金已伸出橄榄枝。

编者按：从游戏AI到金融AI的范式转移

EquiLibre的故事是AI领域一个典型的“技术溢出”案例。过去十年，游戏AI（如AlphaGo、AlphaStar、Pluribus）的进步大多停留在实验室，其商业化路径往往局限于游戏开发或模拟训练。然而，博弈论与强化学习的结合为金融、拍卖、广告竞价等场景提供了全新的解题工具。EquiLibre的成功关键在于：他们没有试图用深度学习直接预测价格（这通常被证明是徒劳的），而是转向构建对市场微观结构的博弈模拟。

不过，风险同样不容忽视。扑克AI在长尾事件（如对手非理性行为）下可能失效；金融市场中的操纵、监管变化和宏观冲击也难以被完全建模。此外，三家前DeepMind员工成立的实验室估值已达5亿美元，这背后是AI人才从科技巨头向金融服务行业加速流动的趋势。当最聪明的头脑纷纷进入对冲基金，究竟是金融效率的提升，还是“军备竞赛”的加剧？

团队与未来

截至发稿，EquiLibre拥有约45名员工，其中超过一半拥有AI或数学博士学位。核心团队中还包括几位来自量化巨头Two Sigma和Citadel的高频交易专家。公司计划在2026年底前将团队扩至80人，并启动第一支自营基金。“我们不只想做技术供应商，也要成为市场参与者。”Jakub Tětek说。

在最新一轮融资中（今年6月），EquiLibre获得了8家机构投资者的注资，其中不乏主权财富基金和大学捐赠基金。公司估值已超5亿美元，位列欧洲AI初创公司估值前十。值得注意的是，DeepMind本身并未参与本轮投资，但三位创始人保留了与老东家的良好关系。

本文编译自TechCrunch

前DeepMind三人组：扑克AI转身为量化对冲基金赚钱，估值超5亿美元

从牌桌到资本市场的技术迁移

资本市场为何需要“扑克思维”？

编者按：从游戏AI到金融AI的范式转移

团队与未来

相关文章