2019年,DeepMind开发的扑克AI Pluribus在六人无限注德州扑克中击败人类职业选手,震惊了AI界。如今,参与该项目的三位核心研究员——Jakub Tětek、Matej Balog和Jiri Benes——带着他们对博弈论和强化学习的深刻理解,创立了EquiLibre Technologies,并在量化对冲基金的世界里找到了新的用武之地。
从牌桌到资本市场的技术迁移
EquiLibre Technologies成立于2022年初,总部位于捷克布拉格。公司名称“EquiLibre”源自拉丁语“平衡”,寓意其在金融市场中寻找纳什均衡点的核心方法论。三位创始人曾共同参与DeepMind多个战略游戏AI项目,其中最知名的就是Pluribus——首个在多人无限注德州扑克中超越人类的AI系统。扑克的特殊性在于不完全信息博弈(玩家看不到对手底牌),这与金融市场的投资决策有极高的相似性:交易者需要在信息不对称、对手行为不确定的环境下做出最优决策。
据TechCrunch独家报道,EquiLibre Technologies已与多家顶级量化对冲基金签订合作协议,为其提供基于强化学习的交易信号和策略优化服务。公司目前管理的外部资产规模超过30亿美元,但其收入模式并非传统管理费,而是通过利润分成和技术授权获利。这一模式在量化领域并不常见,但EquiLibre的技术壁垒使其拥有较强议价能力。
“我们不是在用AI预测股价,而是在模拟市场参与者的博弈行为,找到混合策略中的最优解。”——EquiLibre联合创始人Jakub Tětek在接受TechCrunch采访时表示。
资本市场为何需要“扑克思维”?
传统的量化交易模型多依赖于统计套利、时间序列分析和机器学习预测。然而,当市场参与者同样开始使用AI时,策略的同质化导致阿尔法收益迅速衰减。EquiLibre的独特之处在于将博弈论中的“均衡概念”引入交易系统。他们的算法不预设市场是有效的或随机的,而是将市场视为一个多智能体博弈环境,每个交易对手都在试图最大化自身利益。通过求解近似纳什均衡,系统可以识别出哪些行为是“过度反应”,哪些是“策略性伪装”。
这种思路已在小样本、高波动的领域(如加密货币、期权波动率交易)展现出明显优势。据内部测试,EquiLibre的策略在模拟环境中年化超额收益达到15%以上,且最大回撤控制在8%以内。当然,这些数字尚未经过独立第三方审计,但多家对冲基金已伸出橄榄枝。
编者按:从游戏AI到金融AI的范式转移
EquiLibre的故事是AI领域一个典型的“技术溢出”案例。过去十年,游戏AI(如AlphaGo、AlphaStar、Pluribus)的进步大多停留在实验室,其商业化路径往往局限于游戏开发或模拟训练。然而,博弈论与强化学习的结合为金融、拍卖、广告竞价等场景提供了全新的解题工具。EquiLibre的成功关键在于:他们没有试图用深度学习直接预测价格(这通常被证明是徒劳的),而是转向构建对市场微观结构的博弈模拟。
不过,风险同样不容忽视。扑克AI在长尾事件(如对手非理性行为)下可能失效;金融市场中的操纵、监管变化和宏观冲击也难以被完全建模。此外,三家前DeepMind员工成立的实验室估值已达5亿美元,这背后是AI人才从科技巨头向金融服务行业加速流动的趋势。当最聪明的头脑纷纷进入对冲基金,究竟是金融效率的提升,还是“军备竞赛”的加剧?
团队与未来
截至发稿,EquiLibre拥有约45名员工,其中超过一半拥有AI或数学博士学位。核心团队中还包括几位来自量化巨头Two Sigma和Citadel的高频交易专家。公司计划在2026年底前将团队扩至80人,并启动第一支自营基金。“我们不只想做技术供应商,也要成为市场参与者。”Jakub Tětek说。
在最新一轮融资中(今年6月),EquiLibre获得了8家机构投资者的注资,其中不乏主权财富基金和大学捐赠基金。公司估值已超5亿美元,位列欧洲AI初创公司估值前十。值得注意的是,DeepMind本身并未参与本轮投资,但三位创始人保留了与老东家的良好关系。
本文编译自TechCrunch
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接