OpenAI Jalapeño芯片背后的成本算术

近日,AI界一则关于OpenAI定制芯片的传闻引发了广泛关注。据AI News报道,OpenAI正与芯片设计巨头Broadcom联手,打造一款名为“Jalapeño”的应用专用集成电路(ASIC)。这一举动并非简单的技术升级,而是一场精心计算的成本博弈。

数学账本:为什么OpenAI需要自己的芯片?

OpenAI的财务状况在很大程度上依赖于庞大的AI基础设施——尤其是训练和推理所需的GPU集群。目前,Nvidia在AI GPU市场占据主导地位,其利润率据估计高达75%。这意味着,无论是训练GPT-4这样的千亿参数模型,还是为ChatGPT的数十亿用户提供实时推理服务,OpenAI都需向Nvidia支付高昂的硬件费用。据内部测算,仅推理成本一项,就可能吞噬OpenAI每年数十亿美元的营收。

定制ASIC芯片“Jalapeño”正是瞄准这一痛点。与通用GPU不同,ASIC为特定工作负载(如Transformer推理)进行专项优化,可以在维持同等性能的情况下将能效比提升2-4倍,从而显著降低单次推理的电力成本和硬件折旧。OpenAI与Broadcom的合作瞄准的是“剪刀差”:用一次性的研发投入,换回持续性的资本支出削减。

“在AI赛道上,算力即权力。而谁掌握低成本算力,谁就能在这场烧钱大战中活得更久。” —— 业内分析师评论

行业背景:GPU与ASIC的博弈

尽管Nvidia的H100、B200等GPU在AI训练领域仍无可替代,但AI推理市场正迎来“百花齐放”。Google早在2016年就推出了TPU(张量处理单元)专用芯片,亚马逊也在Trainium和Inferentia芯片上持续投入。OpenAI此前传闻中的“Tigris”芯片计划虽未公开,但Jalapeño的曝光表明,OpenAI终于找到了垂直整合的关键路径。

值得注意的是,Broadcom在定制ASIC领域经验丰富,曾为Google、Meta等公司设计过多种芯片。OpenAI选择Broadcom而非自行研发,既能借助其成熟的设计能力,又避免承担流片失败的高昂风险。可以预见,Jalapeño将首先应用于OpenAI的推理服务,未来可能扩展到轻量训练场景。

编者按:一场芯片产业链的“再平衡”

Jalapeño芯片的出现,标志着顶级AI公司正在从“买芯片”向“造芯片”转型。这种趋势对Nvidia既是压力也是动力——一方面,大型客户的自研芯片会蚕食其部分市场份额;另一方面,专用芯片的普及反而可能推动更多中小企业转向Nvidia的通用解决方案,形成“巨头自研、中小采购”的分化格局。

对于整个AI行业而言,算力成本的下行将直接加速AI应用的普及。当推理成本降低到现在的十分之一甚至更低时,许多之前因成本问题无法商业化的AI场景(如实时视频分析、个性化教育)将迎来爆发。OpenAI的这盘“数学账”,可能比我们想象的更加深远。

(本文编译自AI News)