亚马逊AI芯片剑指英伟达?AWS拟对外出售自研芯片

亚马逊AI芯片剑指英伟达?AWS拟对外出售自研芯片

6月19日,据TechCrunch独家报道,亚马逊云服务(AWS)正与多家数据中心运营商进行谈判,计划将其自研的AI芯片(包括Trainium和Inferentia系列)直接出售给第三方数据中心,而不仅仅局限于AWS云平台内部使用。这一战略转向标志着亚马逊在AI芯片领域对英伟达发起更为直接的挑战。

从内部优化到外部变现

长期以来,AWS的自研芯片主要服务于其云计算业务,以降低对英特尔、AMD和英伟达的依赖,并针对特定工作负载优化性能。Trainium和Inferentia分别面向AI训练和推理场景,已在AWS内部得到广泛应用。然而,随着AI算力需求爆发式增长,亚马逊意识到这些芯片的外部商业价值可能远超内部使用。

亚马逊CEO安迪·贾西(Andy Jassy)在最近一次内部会议上表示:“我们看到了一个约500亿美元的市场机遇,通过向其他数据中心销售我们的AI芯片,AWS可以从芯片底层参与竞争,而不仅仅是提供云服务。”据知情人士透露,贾西已指示AWS硬件工程团队加速芯片的标准化和对外适配工作。

500亿美元的机会意味着什么?

目前AI芯片市场由英伟达主导,其GPU(如H100、B200)凭借强大的CUDA生态和极高的性能,占据了超过80%的市场份额。英伟达的市值也因此突破3万亿美元。亚马逊的入局,意味着原本属于云服务商之间的竞争将延伸到芯片硬件层面。

分析师指出,500亿美元的数字并非空穴来风。根据市场研究机构预估,到2027年全球AI芯片市场规模将超过4000亿美元,其中数据中心AI芯片占比超过60%。如果AWS能拿下10%-15%的份额,确实有望获得500亿美元级别的收入。但挑战同样巨大:英伟达的CUDA软件生态壁垒极高,客户迁移成本巨大。

亚马逊的底气:垂直整合与定制化优势

Amazon并非芯片新手。早在2015年,AWS就收购了以色列芯片公司Annapurna Labs,此后陆续推出了网络芯片、存储芯片和AI芯片。Trainium2芯片在性能功耗比上已接近英伟达同类产品,且针对亚马逊常见的推荐系统、语音助手等场景进行了深度优化。

值得注意的是,AWS并不打算在通用AI芯片上全面对标英伟达,而是专注于超大规模数据中心和特定行业客户。例如,为大型语言模型(LLM)推理提供更低成本的解决方案。据内部测试,Inferentia2在运行Meta的Llama 3模型时的推理成本比A100低40%以上。

编者按:一场注定不平的竞争

亚马逊此举无疑是聪明的——将自研芯片从成本中心转变为利润中心,同时提升对英伟达的议价能力。但英伟达也非等闲之辈。该公司正在加速推出下一代GPU和网络解决方案,并联合戴尔、惠普等服务器厂商巩固其企业市场地位。

当前AWS对外销售芯片还面临软件栈、生态兼容性等现实问题。英伟达的CUDA生态经过了十余年积累,拥有数百万开发者。AWS虽然推出了自己的芯片开发框架(如AWS Neuron),但普及度尚低。另外,数据中心客户对稳定性、运维支持的要求极高,AWS需要建立独立的销售和服务团队。

如果亚马逊能够成功说服超大规模数据中心(如微软、谷歌、Meta)采用其芯片,那将是真正的转折点。但由于这些客户本身也在自研芯片(如微软的Maia、谷歌的TPU),AWS的目标可能更集中于中型云服务运营商和AI初创公司。

无论如何,亚马逊的入局将加速AI芯片市场的竞争,推动价格下行和技术创新。英伟达或许会感到压力,但短期内其霸主地位难以撼动。未来三年,AI芯片市场将形成英伟达、亚马逊、以及谷歌/微软等多强并立的格局。

本文编译自TechCrunch