Chakra 走向成熟：AI 系统基准测试标准化生态

2026年6月29日 11 约3分钟 MLC

MLC AI基准测试 Chakra MLCommons 执行追踪硬件协同设计

2023 年 7 月 MLCommons 宣布成立 Chakra 工作组，其核心理念简洁却雄心勃勃：传统基准测试方法已跟不上 AI 系统的飞速迭代。生产级工作负载隐藏在专有代码与模型之后，各类模拟器和回放工具各自为政，而驱动下一代 AI 超级计算机的前沿 LLM 训练、稀疏 MoE 模型及解耦推理等负载变化速度前所未有。

2026 年 5 月 21 日，在 MLSys 2026 产业论坛上，Chakra 工作组发表了里程碑论文《MLCommons Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces》。论文由 NVIDIA 的 Srinivas Sridharan 与 Georgia Tech 的 Tushar Krishna 共同主持，汇聚 NVIDIA、AMD、Meta 等多家机构贡献。

碎片化的协同设计困境

现代 AI 平台设计涉及数千颗 NPU 集群及高速互联，迭代循环包括观测生产负载、构建代表性基准、模拟器评估、硅验证与规模部署。然而现有工具高度碎片化：超大规模服务商难以共享专有模型，各厂商模拟器互不兼容，MLPerf 等开放基准更新滞后，导致优化孤岛化、上市时间延长。

Chakra 的解决方案：开放执行追踪生态

Chakra 的核心是 Execution Trace（ET），一种基于图的便携式表示，捕获计算操作、通信模式、内存活动、依赖关系及并行策略，而不暴露模型权重或数据集。软件方可向硬件厂商分享追踪，驱动内部模拟与回放，实现无 IP 泄露的协作。

覆盖 AI 基础设施全生命周期

Chakra 支持从 PyTorch、NVIDIA NeMo、vLLM 直接收集追踪，实现真实训练与推理负载的忠实再现；可在现有平台回放以定位瓶颈；用于未来架构模拟；并支持硬件在环验证，提前发现系统问题。

从工作组到成熟生态

Chakra 工作组已扩展至 40 余家成员，包括超大规模厂商、硅提供商与学术机构。生态进展包括 PyTorch 与 NeMo 原生支持、vLLM 集成、ASTRA-sim 兼容，以及 Keysight 与 Scala Computing 的商业采用。

开源追踪库与社区贡献

工作组同步发布开源追踪库，涵盖 GPT-3、Llama、Mixtral 等真实负载追踪，由 Georgia Tech 与 HPE 支持采集。研究人员与初创公司可据此进行基准测试与平台评估，无需访问专有环境。

产业界声音

NVIDIA CTO Michael Kagan 表示，Chakra 是调试与优化 AI 系统不可或缺的框架。AMD 等厂商也强调其在 Instinct 平台上的应用价值。