MLCommons 发布 MLPerf Mobile v6.0，新增设备端 LLM 基准

2026年6月29日 10 约2分钟 MLC

MLC MLPerf Mobile 设备端 LLM 基准测试 MLCommons 生成式 AI

MLCommons 今日宣布推出 MLPerf Mobile v6.0 版本，新增针对 Android 设备上运行大语言模型（LLMs）的生成式 AI 基准测试。这些测试与 MLPerf Mobile 应用中已有的图像生成、目标检测、超分辨率等基准共同构成完整测试套件。

新增设备端 LLM 基准测试

MLPerf Mobile v6.0 采用以下模型作为新的 LLM 基准：

模型将处理来自 TinyMMLU 和 IFEval 数据集的请求，以量化设备端 AI 推理的性能和准确性。

LLM 测试可在内存充足的设备上通过 CPU 运行，无需定制加速。此外，本次发布支持在高通 Snapdragon 8 Elite Gen 5 SoC 上通过 NPU 加速执行 Llama 3.1 8B Instruct 模型。工作组计划未来扩展对更多设备和平台的 LLM 加速支持。

为快速集成新设备支持，v6.0 版本新增对基于联发科 Dimensity 9500 系列芯片的设备支持。同时更新了对以下芯片的支持：

应用已支持众多移动设备上的 NPU 加速执行。

MLPerf Mobile 应用可通过 Google Play 商店、Apple App Store 以及 MLPerf Mobile GitHub 仓库获取。GitHub 仓库还提供了基于 Apache 2.0 许可的完整开源代码。