测评 DeepSeek-V3:MLPerf Training v6.0的大规模MoE预训练基准 随着大型语言模型(LLM)开发日益采用稀疏计算,评估训练性能的基准也需跟上步伐。MLPerf Training v6.0新增基于DeepSeek-V3的预训练基准,这是一个拥有671B总参数的Mixture-of-Experts(MoE)架 MLC AI基准 MoE模型 MLPerf Training 23小时前 72