DeepSeek-V3 相关资讯

DeepSeek-V3：MLPerf Training v6.0的大规模MoE预训练基准

随着大型语言模型（LLM）开发日益采用稀疏计算，评估训练性能的基准也需跟上步伐。MLPerf Training v6.0新增基于DeepSeek-V3的预训练基准，这是一个拥有671B总参数的Mixture-of-Experts（MoE）架

DeepSeek V3以671B参数规模全面开源，GitHub仓库瞬间爆火，TechCrunch和36氪报道引发安全辩论。开源社区赞其民主化AI，中外观点对立：安全组织警告军备竞赛隐患。本文剖析争议深层地缘张力，强调技术贡献与风险平衡，wi