测评 Qwen3 Max 72.5分称霸 WDCD,文心一言 45 分垫底 R3 崩溃率 60.9% Qwen3 Max 以 72.50 分领跑 WDCD 守约榜,R3 阶段拿下 0.90/2;文心一言 4.5 以 45 分垫底,R3 仅 0.30。11 个模型中满分率仅 11.8%,R3 崩溃率高达 60.9%,头部与尾部差距达 27.5 WDCD 守约测试 AI模型排行榜 大模型合规性 7小时前 61