测评 WDCD选型指南:企业选模型,不要再只问"谁第一" 总分只反映平均水平,场景矩阵才暴露真实短板。Run #105中Qwen3-Max总分2.6居首,但同为2.5的ERNIE 4.5以R3=0.8最抗压,Claude Sonnet 4.6以R2满分见长。企业选型不应追榜首,要匹配自身风险场景。 WDCD 企业选型 场景矩阵 模型对比 5小时前 64