测评 Qwen3 Max 92.50分登顶 WDCD守约榜 豆包Pro 62.50分垫底差距30分 Qwen3 Max以92.50分位居WDCD守约排行榜首位,豆包Pro以62.50分垫底,头部与尾部相差30分。满分率47.3%,R3崩溃率16.4%。Claude Sonnet 4.6和DeepSeek V4 Pro分列二三位,GPT-o WDCD 守约测试 Qwen3 Max AI模型守约能力 10小时前 31