测评 资源限制场景全员崩盘!WDCD测试11模型平均仅1.95分 资源限制成为WDCD五大场景中最难的维度,11模型平均仅1.95分。doubao-pro在业务规则拿下3.17分,却在资源限制跌至1.33分,差距达1.84分。gemini-3.1-pro和qwen3-max在安全合规并列3.5分,展现最强 WDCD 守约测试 资源限制 模型偏科 5小时前 61