测评 11模型材料约束集体暴跌15分,Smoke评测揭示核心短板 今日Smoke轻量评测显示,11款主流模型主榜全线下滑,材料约束平均暴跌15分以上,多款从warn转为fail。代码执行保持满分,暴露模型在事实约束上的系统性退化。 材料约束 Claude Opus 4.7 模型评测 能力退化 10小时前 49