测评 材料约束集体暴跌20分,Grok 4 81.55分险胜Claude登顶 今日Smoke评测显示,11款主流模型材料约束维度普遍暴跌18-29分,导致整体排名剧烈洗牌。Grok 4以81.55分勉强守住第一,但约束仅59分且标warn;豆包Pro主榜暴跌37.2分,执行从高位直接腰斩至50分。核心问题集中在材料约 材料约束 Grok 4 Smoke轻量评测 模型波动 7小时前 49