测评 Claude Sonnet 4.6 97.53 分领跑,材料约束把文心一言拉开 40 分 今日 Smoke 评测显示,Claude Sonnet 4.6 以 97.53 分登顶,主榜前三被 Claude 与 Grok 包揽。代码执行 11 模型中 10 个满分,材料约束却把文心一言甩到最后,差距超过 40 分。 Claude Sonnet 4.6 材料约束 Smoke轻量评测 主榜排名 12小时前 61