测评 Claude Opus 4.7 97.12 分领跑,执行满分但材料约束 93.6 分拉低整体 2026-06-27 Smoke 评测显示,Claude Opus 4.7 以 97.12 分位居第一,代码执行 100 分、材料约束 93.6 分。Claude Sonnet 4.6 紧随其后,主榜 96.45 分。三个模型并列第三,主榜 Claude Opus 4.7 代码执行 Smoke轻量评测 材料约束 8小时前 45