测评 Claude Opus 4.7 100分称王,9模型代码执行暴跌50分 2026-06-16 Smoke评测中,Claude Opus 4.7以执行100、约束100拿下主榜100分。文心一言4.5主榜81.69分排名第二,执行66.7分。9个模型代码执行出现-50分暴跌,主榜普遍下滑,Gemini系列执行分跌 Claude Opus 4.7 代码执行 Smoke评测 主榜排名 20小时前 85