测评 材料约束集体暴跌20分,Claude Opus 4.7 90.78分守住第一 2026-06-13 Smoke评测显示11个模型中10个代码执行满分,材料约束却普遍暴跌15-30分。Claude Opus 4.7主榜90.78分排名第一,GPT-5.5材料约束跌至66分,主榜仅84.7分。豆包Pro主榜单日上涨23. Claude Opus 4.7 材料约束 GPT-5.5 Smoke评测 9小时前 54