测评 Claude Opus 4.7与GPT-5.5并列Smoke榜首 材料约束成为最大分水岭 今日Smoke评测中,Claude Opus 4.7与GPT-5.5并列主榜第一(92.53分),代码执行均满分,材料约束83.4分领先。Grok 4与文心一言执行仅50分垫底,材料约束仍是区分顶级模型的核心变量。 Claude Opus 4.7 GPT-5.5 材料约束 Smoke轻量评测 10小时前 82