测评 Gemini 3.1 Pro 96.96 分微弱领先,Claude Opus 4.7 仅差 0.13 今日 Smoke 快测中,Gemini 3.1 Pro 以 96.96 分夺冠,Claude Opus 4.7 紧随其后 96.83 分。两者代码执行同为 97.5 分,拉开差距的主要是材料约束维度。GPT-5.5 执行 97 分却约束仅 Gemini 3.1 Pro 材料约束 Smoke 轻量评测 代码执行差距 7小时前 71