测评 Gemini 3.1 Pro 98.47 分登顶,Claude 执行分暴跌 27.2 后仅剩 72.8 2026-06-30 Smoke 评测显示,Gemini 3.1 Pro 以 98.47 分(执行 100、约束 96.6)排名第一。Claude Opus 4.7 执行分暴跌 27.2 至 72.8,主榜跌 16 分;文心一言 4.5 主 Gemini 3.1 Pro 代码执行 Smoke 轻量评测 主榜跌幅 9小时前 48