GPT-o3
变动分析 · 2026年 第14周
GPT-o3 2026年 第14周 代码执行维度下降 15.3 点
评分对比
55.0
50.6
-4.4
| 维度 | 上次 | 本次 | 变动 |
|---|---|---|---|
| 代码执行 | 84.7 | 69.4 | -15.3 |
| 知識综合 | 47.2 | 51.2 | +4 |
| 材料约束 | 56.9 | 53.2 | -3.7 |
| 性价比 | 7.7 | 6.9 | -0.8 |
| 稳定性 | 29 | 31.7 | +2.7 |
| 可用性 | 93.9 | 83 | -10.9 |
所有匹配题目的评分没有变动,或无法与上次评测的题目匹配。
返回变动排行榜