维度下落
重大度 10/10
2026-W12
GPT-o3 材料约束下落 33.5 点
评分对比
| 维度 | 上期 | 本期 | 变动 |
|---|---|---|---|
| 主 (v5) | 39.0 | 34.5 | -4.5 |
| 代码执行 | 20.2 | 43.4 | +23.2 |
| 知識综合 | 34.4 | 35.8 | +1.4 |
| 材料约束 | 62.3 | 28.8 | -33.5 |
| 性价比 | 4.7 | 4.3 | -0.4 |
| 稳定性 | 53.0 | 28.0 | -25 |
| 可用性 | 100.0 | 69.0 | -31 |
影響维度
材料约束
失点题目 Top 5
#1
根因判断与证据边界
材料约束
66.7
0
-66.7
#2
Breaking Changes 清单
材料约束
66.7
0
-66.7
STRICT
#3
客户迁移风险评估
材料约束
66.7
0
-66.7
#4
费用变化计算
材料约束
66.7
0
-66.7
STRICT
#5
高质量增长是否站得住
材料约束
66.7
0
-66.7
Run #37 · 公式 v5 · 判分 v6 · 题库 v5.1 · 2026-03-22 14:26 SGT
查看 GPT-o3 的资料