维度下落 重大度 10/10 2026-W12

GPT-4o 材料约束下落 21.9 点

GPT-4o Run #37

评分对比

维度 上期 本期 变动
主 (v5) 41.2 39.2 -2
代码执行 19.6 48.8 +29.2
知識综合 35.4 33.4 -2
材料约束 62.3 40.4 -21.9
性价比 18.6 19.4 +0.8
稳定性 52.8 32.2 -20.6
可用性 100.0 65.0 -35

影響维度

材料约束

失点题目 Top 5

#1 根因判断与证据边界 材料约束 66.7 0 -66.7
#2 Breaking Changes 清单 材料约束 66.7 0 -66.7 STRICT
#3 费用变化计算 材料约束 66.7 0 -66.7 STRICT
#4 高质量增长是否站得住 材料约束 66.7 0 -66.7
#5 优先讨论的董事会议题 材料约束 66.7 0 -66.7 STRICT
Run #37 · 公式 v5 · 判分 v6 · 题库 v5.1 · 2026-03-22 14:26 SGT
查看 GPT-4o 的资料