维度下落 重大度 10/10 2026-W14

GPT-4o 代码执行下落 23.7 点

GPT-4o Run #52

评分对比

维度 上期 本期 变动
主 (v5) 81.1 49.3 -31.8
代码执行 78.0 62.8 -15.2
知識综合 79.0 47.2 -31.8
材料约束 80.1 49.1 -31
性价比 79.0 24.9 -54.1
稳定性 80.0 27.8 -52.2
可用性 100.0 79.0 -21

影響维度

代码执行
Run #52 · 公式 v7 · 判分 v6 · 题库 v6 · 2026-03-30 04:16 SGT
查看 GPT-4o 的资料