DeepSeek R1
变动分析 · 2026-03-24-同日对比
DeepSeek R1 2026-03-24-同日对比 代码执行维度上升 7.1 点
评分对比
74.0
76.1
+2.1
| 维度 | 上次 | 本次 | 变动 |
|---|---|---|---|
| 代码执行 | 92 | 99.1 | +7.1 |
| 知識综合 | 47.2 | 48.8 | +1.6 |
| 材料约束 | 80.1 | 80.1 | 0 |
| 性价比 | 92.7 | 93.3 | +0.6 |
| 稳定性 | 33.2 | 31.4 | -1.8 |
| 可用性 | 100 | 100 | 0 |
所有匹配题目的评分没有变动,或无法与上次评测的题目匹配。
返回变动排行榜