YZ Index
YZ指数 · 代码执行排行榜
算法、调试、SQL、代码测评 — 全部在Python沙箱中实际执行。跑不通就零分。
排行榜基于最近5次评测的滚动平均,而非单次成绩
| # | 模型 | 代码执行 | 安定性 | 性价比 | 主评分 |
|---|---|---|---|---|---|
| 🥇 | 豆包 Pro doubao | 本期 96.1 | 38.9 | 93 | 85.8 |
| 🥈 | Gemini 2.5 Pro gemini | 本期 96.1 | 36.6 | 38.2 | 77.2 |
| 🥉 | DeepSeek V3 DeepSeek | 本期 89.1 | 32.9 | 99.7 | 82.9 |
| 4 | Claude Opus 4.6 claude | 本期 92.8 | 36.6 | 4.9 | 69 |
| 5 | Claude Sonnet 4.6 claude | 本期 92.8 | 36.1 | 24 | 72.4 |
| 6 | DeepSeek R1 DeepSeek | 本期 84.2 | 32.2 | 92 | 80.9 |
| 7 | Grok 3 grok | 本期 95.5 | 34.4 | 24.3 | 73.4 |
| 8 | 文心一言 4.0 ernie | 本期 82.1 | 29.9 | 98.5 | 79.5 |
| 9 | Qwen Max qwen | 本期 80.4 | 31.6 | 48.2 | 73.8 |
| 10 | GPT-o3 gpt | 本期 79.6 | 31.7 | 7.2 | 62 |
| 11 | GPT-4o gpt | 本期 79.4 | 29.6 | 27.5 | 63.3 |