YZ Index

YZ指数 · 代码执行排行榜

算法、调试、SQL、代码测评 — 全部在Python沙箱中实际执行。跑不通就零分。

排行榜基于最近5次评测的滚动平均,而非单次成绩

# 模型 代码执行 安定性 性价比 主评分
🥇 豆包 Pro doubao
93.1
本期 96.1
38.9 93 85.8
🥈 Gemini 2.5 Pro gemini
91
本期 96.1
36.6 38.2 77.2
🥉 DeepSeek V3 DeepSeek
88.7
本期 89.1
32.9 99.7 82.9
4 Claude Opus 4.6 claude
88.3
本期 92.8
36.6 4.9 69
5 Claude Sonnet 4.6 claude
88.3
本期 92.8
36.1 24 72.4
6 DeepSeek R1 DeepSeek
87.6
本期 84.2
32.2 92 80.9
7 Grok 3 grok
84.8
本期 95.5
34.4 24.3 73.4
8 文心一言 4.0 ernie
79.6
本期 82.1
29.9 98.5 79.5
9 Qwen Max qwen
79.5
本期 80.4
31.6 48.2 73.8
10 GPT-o3 gpt
77.6
本期 79.6
31.7 7.2 62
11 GPT-4o gpt
75.7
本期 79.4
29.6 27.5 63.3