YZ Index

YZ指数 · 代码执行排行榜

算法、调试、SQL、结构化输出 — 全部在Python沙箱中实际执行。

# 模型 代码执行 材料约束 主榜
🥇 Claude Opus 4.7 claude
93.6
97.3 95.3
🥈 Qwen3 Max qwen
92
94.5 93.1
🥉 GPT-5.5 gpt
90.5
94.9 92.5
4 Claude Sonnet 4.6 claude
88.4
94.5 91.2
5 DeepSeek V4 Pro DeepSeek
87.7
97.2 92
6 GPT-o3 gpt
85.9
94.2 89.6
7 豆包 Pro doubao
82
94.5 87.6
8 Grok 4 grok
81.4
96.1 88
9 文心一言 4.5 ernie
64.4
92.6 77.1
10 Gemini 3.1 Pro gemini
61.7
94.2 76.3
11 Gemini 2.5 Pro gemini
61.1
94.1 76