YZ Index

YZ指数 · 可用性排行榜

API不可连接、超时、错误、拒绝服务——全部算失败。再聪明用不了也是零。

排行榜基于最近5次评测的滚动平均,而非单次成绩

# 模型 可用性 安定性 代码执行 主评分
🥇 Claude Opus 4.6 claude
100
36.6 88.3 69
🥈 DeepSeek R1 DeepSeek
100
32.2 87.6 80.9
🥉 DeepSeek V3 DeepSeek
100
32.9 88.7 82.9
4 Gemini 2.5 Pro gemini
100
36.6 91 77.2
5 Qwen Max qwen
100
31.6 79.5 73.8
6 Claude Sonnet 4.6 claude
99.8
本期 99
36.1 88.3 72.4
7 豆包 Pro doubao
99.8
本期 100
38.9 93.1 85.8
8 文心一言 4.0 ernie
99.8
本期 100
29.9 79.6 79.5
9 Grok 3 grok
99.3
本期 99
34.4 84.8 73.4
10 GPT-o3 gpt
88.3
本期 87
31.7 77.6 62
11 GPT-4o gpt
87.8
本期 91
29.6 75.7 63.3