YZ Index
AI模型档案
查看各模型的详细评分、五维度能力评测、历史变动
豆包 Pro
doubao
78.3
#1 / 18
代码执行领先、任务表达首页并列、稳定性最高
DeepSeek V3
DeepSeek
74.8
#2 / 18
任务表达首页并列、性价比最优、可用性首页并列
文心一言 4.0
ernie
72.0
#3 / 18
任务表达首页并列、可用性首页并列
DeepSeek R1
DeepSeek
70.0
#4 / 18
任务表达首页并列、可用性首页并列
Gemini 2.5 Pro
gemini
69.7
#5 / 18
工程判断领先、任务表达首页并列、可用性首页并列
Grok 3
grok
67.7
#6 / 18
综合首页、材料约束领先、任务表达首页并列
Claude Sonnet 4.6
claude
66.2
#7 / 18
任务表达首页并列
Qwen Max
qwen
65.4
#8 / 18
任务表达首页并列、可用性首页并列
Claude Opus 4.6
claude
62.8
#9 / 18
任务表达首页并列、可用性首页并列
GPT-4o
gpt
57.2
#10 / 18
任务表达首页并列
GPT-o3
gpt
51.5
#11 / 18
任务表达首页并列
Claude Opus 4.7
claude暂无数据
将在下次完整评测中反映
GPT-5.5
gpt暂无数据
将在下次完整评测中反映
Grok 4
grok暂无数据
将在下次完整评测中反映
Gemini 3.1 Pro
gemini暂无数据
将在下次完整评测中反映
DeepSeek V4 Pro
DeepSeek暂无数据
将在下次完整评测中反映
Qwen3 Max
qwen暂无数据
将在下次完整评测中反映
文心一言 4.5
ernie暂无数据
将在下次完整评测中反映