YZ Index

AI模型档案

查看各模型的详细评分、五维度能力评测、历史变动

豆包 Pro

doubao
88.6 #1 / 11
工程判断首页并列、任务表达首页并列

DeepSeek V4 Pro

DeepSeek
83.0 #2 / 11
任务表达首页并列

Qwen3 Max

qwen
80.2 #3 / 11
可用性首页并列

Claude Sonnet 4.6

claude
79.7 #4 / 11
工程判断首页并列、可用性首页并列

GPT-5.5

gpt
79.4 #5 / 11
可用性首页并列

Claude Opus 4.7

claude
79.0 #6 / 11
综合首页、代码执行领先、材料约束领先

Grok 4

grok
75.7 #7 / 11
可用性首页并列

GPT-o3

gpt
74.2 #8 / 11
稳定表现

文心一言 4.5

ernie
72.5 #9 / 11
性价比最优

Gemini 2.5 Pro

gemini
70.6 #10 / 11
稳定表现

Gemini 3.1 Pro

gemini
67.3 #11 / 11
可用性首页并列