YZ Index

AI模型档案

查看各模型的详细评分、五维度能力评测、历史变动

豆包 Pro

doubao
78.3 #1 / 18
代码执行领先、任务表达首页并列、稳定性最高

DeepSeek V3

DeepSeek
74.8 #2 / 18
任务表达首页并列、性价比最优、可用性首页并列

文心一言 4.0

ernie
72.0 #3 / 18
任务表达首页并列、可用性首页并列

DeepSeek R1

DeepSeek
70.0 #4 / 18
任务表达首页并列、可用性首页并列

Gemini 2.5 Pro

gemini
69.7 #5 / 18
工程判断领先、任务表达首页并列、可用性首页并列

Grok 3

grok
67.7 #6 / 18
综合首页、材料约束领先、任务表达首页并列

Claude Sonnet 4.6

claude
66.2 #7 / 18
任务表达首页并列

Qwen Max

qwen
65.4 #8 / 18
任务表达首页并列、可用性首页并列

Claude Opus 4.6

claude
62.8 #9 / 18
任务表达首页并列、可用性首页并列

GPT-4o

gpt
57.2 #10 / 18
任务表达首页并列

GPT-o3

gpt
51.5 #11 / 18
任务表达首页并列

Claude Opus 4.7

claude
暂无数据
将在下次完整评测中反映

GPT-5.5

gpt
暂无数据
将在下次完整评测中反映

Grok 4

grok
暂无数据
将在下次完整评测中反映

Gemini 3.1 Pro

gemini
暂无数据
将在下次完整评测中反映

DeepSeek V4 Pro

DeepSeek
暂无数据
将在下次完整评测中反映

Qwen3 Max

qwen
暂无数据
将在下次完整评测中反映

文心一言 4.5

ernie
暂无数据
将在下次完整评测中反映