YZ Index

AI模型档案

查看各模型的详细评分、五维度能力评测、历史变动

豆包 Pro

工程判断首页并列、任务表达首页并列

DeepSeek V4 Pro

任务表达首页并列

Qwen3 Max

可用性首页并列

Claude Sonnet 4.6

工程判断首页并列、可用性首页并列

GPT-5.5

可用性首页并列

Claude Opus 4.7

综合首页、代码执行领先、材料约束领先

Grok 4

可用性首页并列

GPT-o3

文心一言 4.5

性价比最优

Gemini 2.5 Pro

Gemini 3.1 Pro

可用性首页并列