YZ Index
API 文档
通过 API 获取 YZ Index 的排行榜和变动数据
概要
YZ Index 提供 RESTful JSON API。所有端点均为 GET 请求,无需认证,支持 CORS。UTF-8 编码。
- Base URL:https://www.yingzheng.com/yz-index/api/
- 响应格式:application/json; charset=utf-8
- 所有端点以 "ok": true 表示成功,失败时返回 "ok": false 和 "error" 字段
排行榜数据
GET /yz-index/api/rankings
获取指定维度的模型排行榜。默认为最新公开评测(full run)的综合排行榜。
请求参数
| 参数 | 型 | 必填 | 说明 |
|---|---|---|---|
| dimension | string | 可选 | 排序维度。execution_raw grounding_raw core_overall_display value stability。默认 core_overall_display。 旧值 coding / knowledge / longctx / overall 仍可使用,计划于 2026-06-30 废弃 |
| run_id | int | 可选 | 指定评测批次 ID。省略时使用最新公开批次 |
响应示例
{
"ok": true,
"run_id": 16,
"dimension": "core_overall_display",
"run": { "id": 16, "run_type": "full", "status": "done", ... },
"rankings": [
{
"model_slug": "claude-opus",
"model_name": "Claude Opus 4",
"execution_raw": 89.5,
"grounding_raw": 85.2,
"core_overall_display": 82.7,
"integrity_label": "pass",
"value": 62.3,
"stability": 91.0,
"availability": 100.0
}
]
}
週次変動
GET /yz-index/api/changes
获取指定周的模型排行榜变动数据。返回上升、下降、稳定三组。
请求参数
| 参数 | 型 | 必填 | 说明 |
|---|---|---|---|
| week | string | 可选 | 周标签,格式 2026-W12。省略时返回最新周 |
响应示例
{
"ok": true,
"week": "2026-W12",
"weeks": ["2026-W12", "2026-W11", "2026-W10"],
"up": [{ "model_slug": "gpt-4o", "direction": "up", "delta": 3.2, ... }],
"down": [...],
"stable": [...],
"total": 11,
"run": { "id": 16, "run_type": "full", "model_count": 11, ... }
}
生数据
GET /yz-index/api/data
获取指定 run 的所有评分卡(包含按题目的结果)。
| 参数 | 型 | 必填 | 说明 |
|---|---|---|---|
| run_id | int | 可选 | 评测批次 ID。省略时为最新公开批次 |
API v1(推荐)
全新的公开只读 API。无需 API Key,支持 CORS,每 IP 每分钟 60 次请求限制。所有响应包含 attribution 字段和 1 小时缓存。
Base URL:https://www.yingzheng.com/yz-index/api/v1/
v1: 排行榜
GET /yz-index/api/v1/leaderboard
获取综合排行榜。包含排名变动。默认按 core_overall_display 排序。
| 参数 | 型 | 必填 | 说明 |
|---|---|---|---|
| dimension | string | 可选 | 排序维度。默认 core_overall_display |
| limit | int | 可选 | 返回模型数。1-50,默认全部 |
v1: 变动·事故
GET /yz-index/api/v1/changes
获取最新期的变动和事故数据。支持按模型筛选。
| 参数 | 型 | 必填 | 说明 |
|---|---|---|---|
| model | string | 可选 | 模型 slug。例: deepseek-v3 |
v1: 模型档案
GET /yz-index/api/v1/models/{slug}
获取指定模型的详细档案:评分、各维度、价格、最近 5 次评测历史。
| 参数 | 型 | 必填 | 说明 |
|---|---|---|---|
| {slug} | string | 必填 | 模型 slug。例: claude-opus-4.6 |
v1 通用规范
- Rate Limit:每 IP 每分钟 60 次请求。超限时返回 429 Too Many Requests
- CORS:Access-Control-Allow-Origin: *
- Cache:Cache-Control: public, max-age=3600(1 時間)
- 无需 API Key,直接 GET 请求
- 所有响应包含 attribution 字段。引用数据时请注明来源
- 错误响应格式:{"status":"error","error":"..."}
v6 评分字段说明
| 字段 | 型 | 说明 |
|---|---|---|
| execution_raw | number | 代码执行生评分 (0-100) |
| grounding_raw | number | 资料约束生评分 (0-100) |
| judgment_raw | number | 工程判断生评分 (0-100, 辅助排行榜 AI 辅助) |
| communication_raw | number | 任务表达生评分 (0-100, 辅助排行榜 AI 辅助) |
| integrity_raw | number | 诚实性评估生评分 (0-100) |
| integrity_label | string | 诚实性评估标签 (pass/warn/fail) |
| core_overall_raw | number | 主评分 = 0.55×execution + 0.45×grounding |
| core_overall_display | number | 显示评分 (integrity fail 時上限 74) |
| recommendation_status | string | 推荐状态 (recommended/neutral/not_recommended) |
错误处理
服务器异常时,HTTP 状态码 500 返回以下结构:
{
"ok": false,
"error": "error description"
}
dimension 参数不在允许列表时自动回退到 overall。无评测数据时返回空的 rankings 数组(不是错误)。
Widget 嵌入组件
一行代码将 YZ Index 嵌入你的网站。支持排行榜、模型徽章、变动快报 3 种类型。dark/light 两种主题。
Widget: 排行榜卡片
<script src="https://www.yingzheng.com/yz-index/widget.js"
data-type="leaderboard"
data-limit="5"
data-theme="light"></script>
可用模型 slug
| 模型名 | slug | 供应商 |
|---|---|---|
| Claude Opus 4.7 | claude-opus-4.7 | claude |
| Claude Sonnet 4.6 | claude-sonnet-4.6 | claude |
| GPT-5.5 | gpt-5.5 | gpt |
| GPT-o3 | gpt-o3 | gpt |
| Grok 4 | grok-4 | grok |
| Gemini 2.5 Pro | gemini-2.5-pro | gemini |
| Gemini 3.1 Pro | gemini-3.1-pro | gemini |
| DeepSeek V4 Pro | deepseek-v4-pro | deepseek |
| Qwen3 Max | qwen3-max | qwen |
| 豆包 Pro | doubao-pro | doubao |
| 文心一言 4.5 | ernie-4.5 | ernie |