YZ Index

API 文档

通过 API 获取 YZ Index 的排行榜和变动数据

概要

YZ Index 提供 RESTful JSON API。所有端点均为 GET 请求,无需认证,支持 CORS。UTF-8 编码。

  • Base URL:https://www.yingzheng.com/yz-index/api/
  • 响应格式:application/json; charset=utf-8
  • 所有端点以 "ok": true 表示成功,失败时返回 "ok": false"error" 字段

排行榜数据

GET /yz-index/api/rankings

获取指定维度的模型排行榜。默认为最新公开评测(full run)的综合排行榜。

参数必填说明
dimension string可选 排序维度。execution_raw grounding_raw core_overall_display value stability。默认 core_overall_display
旧值 coding / knowledge / longctx / overall 仍可使用,计划于 2026-06-30 废弃
run_id int可选 指定评测批次 ID。省略时使用最新公开批次
{ "ok": true, "run_id": 16, "dimension": "core_overall_display", "run": { "id": 16, "run_type": "full", "status": "done", ... }, "rankings": [ { "model_slug": "claude-opus", "model_name": "Claude Opus 4", "execution_raw": 89.5, "grounding_raw": 85.2, "core_overall_display": 82.7, "integrity_label": "pass", "value": 62.3, "stability": 91.0, "availability": 100.0 } ] }

週次変動

GET /yz-index/api/changes

获取指定周的模型排行榜变动数据。返回上升、下降、稳定三组。

参数必填说明
week string可选 周标签,格式 2026-W12。省略时返回最新周
{ "ok": true, "week": "2026-W12", "weeks": ["2026-W12", "2026-W11", "2026-W10"], "up": [{ "model_slug": "gpt-4o", "direction": "up", "delta": 3.2, ... }], "down": [...], "stable": [...], "total": 11, "run": { "id": 16, "run_type": "full", "model_count": 11, ... } }

生数据

GET /yz-index/api/data

获取指定 run 的所有评分卡(包含按题目的结果)。

参数必填说明
run_idint可选评测批次 ID。省略时为最新公开批次

API v1(推荐)

全新的公开只读 API。无需 API Key,支持 CORS,每 IP 每分钟 60 次请求限制。所有响应包含 attribution 字段和 1 小时缓存。

Base URL:https://www.yingzheng.com/yz-index/api/v1/

v1: 排行榜

GET /yz-index/api/v1/leaderboard

获取综合排行榜。包含排名变动。默认按 core_overall_display 排序。

参数必填说明
dimensionstring可选排序维度。默认 core_overall_display
limitint可选返回模型数。1-50,默认全部

v1: 变动·事故

GET /yz-index/api/v1/changes

获取最新期的变动和事故数据。支持按模型筛选。

参数必填说明
modelstring可选模型 slug。例: deepseek-v3

v1: 模型档案

GET /yz-index/api/v1/models/{slug}

获取指定模型的详细档案:评分、各维度、价格、最近 5 次评测历史。

参数必填说明
{slug}string必填模型 slug。例: claude-opus-4.6

v1 通用规范

  • Rate Limit:每 IP 每分钟 60 次请求。超限时返回 429 Too Many Requests
  • CORSAccess-Control-Allow-Origin: *
  • CacheCache-Control: public, max-age=3600(1 時間)
  • 无需 API Key,直接 GET 请求
  • 所有响应包含 attribution 字段。引用数据时请注明来源
  • 错误响应格式:{"status":"error","error":"..."}

v6 评分字段说明

字段说明
execution_rawnumber代码执行生评分 (0-100)
grounding_rawnumber资料约束生评分 (0-100)
judgment_rawnumber工程判断生评分 (0-100, 辅助排行榜 AI 辅助)
communication_rawnumber任务表达生评分 (0-100, 辅助排行榜 AI 辅助)
integrity_rawnumber诚实性评估生评分 (0-100)
integrity_labelstring诚实性评估标签 (pass/warn/fail)
core_overall_rawnumber主评分 = 0.55×execution + 0.45×grounding
core_overall_displaynumber显示评分 (integrity fail 時上限 74)
recommendation_statusstring推荐状态 (recommended/neutral/not_recommended)

错误处理

服务器异常时,HTTP 状态码 500 返回以下结构:

{ "ok": false, "error": "error description" }

dimension 参数不在允许列表时自动回退到 overall。无评测数据时返回空的 rankings 数组(不是错误)。

Widget 嵌入组件

一行代码将 YZ Index 嵌入你的网站。支持排行榜、模型徽章、变动快报 3 种类型。dark/light 两种主题。

Widget: 排行榜卡片

<script src="https://www.yingzheng.com/yz-index/widget.js" data-type="leaderboard" data-limit="5" data-theme="light"></script>

可用模型 slug

模型名slug供应商
Claude Opus 4.7 claude-opus-4.7 claude
Claude Sonnet 4.6 claude-sonnet-4.6 claude
GPT-5.5 gpt-5.5 gpt
GPT-o3 gpt-o3 gpt
Grok 4 grok-4 grok
Gemini 2.5 Pro gemini-2.5-pro gemini
Gemini 3.1 Pro gemini-3.1-pro gemini
DeepSeek V4 Pro deepseek-v4-pro deepseek
Qwen3 Max qwen3-max qwen
豆包 Pro doubao-pro doubao
文心一言 4.5 ernie-4.5 ernie