YZ Index

YZ指数 · 任务表达排行榜

摘要、翻译、改写、FAQ生成、事故报告 — 规则精确判分（json_schema_exact），确定性可复验。

分维度榜：规则精确判分 — 此排行榜的维度全部由确定性规则（json_schema_exact 精确比对、沙箱执行等）判分，零 AI 裁判，与主榜同口径。

Run #180 · 公式 v7 · 判分 v6.3 · 题库 v7

基于完整评测（从154道题库中随机抽取100道） · 最新评测：2026-06-15 09:25 SGT · 模型：11个