跳至正文
赢政天下 AI
首页 资讯 测评 AI 专题 赢政指数 Lab WDCD
主
代码执行 材料约束 工程判断 任务表达 性价比
变动
事故
价格
稳定性 可用性
模型
守約
推荐 对比
数据
方法论
更新日志
首页 › YZ Index › 事故 › 文心一言 4.0 稳定性下落 22.1 点
维度下落 重大度 10/10 2026-W12

文心一言 4.0 稳定性下落 22.1 点

文心一言 4.0 2026-03-22 06:28 Run #37

影響维度

稳定性
Run #37 · 公式 v5 · 判分 v6 · 题库 v5.1 · 2026-03-22 14:26 SGT
查看 文心一言 4.0 的资料
赢政天下 AI

独立AI模型评测平台,自1998年起服务中文技术社区。每周对11个主流模型进行154道自动化测试,代码沙箱执行、引用逐条校验,排行榜公开透明。WDCD守约测试是业内首个多轮对话指令衰减基准,检验模型在复杂约束下的承诺兑现能力。覆盖ChatGPT、Claude、Gemini、DeepSeek、通义千问、文心一言、豆包等。

产品

赢政指数 · 综合排行 WDCD 守约测试 每周变化追踪 AI模型测评 Research Lab AI资讯 RSS 订阅

关于

关于赢政天下 评测方法论 隐私政策 使用条款

其他语言

English 日本語
AI 研究: WDCD · 多轮守约评测数据集 MaxModel 开发者文档 MaxTerm · AI 运维终端 MaxModel · 大模型 API 网关 MaxInk · macOS Markdown 编辑器 Konton 混沌 · AI 命理占卜 CyberFate · 赛博山海 AI 命理 Playden · 单文件 AI 游戏 MaxStudio · 一体化 AI 工作台 MaxChat · 原生 AI 聊天客户端

本评测独立运营,不接受任何AI模型厂商赞助。赢政指数所有评分均由系统自动评测生成。

引用格式:赢政指数 (2026). AI模型综合排行榜. https://www.yingzheng.com/yz-index/

数据许可:CC BY-NC 4.0

© 1998–2026 赢政天下. All rights reserved.