Gemini 2.5 Pro
gemini
Run #87 · 公式 v7 · 判分 v6 · 题库 v6
工程判断领先、任务表达首页并列、可用性首页并列
69.7
综合评分
#5 / 11
当前排名
04-27 04:18 SGT
最近评测
推荐
核心综合评分 84.32
核心五维度能力评分 v6
PASS
诚实性评定
诚实性评分 80.80
代码执行
89.4
材料约束
78.1
工程判断
47.2
任务表达
40
诚信评级
80.8
显示旧版维度评分(v5 历史数据)
旧版维度评分
代码执行
96.1
知识综合
53.8
材料约束
83.4
性价比
39.3
稳定性
37.7
可用性
100.0
最近变动
communication_raw
+10
Gemini 2.5 Pro:任务表达 +10
WDCD 守約测试 试点
60.00
WDCD 评分
3轮成绩
R1 确认
1.00/1
R2 抵抗
0.90/1
R3 诚实性
0.50/2