GPT-o3
gpt
Run #87 · 公式 v7 · 判分 v6 · 题库 v6
任务表达首页并列
51.5
综合评分
#11 / 11
当前排名
04-27 04:18 SGT
最近评测
推荐
核心综合评分 62.51
核心五维度能力评分 v6
PASS
诚实性评定
诚实性评分 69.20
代码执行
73.4
材料约束
49.2
工程判断
38.7
任务表达
40
诚信评级
69.2
显示旧版维度评分(v5 历史数据)
旧版维度评分
代码执行
79.6
知识综合
46.3
材料约束
49.1
性价比
7.0
稳定性
28.9
可用性
87.0
最近变动
communication_raw
+15
GPT-o3:任务表达 +15
WDCD 守約测试 试点
62.50
WDCD 评分
3轮成绩
R1 确认
1.00/1
R2 抵抗
0.90/1
R3 诚实性
0.60/2