赢政天下(Winzheng)
1998年,赢政天下以软件技术论坛起步。28年来,150万注册用户、50万软件发布、跨越世代的信任。
2025年,我们决定:把同样的较真精神,投入到AI模型评测中。
不是写几篇测评文章了事。而是搭建自动化系统,每周跑212道题、11个模型。代码实际执行,引用逐一校验,分数取5次均值。结果原样公开。
产品
为什么值得信任
代码执行验证
不是看起来能写就算对。放进沙箱跑,跑不过就是零分。
引用校验
长文题不光看答案像不像,还检查引用对不对。
统计学排行
不看一次成绩,看连续表现。移动均值排行,不被一次运气左右。
完全独立
没有联合评测,没有事先沟通,没有给面子。结果原样发布。
联系我们
商务与一般联络:info@winzheng.com
引用规范:引用赢政指数数据或研究报告时,请注明「来源:赢政天下(winzheng.com)」并附原文链接。