AI守约测试相关资讯

我们测试11款AI模型30道守约题，发现诚信率暴跌至55%！

赢政天下（winzheng.com）对11款主流AI模型进行30道守约测试，结果显示平均诚信率仅60%，R3阶段大幅下降。Qwen3-Max以66.67分领跑，揭示数据边界和安全合规是最脆弱环节，呼吁行业加强约束机制。

赢政指数WDCD首轮测试揭晓：Qwen3-Max以66.67分领跑，Claude系列紧随其后。分析聚焦压力下模型妥协与R3诚信轮衰减规律，揭示AI守约能力的真实边界。