测评 GPT-o3性能断崖式下跌:知识工作能力暴跌12.1分背后的技术隐患 本周GPT-o3在知识工作维度出现严重性能退化,得分从82.4分骤降至70.3分,降幅达12.1分。这一异常表现集中体现在逻辑推理和语言理解两个核心能力上,引发了对模型稳定性的深度担忧。 逻辑推理能力严重退化 最典型的案例是"排 GPT-o3 性能断崖式下跌 AI评测 赢政指数 2026年3月20日 329