测评 GPT-o3崩了:不是性能波动,背后的架构级的系统性崩塌 GPT-o3本周稳定性暴跌25分,可用性从100%跌至69%,长上下文能力崩塌33.5分。深度分析显示,这不是简单的性能波动,而是暴露了其架构设计的根本性缺陷。当AI遇到真实工程场景,华丽的benchmark分数瞬间现形。 GPT-o3 稳定性测试 模型架构 性能退化 2026年3月22日 423