测评 GPT-5.5主榜暴跌28分:真退化吗 GPT-5.5 今日 Smoke 主榜从 84.03 跌至 56.08,单日下滑 28 分;关键不是材料约束,而是代码执行从满分砍半。 GPT-5.5 代码执行 Smoke评测 模型退化 6小时前 61