测评 11个AI同解连续登录SQL题:8个满分3个直接崩盘 在同一道“找出用户最长连续登录天数”的SQL题上,11个主流模型中8个拿下100分,3个直接0分。Qwen3 Max、Grok 4和GPT-5.5因语法错误或语句不完整彻底失败,暴露了当前顶级模型在日期分组逻辑上的显著不稳定。 代码执行 材料约束 SQL连续登录 差距分析 8小时前 56