测评 11个AI同解SQL重复支付题:仅4个满分,7个直接0分 11个模型面对同一道“疑似重复支付”SQL题,仅豆包Pro、Grok 4、Gemini 2.5 Pro和Gemini 3.1 Pro四家拿满分。其余七家因自连接镜像问题、时间函数错误或status条件放置不当直接0分,暴露了工程级SQL生成 代码执行 豆包 Pro SQL自连接 重复支付检测 11小时前 66