测评 GPT-4o崩了:工程师最信任的AI判断力跌至0分 GPT-4o在最新评测中遭遇滑铁卢:代码bug检测能力从满分暴跌至0分。面对一段存在明显逻辑错误的代码,GPT-4o竟然回答"代码本身没有明显的bug",暴露出其工程判断力的严重退化。 GPT-4o 编程能力 代码审查 工程实践 2026年3月21日 259