测评 11模型换代战:第一稳住,Grok垫底 2026-W20 评测显示:Claude Sonnet 4.6 以 83.54 守住第一,豆包 Pro 仅差 0.91 分;Grok 4 仅 49.20,断层垫底。 Claude Sonnet 4.6 Grok 4 主榜排名 模型评测 5小时前 42