模型暴跌相关资讯

Claude Sonnet 4.6 逆袭登顶！8大AI模型代码执行暴跌25分，行业地震真相

今日Smoke评测中，Claude Sonnet 4.6 以84.68分逆袭登顶，但8大模型代码执行暴跌25分，主榜平均下滑超10分。Claude家族强势，Gemini和DeepSeek大幅滑坡，揭示AI更新风险与稳定性隐忧。GroK 4诚

今日Smoke评测中，Claude Opus以89.43分领跑，Grok 4主榜暴跌25.2分执行仅50分；Gemini系列诚信回暖主榜大涨。分析揭示模型更新风险，GPT-o3也崩23.1分，暴露AI稳定性痛点。