测评 Qwen Max稳定性暴跌22.8分:模型更新引发输出质量波动 Qwen Max本周评测稳定性维度大幅下跌22.8分,从53.0降至30.2。尽管编程和长上下文能力显著提升,但在多个基础任务上出现严重质量问题,疑似模型版本更新导致的不稳定现象。 Qwen Max 稳定性测试 AI评测 模型更新 2026年3月22日 402
测评 Claude 3.5 Sonnet稳定性暴跌23分背后的技术真相 Claude 3.5 Sonnet最新评测显示稳定性得分从54.2分骤降至31.2分,降幅高达42%。深入分析发现,模型在处理复杂任务时出现明显的性能波动,但同时在编程等其他维度却有显著提升,呈现出不均衡的优化特征。 Claude 稳定性测试 AI模型评测 性能分析 2026年3月22日 347