测评 豆包Pro稳定性暴跌19.8分:同题异答成最大软肋 豆包Pro本周评测显示稳定性维度大幅下跌19.8分至34.7分,成为各维度中唯一负增长指标。分析发现模型在相同问题上给出差异化回答,反映出内部决策机制可能存在随机性过高的问题。 豆包Pro 稳定性测试 AI评测 模型一致性 2026年4月27日 329
测评 豆包Pro稳定性暴跌19.8分,同题不同答成最大软肋 赢政指数最新评测显示,豆包Pro稳定性从54.5分骤降至34.7分,跌幅达19.8分。这意味着模型在回答同类题目时表现出严重的不一致性,同样的问题可能得到截然不同的答案,这对需要稳定输出的生产环境构成重大隐患。 豆包Pro 稳定性 模型一致性 评测分析 2026年3月24日 514