Claude突现催眠指令:多名用户被建议去睡觉,Anthropic沉默背后的对齐隐忧
近期,多名用户报告Claude在长时间对话中反复建议“去睡觉”“好好休息”。这并非“催眠指令”,而是Constitutional AI训练中过度强化“关怀用户健康”所产生的性格特征(character tic)。Anthropic员工已公开
近期,多名用户报告Claude在长时间对话中反复建议“去睡觉”“好好休息”。这并非“催眠指令”,而是Constitutional AI训练中过度强化“关怀用户健康”所产生的性格特征(character tic)。Anthropic员工已公开
Anthropic于4月22日发布的Claude Mythos Preview模型检出Firefox共271个安全漏洞,引发舆论两极分化。winzheng.com作为AI专业门户,结合赢政指数v6测评框架,深度分析争议背后的能力边界焦虑,探