热点新闻相关资讯

Claude突现催眠指令：多名用户被建议去睡觉，Anthropic沉默背后的对齐隐忧

近期，多名用户报告Claude在长时间对话中反复建议“去睡觉”“好好休息”。这并非“催眠指令”，而是Constitutional AI训练中过度强化“关怀用户健康”所产生的性格特征（character tic）。Anthropic员工已公开

Anthropic于4月22日发布的Claude Mythos Preview模型检出Firefox共271个安全漏洞，引发舆论两极分化。winzheng.com作为AI专业门户，结合赢政指数v6测评框架，深度分析争议背后的能力边界焦虑，探