海外 Anthropic称这些话题太危险,Fable 5模型拒绝回应 Anthropic最新前沿模型Fable 5被设计为自动拒绝涉及网络安全、生物工程和化学武器等高风险领域的用户查询。这一安全机制并非基于内容过滤,而是模型在训练阶段即内嵌了“硬性拒绝”规则,即便用户通过提示注入等手段试图绕过,模型也会直接终 AI安全 模型对齐 Anthropic 前沿模型 10小时前 90