Anthropic新安全措施讨好特朗普政府,Fable 5和Mythos 5解禁

Anthropic新安全措施讨好特朗普政府,Fable 5和Mythos 5解禁

据WIRED报道,美国政府近日取消了对Anthropic旗下Fable 5和Mythos 5两款AI模型的限制,但这一“松绑”并非没有代价。Anthropic为重新获得特朗普政府的信任,主动添加了一项新的安全措施,双方达成了一种微妙的平衡。

事件背景:从限制到解禁

此前,特朗普政府以潜在国家安全风险为由,对Anthropic的高性能模型实施了严格限制。Fable 5和Mythos 5因其强大的生成能力和潜在滥用风险,被列入出口管制和部署禁令清单。然而,随着Anthropic承诺引入更严格的安全机制,政府最终同意移除限制。但消息人士透露,这一决定附带多项隐性条件,包括定期接受第三方审计和公开模型行为报告。

新安全措施到底是什么?

Anthropic此次新增的“安全措施”被描述为一种多层级对齐系统,能够在模型输出前进行实时检测和阻断。该系统不仅覆盖有害内容过滤,还引入了基于宪法AI原则的决策树,确保模型在敏感话题上保持中立且合规。Anthropic CEO在内部信中强调,这是“主动拥抱监管”的体现,而非被动妥协。

编者按:Anthropic的举动并非孤例。在AI治理日趋严格的背景下,头部公司纷纷通过“安全承诺”换取政策绿灯。这场博弈背后,是技术自由与国家安全之间的永恒张力。特朗普政府曾多次批评AI企业“缺乏足够安全边际”,而Anthropic的选择或将为行业树立一种新范式:用可验证的透明机制来化解行政阻力。

行业影响与争议

部分安全专家对此表示谨慎乐观,认为政府与企业的良性互动有助于标准化安全协议。但也有批评者指出,政治压力可能导致模型能力被“阉割”,损害创新前景。例如,Fable 5原本在代码生成和生物医学推理上表现优异,而新安全措施可能显著削减其多语言理解能力。

值得注意的是,Anthropic并未公开新措施的完整技术细节,仅承诺在未来三个月内发布白皮书。这种“先承诺、后公示”的策略,既争取了时间窗口,也为后续调整留有余地。

目前,Fable 5和Mythos 5已重新向部分研究机构开放API,但商业用户仍需通过额外审批。特朗普政府官员表示,将继续监控模型使用情况,若发现违规将“立即恢复限制”。

本文编译自WIRED。