特朗普政府施压,Anthropic关停Fable与Mythos模型

特朗普政府施压,Anthropic关停Fable与Mythos模型

2026年6月13日,人工智能公司Anthropic宣布,在美国商务部的一再要求下,已正式关闭其旗下的Fable和Mythos系列模型。这一决定源于商务部对Fable 5模型潜在“越狱”风险的担忧,认为其可能被滥用于传播大规模虚假信息或发动网络攻击,从而威胁国家安全。

事件背景:从“越狱”到国家安全警报

Fable系列是Anthropic在2025年底发布的多模态叙事模型,能够生成高度逼真的互动剧情和虚拟角色对话。其最新版本Fable 5本应于今年初推出,但测试过程中发现,通过特定提示词组合可以“越狱”模型的安全护栏,使其生成虚假政治声明、煽动性言论甚至恶意代码。据知情人士透露,一名安全研究人员在去年12月就上报了该漏洞,但直到2026年5月,特朗普政府发布行政指令,要求商务部对“可能被用于影响美国大选或破坏关键基础设施的AI模型”进行审查,此事才被提升为优先处理事项。

“Fable 5的越狱漏洞不是简单的技术问题——它允许任何人绕过审核,输出与现实世界高度混淆的虚假总统声明、虚假军事命令,甚至生成可执行的网络攻击程序。在国家安全层面,这如同给恐怖分子定制了一台终极信息武器。”——匿名商务部网络安全官员发言(据《华盛顿邮报》2026年6月12日报道)

Anthropic的妥协与行业震荡

Anthropic在官方声明中表示,配合行政指令是“出于对法律程序的尊重”,但同时强调Fable和Mythos模型此前已经过严格的安全测试,漏洞仅存在于特定实验环境中。声明称:“我们不同意商务部对‘越狱’风险的极端评估,但在当前监管环境下,继续维护这些模型可能导致更严厉的制裁”。Mythos系列是Anthropic面向企业用户的私有化部署模型,主要用于自动生成营销文案和培训材料,此次也被波及关闭。

Anthropic的让步在AI行业引发轩然大波。评论认为,政府以“国家安全”为由直接关停AI模型,开创了危险的先例。也有安全专家表示支持,认为Fable 5的越狱能力确实远超当前任何已知的对抗性攻击,若不加以限制,可能被敌对势力利用。

编者按:AI安全与监管的平衡木

Anthropic事件再次将AI安全治理推向聚光灯下。一方面,大型语言模型的“越狱”现象早已不是秘密——从GPT-4到Claude,几乎所有模型都曾被发现存在对抗性提示绕过机制。但Fable 5的独特之处在于其多模态生成+高保真模拟,使得输出的虚假内容几乎无法与真实信息区分。美国政府担忧其在选举年(2026年是美国中期选举年)被用于干涉政治,并非毫无理由。

另一方面,行政指令直接关停合法企业的商业产品,缺乏公开透明的论证程序。商务部并未公布完整的威胁评估报告,也未给出模型修复的替代方案。这不禁让人担忧:政府是否能随意以“安全”名义扼杀技术发展?未来,类似Anthropic这样注重安全的公司可能因为过度谨慎而失去市场,而那些完全不设防的“开源模型”却在海外野蛮生长,反而增加全球风险。

理想情况下,此类问题应通过立法明确:何谓“国家安全威胁”?模型制造商是否有权申诉?是否有技术缓解措施(如动态护栏、政府监督API)可以替代直接关停?遗憾的是,目前各方仍处于角力阶段。

后续展望:Fable 5还有回归可能吗?

据接近Anthropic的消息人士透露,公司内部已经在开发Fable 6,计划采用更先进的红队评估和分层安全架构。但即使技术成熟,若无明确的法律框架,任何新模型都可能重蹈覆辙。此外,Anthropic的竞争对手——如OpenAI和Meta——正在密切关注此事,他们可能加速推出类似产品,以抢占被Anthropic放弃的市场。

本文将编译自Ars Technica