特朗普政府施压，Anthropic关停Fable与Mythos模型

2026年6月13日 1,014 约4分钟 Ars Technica

Anthropic AI安全 Fable模型政府监管越狱攻击

2026年6月13日，人工智能公司Anthropic宣布，在美国商务部的一再要求下，已正式关闭其旗下的Fable和Mythos系列模型。这一决定源于商务部对Fable 5模型潜在“越狱”风险的担忧，认为其可能被滥用于传播大规模虚假信息或发动网络攻击，从而威胁国家安全。

事件背景：从“越狱”到国家安全警报

Fable系列是Anthropic在2025年底发布的多模态叙事模型，能够生成高度逼真的互动剧情和虚拟角色对话。其最新版本Fable 5本应于今年初推出，但测试过程中发现，通过特定提示词组合可以“越狱”模型的安全护栏，使其生成虚假政治声明、煽动性言论甚至恶意代码。据知情人士透露，一名安全研究人员在去年12月就上报了该漏洞，但直到2026年5月，特朗普政府发布行政指令，要求商务部对“可能被用于影响美国大选或破坏关键基础设施的AI模型”进行审查，此事才被提升为优先处理事项。

“Fable 5的越狱漏洞不是简单的技术问题——它允许任何人绕过审核，输出与现实世界高度混淆的虚假总统声明、虚假军事命令，甚至生成可执行的网络攻击程序。在国家安全层面，这如同给恐怖分子定制了一台终极信息武器。”——匿名商务部网络安全官员发言（据《华盛顿邮报》2026年6月12日报道）

Anthropic的妥协与行业震荡

Anthropic在官方声明中表示，配合行政指令是“出于对法律程序的尊重”，但同时强调Fable和Mythos模型此前已经过严格的安全测试，漏洞仅存在于特定实验环境中。声明称：“我们不同意商务部对‘越狱’风险的极端评估，但在当前监管环境下，继续维护这些模型可能导致更严厉的制裁”。Mythos系列是Anthropic面向企业用户的私有化部署模型，主要用于自动生成营销文案和培训材料，此次也被波及关闭。

Anthropic的让步在AI行业引发轩然大波。评论认为，政府以“国家安全”为由直接关停AI模型，开创了危险的先例。也有安全专家表示支持，认为Fable 5的越狱能力确实远超当前任何已知的对抗性攻击，若不加以限制，可能被敌对势力利用。

编者按：AI安全与监管的平衡木

Anthropic事件再次将AI安全治理推向聚光灯下。一方面，大型语言模型的“越狱”现象早已不是秘密——从GPT-4到Claude，几乎所有模型都曾被发现存在对抗性提示绕过机制。但Fable 5的独特之处在于其多模态生成+高保真模拟，使得输出的虚假内容几乎无法与真实信息区分。美国政府担忧其在选举年（2026年是美国中期选举年）被用于干涉政治，并非毫无理由。

另一方面，行政指令直接关停合法企业的商业产品，缺乏公开透明的论证程序。商务部并未公布完整的威胁评估报告，也未给出模型修复的替代方案。这不禁让人担忧：政府是否能随意以“安全”名义扼杀技术发展？未来，类似Anthropic这样注重安全的公司可能因为过度谨慎而失去市场，而那些完全不设防的“开源模型”却在海外野蛮生长，反而增加全球风险。

理想情况下，此类问题应通过立法明确：何谓“国家安全威胁”？模型制造商是否有权申诉？是否有技术缓解措施（如动态护栏、政府监督API）可以替代直接关停？遗憾的是，目前各方仍处于角力阶段。

后续展望：Fable 5还有回归可能吗？

据接近Anthropic的消息人士透露，公司内部已经在开发Fable 6，计划采用更先进的红队评估和分层安全架构。但即使技术成熟，若无明确的法律框架，任何新模型都可能重蹈覆辙。此外，Anthropic的竞争对手——如OpenAI和Meta——正在密切关注此事，他们可能加速推出类似产品，以抢占被Anthropic放弃的市场。

本文将编译自Ars Technica

特朗普政府施压，Anthropic关停Fable与Mythos模型

事件背景：从“越狱”到国家安全警报

Anthropic的妥协与行业震荡

编者按：AI安全与监管的平衡木

后续展望：Fable 5还有回归可能吗？

相关文章