白宫与Anthropic：Claude Fable 5风险争议未解

2026年6月16日 51 约4分钟 WIRED

AI安全 AI监管 Anthropic Claude Fable 5 白宫

当地时间周一，人工智能初创公司Anthropic的高层团队紧急飞往华盛顿，与白宫官员举行了一场闭门会议。据知情人士透露，双方在长达数小时的会谈中，围绕Anthropic最新模型——Claude Fable 5——潜在的安全风险展开了激烈的辩论。然而，会议结束后，双方依然未能达成共识，分歧依旧显著。

会议背景：Claude Fable 5引发关注

作为OpenAI前员工创立的公司，Anthropic一直以“负责任AI”为核心理念，其开发的Claude系列模型以安全性著称。但最新版本的Claude Fable 5被认为能力大幅跃升，尤其在推理、创意生成和长文本理解方面实现了突破。然而，这种进步也引发了监管层的高度警觉。白宫科技政策办公室（OSTP）此前曾私下表示，Claude Fable 5可能具备某些“双用技术”特征——即在科学研究中可能发挥巨大作用，但也可能被用于制造误导性信息或自动化网络攻击。

“我们理解政府的担忧，但我们相信Claude Fable 5的安全设计已经达到了行业最高标准。”——Anthropic发言人会后声明

白宫方面的关切则更为具体。据WIRED独家获得的消息，国家安全委员会（NSC）的专家团队曾对Claude Fable 5进行非正式评估，认为其自主决策能力可能在某些边缘情况下超出控制范围。一位不愿具名的白宫官员表示：“这不是一个简单的技术问题，它关系到国家安全的底线。”

分歧核心：风险评估方法论之争

双方争议的焦点在于风险评估的方法论。Anthropic主张采用其自创的“按需安全层”（Safety-by-Demand）框架，认为通过在模型部署后动态调整行为约束，能够有效管理风险。但白宫方面认为，这种事后调控模式存在滞后性，一旦模型被广泛分发，漏洞将难以修补。白宫倾向于要求Anthropic在发布前进行更严格的“红队测试”，并公开测试结果。

值得注意的是，这并非Anthropic首次与政府发生摩擦。2024年，该公司曾因拒绝向美国国防部提供Claude模型的军事用途授权而引发轩然大波。此次华盛顿之行，某种程度上也是Anthropic试图修复与联邦政府关系的一次努力，但会谈结果显然未能如愿。

行业背景：AI监管的全球性困局

此次会谈的背景是AI治理在全球范围内的白热化竞争。欧盟早已通过《人工智能法案》建立分级监管体系，而美国则仍停留在行业自律与行政命令并行的阶段。白宫2023年10月发布的首个AI行政令，要求联邦机构评估AI系统的潜在风险，但其执行力一直受到质疑。Anthropic与白宫的分歧，本质上折射出一个更深层的问题：当企业将“安全”作为核心卖点时，政府是否应该信任企业的自我监管能力？

编者也注意到，Anthropic的创始人Dario Amodei和Daniela Amodei曾在多个场合呼吁建立独立的AI审计机构，但该公司在面临具体监管要求时，却表现出强烈的抵抗情绪。这种矛盾心理几乎出现在所有领先AI公司身上——他们希望政府监管竞争对手，却不愿自己被束缚。Claude Fable 5的争议正是这种心态的典型体现。

未来展望：博弈或持续升级

会谈结束后，Anthropic发表了一份简短声明，表示“将继续与白宫保持建设性对话”。但白宫方面则暗示，如果无法达成一致，可能援引《国防生产法》对Claude Fable 5的部署实施临时限制。这意味着围绕这一模型的争议远未结束——它甚至可能成为美国AI监管史上的一个标志性案例。

在后续报道中，WIRED将继续追踪白宫与Anthropic之间的最新动态。无论结果如何，这场博弈都将为全球AI治理提供重要的参考坐标。

本文编译自WIRED

白宫与Anthropic：Claude Fable 5风险争议未解

会议背景：Claude Fable 5引发关注

分歧核心：风险评估方法论之争

行业背景：AI监管的全球性困局

未来展望：博弈或持续升级

相关文章