白宫与Anthropic:Claude Fable 5风险争议未解

白宫与Anthropic:Claude Fable 5风险争议未解

当地时间周一,人工智能初创公司Anthropic的高层团队紧急飞往华盛顿,与白宫官员举行了一场闭门会议。据知情人士透露,双方在长达数小时的会谈中,围绕Anthropic最新模型——Claude Fable 5——潜在的安全风险展开了激烈的辩论。然而,会议结束后,双方依然未能达成共识,分歧依旧显著。

会议背景:Claude Fable 5引发关注

作为OpenAI前员工创立的公司,Anthropic一直以“负责任AI”为核心理念,其开发的Claude系列模型以安全性著称。但最新版本的Claude Fable 5被认为能力大幅跃升,尤其在推理、创意生成和长文本理解方面实现了突破。然而,这种进步也引发了监管层的高度警觉。白宫科技政策办公室(OSTP)此前曾私下表示,Claude Fable 5可能具备某些“双用技术”特征——即在科学研究中可能发挥巨大作用,但也可能被用于制造误导性信息或自动化网络攻击。

“我们理解政府的担忧,但我们相信Claude Fable 5的安全设计已经达到了行业最高标准。”——Anthropic发言人会后声明

白宫方面的关切则更为具体。据WIRED独家获得的消息,国家安全委员会(NSC)的专家团队曾对Claude Fable 5进行非正式评估,认为其自主决策能力可能在某些边缘情况下超出控制范围。一位不愿具名的白宫官员表示:“这不是一个简单的技术问题,它关系到国家安全的底线。”

分歧核心:风险评估方法论之争

双方争议的焦点在于风险评估的方法论。Anthropic主张采用其自创的“按需安全层”(Safety-by-Demand)框架,认为通过在模型部署后动态调整行为约束,能够有效管理风险。但白宫方面认为,这种事后调控模式存在滞后性,一旦模型被广泛分发,漏洞将难以修补。白宫倾向于要求Anthropic在发布前进行更严格的“红队测试”,并公开测试结果。

值得注意的是,这并非Anthropic首次与政府发生摩擦。2024年,该公司曾因拒绝向美国国防部提供Claude模型的军事用途授权而引发轩然大波。此次华盛顿之行,某种程度上也是Anthropic试图修复与联邦政府关系的一次努力,但会谈结果显然未能如愿。

行业背景:AI监管的全球性困局

此次会谈的背景是AI治理在全球范围内的白热化竞争。欧盟早已通过《人工智能法案》建立分级监管体系,而美国则仍停留在行业自律与行政命令并行的阶段。白宫2023年10月发布的首个AI行政令,要求联邦机构评估AI系统的潜在风险,但其执行力一直受到质疑。Anthropic与白宫的分歧,本质上折射出一个更深层的问题:当企业将“安全”作为核心卖点时,政府是否应该信任企业的自我监管能力?

编者也注意到,Anthropic的创始人Dario Amodei和Daniela Amodei曾在多个场合呼吁建立独立的AI审计机构,但该公司在面临具体监管要求时,却表现出强烈的抵抗情绪。这种矛盾心理几乎出现在所有领先AI公司身上——他们希望政府监管竞争对手,却不愿自己被束缚。Claude Fable 5的争议正是这种心态的典型体现。

未来展望:博弈或持续升级

会谈结束后,Anthropic发表了一份简短声明,表示“将继续与白宫保持建设性对话”。但白宫方面则暗示,如果无法达成一致,可能援引《国防生产法》对Claude Fable 5的部署实施临时限制。这意味着围绕这一模型的争议远未结束——它甚至可能成为美国AI监管史上的一个标志性案例。

在后续报道中,WIRED将继续追踪白宫与Anthropic之间的最新动态。无论结果如何,这场博弈都将为全球AI治理提供重要的参考坐标。

本文编译自WIRED