币圈界报道:

政府指令引发行业对AI安全标准的深层质疑

美国政府发布紧急出口管制命令,要求 Anthropic 在全球范围内立即暂停 Fable 5 与 Mythos 5 的所有访问权限,理由是存在一项被报告的越狱方法所引发的安全风险。

指令基于未公开的技术细节下达

该指令于东部时间下午5点21分正式下达,但未提供书面说明。官方仅口头表示,已掌握一种可绕过 Fable 5 安全机制的技术手段。

Anthropic 在审查相关演示后指出,其所揭示的漏洞属于已知范畴,且在 OpenAI 的 GPT-5.5 等主流模型中普遍存在,日常安全团队亦持续监控此类问题。

进一步分析显示,所谓越狱行为本质上仅为引导模型读取代码库并识别潜在缺陷,不涉及任何恶意输出或系统破坏。

公司确认,尚未收到关于造成实质性危害或具有独特破坏力的越狱案例的披露,相关发现均属常规性安全评估范畴。

企业质疑召回机制的合理性与适用范围

Anthropic 强调其在 Fable 5 上实施了多层防御体系,包括窄域防护、实时行为监测及强制30天数据留存策略,旨在实现快速响应与溯源能力。

尽管该策略引发部分客户担忧,但公司认为其有效将越狱攻击限制在低频、高成本区间,整体风险水平与其他前沿模型相当。

针对此次政府行动,公司明确表示支持监管机构在必要时干预高危部署,但强调程序必须具备透明性、公正性与事实支撑。

当前指令既无充分技术论证,也未经过法定程序,构成对行业创新机制的严重干扰。

Anthropic 警告,若此标准被普遍采纳,将导致所有先进人工智能模型的新版本发布陷入长期停滞,严重阻碍技术演进。

公司承诺将在24小时内公布详细技术分析,并重申其余所有产品线仍正常运行,不受影响。