币圈界报道:

Anthropic拓展“玻璃之翼”项目,加速部署顶级AI模型前的安全验证

Anthropic正通过名为“玻璃之翼”的协作机制,显著扩大其Claude Mythos人工智能模型的预发布访问范围。该计划聚焦于在模型正式对外开放前,由可信组织协助识别并修复高危缺陷与系统性风险。

新增百余家关键行业实体参与安全压力测试

根据周二发布的声明,该公司将在控制性访问框架下引入近150家新成员,涵盖电力、供水、医疗健康、通信及硬件制造等核心基础设施领域。所有申请机构均需通过严格的安全合规审查方可获得权限。

高影响力系统面临重大威胁,模型暴露风险被重新评估

Anthropic指出,这些新增合作伙伴所维护的软件平台服务着数亿用户,并直接关联国家运行稳定。一旦遭受攻击,可能引发大规模社会中断。据内部评估,单次成功入侵或影响超一亿人,对国家安全构成实质性挑战。

模型能力触发全球安全警觉

Claude Mythos自三月因内部资料外泄而进入公众视野。已有合作方利用其预览版本检测出逾万项严重级别漏洞。部分团队借助该模型生成补丁代码、执行自动化审计,并在产品上线前完成深度渗透测试。

构建防御技术优势以应对未来威胁浪潮

Anthropic强调,此次扩展是为确保防御力量能在攻击者掌握同等能力前建立技术制高点。预计未来六至十二个月内,其他厂商将推出具备相似性能的模型,但未必配备同等安全防护体系,这或将导致网络攻击频率上升且更具不可预测性。

“前沿模型的竞争已演变为一场攻防博弈,尤其在网络安全这一双刃剑领域。”公司表示,“若本计划取得成效,目标是为守卫方赢得持续性的战略领先。”

随着非公开测试范围的提升,某预测市场平台数据显示,用户对Claude Mythos在六月底前发布的预期已从峰值58.5%降至26.5%,反映出市场对发布时间延后的普遍判断。