Claude Mythos预览版实现企业级网络攻防全流程模拟

英国人工智能安全研究所最新评估揭示,该模型在专家级网络安全挑战中达成73%的破解率,首次突破此前所有人工智能系统均未能跨越的技术壁垒。

攻防测试实现历史性突破

自4月7日发布以来,英国科学、创新与技术部下属研究机构对该模型实施了两轮专项测试。开发方未采取公开发布策略,仅向授权安全研究单位提供受限访问权限。

在高阶夺旗任务中,模型展现出73%的成功率,创下历史纪录——此前所有已知模型均无法完成此类复杂任务。研究团队构建的“最终防线”模拟环境包含32个关键步骤,专业人员通常需20小时方可完成。该模型在10次尝试中成功执行全流程3次,平均推进至第22步,显著超越次优表现的16步。

评估报告指出:“其在虚拟攻防场景中的表现证明,该模型已具备在获得初始访问权后,自主渗透防御薄弱小型企业系统的潜在能力。”

零日漏洞探测与利用能力显现

红队实测发现,当用户下达明确指令时,该模型可识别并激活主流操作系统及浏览器中存在的未公开漏洞。目前所发现漏洞中,超过99%尚未被厂商修复。

开发方声明:“当前披露信息极为有限,进一步透露细节将构成严重责任缺失。”该模型的能力已触发高层关注,美国财政部长与美联储主席紧急召集主要银行高管,就其可能带来的系统性安全威胁展开磋商。

主动防御机制启动应对

伴随模型发布,开发公司同步推出“玻璃之翼”计划,旨在反向运用该模型协助强化关键软件的安全基线。公司强调此举为应对未来由AI驱动攻击者主导的威胁格局所做的前瞻性布局。

研究机构建议各组织立即强化基础防护措施,包括定期更新系统、严格权限管控、配置加固以及全面日志审计。此次发布正值业界对AI在网络安全领域角色的担忧持续发酵之际。此前的先进模型虽具初步攻击潜力,但始终未能达到专家级夺旗标准或完成多阶段攻击模拟。