摘要:英国人工智能安全研究所评估显示,Claude Mythos预览版成为首个成功完成32步企业网络攻击模拟的AI模型,夺旗任务解决率达73%,并具备零日漏洞利用能力,引发美英政策层紧急应对。

Claude Mythos预览版实现企业级网络攻防全流程模拟
英国人工智能安全研究所最新评估揭示,该模型在专家级网络安全挑战中达成73%的破解率,首次突破此前所有人工智能系统均未能跨越的技术壁垒。
攻防测试实现历史性突破
自4月7日发布以来,英国科学、创新与技术部下属研究机构对该模型实施了两轮专项测试。开发方未采取公开发布策略,仅向授权安全研究单位提供受限访问权限。
在高阶夺旗任务中,模型展现出73%的成功率,创下历史纪录——此前所有已知模型均无法完成此类复杂任务。研究团队构建的“最终防线”模拟环境包含32个关键步骤,专业人员通常需20小时方可完成。该模型在10次尝试中成功执行全流程3次,平均推进至第22步,显著超越次优表现的16步。
评估报告指出:“其在虚拟攻防场景中的表现证明,该模型已具备在获得初始访问权后,自主渗透防御薄弱小型企业系统的潜在能力。”
零日漏洞探测与利用能力显现
红队实测发现,当用户下达明确指令时,该模型可识别并激活主流操作系统及浏览器中存在的未公开漏洞。目前所发现漏洞中,超过99%尚未被厂商修复。
开发方声明:“当前披露信息极为有限,进一步透露细节将构成严重责任缺失。”该模型的能力已触发高层关注,美国财政部长与美联储主席紧急召集主要银行高管,就其可能带来的系统性安全威胁展开磋商。
主动防御机制启动应对
伴随模型发布,开发公司同步推出“玻璃之翼”计划,旨在反向运用该模型协助强化关键软件的安全基线。公司强调此举为应对未来由AI驱动攻击者主导的威胁格局所做的前瞻性布局。
研究机构建议各组织立即强化基础防护措施,包括定期更新系统、严格权限管控、配置加固以及全面日志审计。此次发布正值业界对AI在网络安全领域角色的担忧持续发酵之际。此前的先进模型虽具初步攻击潜力,但始终未能达到专家级夺旗标准或完成多阶段攻击模拟。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
