新型AI模型展现自主渗透能力,安全威胁升级至新阶段

英国人工智能安全研究所对Anthropic公司开发的Claude Mythos预览版展开专项测评,结果显示该系统可独立完成多阶段网络入侵操作,攻击成功率突破历史阈值,展现出前所未有的自动化攻防能力。

高阶漏洞探测能力获实证,仅限安全机构有限访问

该模型于今年三月下旬通过公开渠道信息首次曝光。研发方确认,其在识别网页浏览器与操作系统深层缺陷方面表现远超当前所有已知人工智能框架。为防止技术外泄,仅向数十家权威安全研究机构开放受限权限,用于定向性能验证与风险预判。

夺旗挑战达成率73%,远超行业预期时间表

最新发布的评估数据显示,在专家级“夺旗”任务中,Mythos预览版成功率达73%。此类挑战原被预测需到2025年4月才可能由人工智能完成,如今提前实现突破。该结果证实此前关于其潜在威胁的预警具有充分依据。

企业级攻击模拟首度全链路自主完成

在包含32个步骤的企业网络入侵演练中,Mythos成为首个实现完整流程的AI模型。十次测试中有三次达成全部目标,平均完成22步,显著领先于前代模型Claude Opus 4.6的16步均值。整个过程涵盖侦察、漏洞利用、横向移动直至系统控制,真实还原现实攻击路径。

算力增强驱动性能跃升,风险持续累积

评估表明,该模型性能随计算资源提升而线性增长,单次运行可处理高达一亿个标记。在受控环境下获得明确指令后,其无需人工干预即可启动多阶段攻击并主动发现系统弱点。这一演进标志着人工智能从辅助工具转向独立威胁实体的转折点。