币圈界报道:

新型智能体在国家级网络攻防演练中实现双重突破

英国人工智能安全研究所近日发布报告,揭示一款人工智能系统在政府主导的网络安全攻防模拟测试中取得历史性进展,成为首个成功攻克两项关键测试场景的实体,标志着自主智能体在复杂环境下的渗透能力迈入新阶段。

核心攻防任务完成率大幅跃升

根据周三公布的实测数据,该模型在名为“最后防线”的32步企业网络入侵模拟中,十次尝试中有六次达成目标,相较前代版本的三次成功实现翻倍。更引人注目的是,在针对工业控制系统设计的“冷却塔”挑战中,该系统在十次试验中三次成功穿透,这一成果打破了过往所有参赛模型的记录,成为首个通过该类高难度测试的智能体。

对比数据显示,同类竞品在相同条件下仅能完成三成左右的“最后防线”任务,且完全无法触达“冷却塔”场景。所有测试均设定统一计算资源上限,而该模型在限定条件下仍呈现性能递增趋势,暗示其潜力在更高资源配置下或可进一步释放。

技术进步周期持续压缩,逼近指数增长拐点

研究团队基于时间跨度基准评估网络安全领域的发展速率,重点追踪模型在80%置信度下自主完成任务所需时长。分析显示,相关技术的能力倍增周期已从去年11月的8个月缩短至今年2月的4.7个月,当前主流模型更已超越此加速曲线。

研究人员指出,目前尚难判断这是新一轮加速趋势的起点,还是单次技术跃迁的结果。与此同时,独立评估机构得出约4.2个月的相似测算值,表明该趋势具备跨体系一致性,非单一测试环境所致。

需强调的是,本次测试未引入主动防御机制,因此结果仅反映模型在基础防护网络中的表现,尚未涵盖对企业级强化系统的应对能力。

非全新架构亦实现质变,迭代逻辑面临重构

此次突破所依托的测试版本并非全新发布模型,其底层结构与上月部署版本保持一致,仅通过更新构建流程即展现出显著能力跃升。

研究机构明确表示:“重大性能提升未必源自模型重制。”这一发现颠覆了业界对技术迭代必须伴随架构变革的传统认知。

四月初,开发方曾披露该版本在内部实验中识别出多个主流操作系统及浏览器的深层漏洞,并视其为安全生态的关键转折点。基于其潜在影响,企业决定暂缓对外公开。此前的评估报告也确认,该版本相较现有前沿系统已形成明显代际优势。