顶尖AI企业启动深度安全防御机制

随着人工智能技术向关键系统渗透,Anthropic与OpenAI正实施强化措施以应对潜在威胁。奥特曼领导的公司已推出仅限专家使用的高级模型,用于协助检测易受攻击的系统架构;而Anthropic则对特定功能启用严格的身份认证流程。

用户准入门槛提升以遏制滥用风险

为防范恶意利用,Anthropic要求用户在使用敏感功能前提交政府颁发的有效证件(如护照或驾照)及实时面部自拍。相关数据由合作方Persona负责处理,该公司承诺不会将这些信息用于模型训练,并强调该机制对于防止非法操作、执行合规政策和履行法定责任具有决定性作用。

若身份验证失败或来自未授权区域的访问尝试,账户将面临临时或永久封锁。这一举措源于Anthropic承认其新发布的Claude Mythos Preview版本具备惊人级别的攻防能力。

自主漏洞挖掘能力引发行业警觉

在同步发布的技术说明中,公司披露Mythos Preview可在指令驱动下“自动识别并利用主流操作系统与浏览器中的零日漏洞”。有未经专业训练的工程师曾命令该模型在一夜之间定位远程代码执行缺陷,次日清晨即获得可立即部署的完整攻击方案。

英国人工智能安全研究所的评估报告指出,该模型在网络攻防维度实现了“质变式跃升”。尤为突出的是:它在安全性广受认可的OpenBSD系统中发现了长达27年的隐蔽漏洞;在历经数百万次测试的FFmpeg视频工具中追溯出2003年起存在的H.264编解码器缺陷;并在FreeBSD文件服务器中揭示了潜伏17年的权限漏洞,且编写出可使非授权用户获取根权限的完整攻击代码。

整个过程完全由模型自主完成,成本低于2000美元,耗时不足24小时。该模型在每种主流浏览器中均成功探测到漏洞,并通过组合四种技术(包括即时编译堆喷射)突破渲染沙箱与操作系统沙箱双重防护。截至目前,已在开源与闭源软件中识别出数千个高危及以上等级漏洞,其中超过99%尚未公开修复补丁。

行业构建分层响应体系

尽管存在上述隐患,OpenAI仍宣布推出专为网络安全设计的GPT-5.4-Cyber版本。该模型不同于标准版对黑客请求的拒绝态度,允许在无源码条件下分析已编译程序,以识别恶意行为与潜在漏洞。但访问权限仅授予通过“网络安全可信访问”计划审核的关键防护人员、研究机构及专业组织。

Anthropic的“玻璃翼项目”亦向特定企业的安全团队提供有限访问权限,旨在实现攻击者利用前的漏洞修补。公司同时建议用户立即应用最新安全更新,而非依赖常规月度更新周期。