摘要:Vidoc Security团队仅用开源模型与公开工具,成功复现Anthropic Mythos发现的关键漏洞,揭示安全研究门槛正从模型访问转向验证能力,技术护城河正在转移。

币圈界报道:
公共AI已具备关键漏洞复现能力,安全边界面临重构
本月早些时候,Anthropic发布其前沿模型Claude Mythos时,仅向经过筛选的科技巨头联盟开放,并声称该模型对公众存在潜在风险。这一举动迅速引发监管层关注,美国财政部长斯科特·贝森特与美联储主席杰罗姆·鲍威尔紧急召集华尔街高管会议,“漏洞末日”之说再度在安全圈蔓延。
非私有路径下的漏洞再现尝试
一支独立研究团队突破传统认知,基于Anthropic自身修补后的公开案例,利用GPT-5.4与Claude Opus 4.6等开源模型,在opencode平台完成漏洞复现实验。整个过程未依赖Glasswing邀请、私有API或内部技术体系。
多源漏洞验证结果呈现差异性表现
研究聚焦的案例与Anthropic官方披露内容高度一致:包括服务器文件共享协议、专注安全的操作系统网络栈、广泛集成于媒体平台的视频处理组件,以及两个用于数字身份验证的加密库。三轮测试中,两款模型均成功再现了其中两个漏洞实例。值得注意的是,Claude Opus 4.6连续三次独立识别出OpenBSD相关缺陷,而GPT-5.4在此项测试中未能捕捉任何有效信号。部分高复杂度漏洞(如涉及FFmpeg和wolfSSL的缺陷)虽被定位到正确代码区域,但尚未精确锁定根本成因。
单次扫描成本低于30美元,研究门槛显著降低
每轮文件分析成本控制在30美元以内,表明当前条件下,研究人员可实现与顶尖实验室相当的漏洞发现效率。研究员达维德·莫恰德沃在社交平台强调:“如今的AI模型已能有效缩小搜索范围,提供真实线索,甚至在经过实战检验的代码中定位完整根源。”
自动化工作流实现端到端复现
研究流程并非单一提示操作,而是模拟了Anthropic公开描述的技术路径:将代码库输入模型后,允许其自主探索、并行试错并过滤异常信号。团队使用开源工具构建了类似架构——规划代理负责分块处理,检测代理逐块分析,再通过跨文件比对验证或排除假设。
分块策略由算法生成,人工干预极少
检测提示中的代码行区间(如“1158-1215行”)并非人为设定,而是前期规划模块的输出结果。研究团队特别指出:“我们希望澄清,分块逻辑完全由系统自动生成,避免外界误认为流程高度依赖人工判断。”
从发现到利用仍存本质差距
尽管公开模型可在发现层面达到相近水平,但尚未具备构建攻击链的能力。例如,Anthropic的Mythos不仅识别出FreeBSD漏洞,还推演出攻击者如何串联多个数据包实现远程完全控制。而Vidoc团队的模型仅能定位漏洞,无法生成可行攻击方案——这揭示了当前核心差距不在探测,而在对利用路径的精准建模。
护城河正从模型转向验证环节
莫恰德沃的核心观点在于:真正昂贵的不再是获取先进模型,而是将初步信号转化为可信安全成果的过程。随着发现阶段成本趋近于零,技术壁垒正发生位移——验证环节成为新的瓶颈。
Anthropic自身报告也承认,现有评估标准如Cybench基准已无法准确衡量前沿模型的真实威胁水平,因为Mythos已全面超越其设计上限。实验室预估,类似能力将在未来6至18个月内扩散至其他研发机构。
Vidoc的研究表明,漏洞发现环节已不再受封闭体系垄断。完整提示文本、模型响应及方法论附录均已公开发布于其官网,推动安全研究进入全民可参与时代。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
