公开模型复现顶级漏洞：安全壁垒正被重塑

币圈界 2026-04-18 02:27:45 区块链

摘要：Vidoc Security团队仅用开源模型与公开工具，成功复现Anthropic Mythos发现的关键漏洞，揭示安全研究门槛正从模型访问转向验证能力，技术护城河正在转移。

币圈界报道：

公共AI已具备关键漏洞复现能力，安全边界面临重构

本月早些时候，Anthropic发布其前沿模型Claude Mythos时，仅向经过筛选的科技巨头联盟开放，并声称该模型对公众存在潜在风险。这一举动迅速引发监管层关注，美国财政部长斯科特·贝森特与美联储主席杰罗姆·鲍威尔紧急召集华尔街高管会议，“漏洞末日”之说再度在安全圈蔓延。

非私有路径下的漏洞再现尝试

一支独立研究团队突破传统认知，基于Anthropic自身修补后的公开案例，利用GPT-5.4与Claude Opus 4.6等开源模型，在opencode平台完成漏洞复现实验。整个过程未依赖Glasswing邀请、私有API或内部技术体系。

多源漏洞验证结果呈现差异性表现

研究聚焦的案例与Anthropic官方披露内容高度一致：包括服务器文件共享协议、专注安全的操作系统网络栈、广泛集成于媒体平台的视频处理组件，以及两个用于数字身份验证的加密库。三轮测试中，两款模型均成功再现了其中两个漏洞实例。值得注意的是，Claude Opus 4.6连续三次独立识别出OpenBSD相关缺陷，而GPT-5.4在此项测试中未能捕捉任何有效信号。部分高复杂度漏洞（如涉及FFmpeg和wolfSSL的缺陷）虽被定位到正确代码区域，但尚未精确锁定根本成因。

单次扫描成本低于30美元，研究门槛显著降低

每轮文件分析成本控制在30美元以内，表明当前条件下，研究人员可实现与顶尖实验室相当的漏洞发现效率。研究员达维德·莫恰德沃在社交平台强调：“如今的AI模型已能有效缩小搜索范围，提供真实线索，甚至在经过实战检验的代码中定位完整根源。”

自动化工作流实现端到端复现

研究流程并非单一提示操作，而是模拟了Anthropic公开描述的技术路径：将代码库输入模型后，允许其自主探索、并行试错并过滤异常信号。团队使用开源工具构建了类似架构——规划代理负责分块处理，检测代理逐块分析，再通过跨文件比对验证或排除假设。

分块策略由算法生成，人工干预极少

检测提示中的代码行区间（如“1158-1215行”）并非人为设定，而是前期规划模块的输出结果。研究团队特别指出：“我们希望澄清，分块逻辑完全由系统自动生成，避免外界误认为流程高度依赖人工判断。”

从发现到利用仍存本质差距

尽管公开模型可在发现层面达到相近水平，但尚未具备构建攻击链的能力。例如，Anthropic的Mythos不仅识别出FreeBSD漏洞，还推演出攻击者如何串联多个数据包实现远程完全控制。而Vidoc团队的模型仅能定位漏洞，无法生成可行攻击方案——这揭示了当前核心差距不在探测，而在对利用路径的精准建模。

护城河正从模型转向验证环节

莫恰德沃的核心观点在于：真正昂贵的不再是获取先进模型，而是将初步信号转化为可信安全成果的过程。随着发现阶段成本趋近于零，技术壁垒正发生位移——验证环节成为新的瓶颈。

Anthropic自身报告也承认，现有评估标准如Cybench基准已无法准确衡量前沿模型的真实威胁水平，因为Mythos已全面超越其设计上限。实验室预估，类似能力将在未来6至18个月内扩散至其他研发机构。

Vidoc的研究表明，漏洞发现环节已不再受封闭体系垄断。完整提示文本、模型响应及方法论附录均已公开发布于其官网，推动安全研究进入全民可参与时代。

声明：本站所有文章内容，均为采集网络资源，不代表本站观点及立场，不构成任何投资建议！如若内容侵犯了原著者的合法权益，可联系本站删除。

₿

币安 Binance

币安交易所是全球加密货币交易所,注册奖励 500 U

官网注册下载APP

公开模型复现顶级漏洞：安全壁垒正被重塑

币圈界报道：

公共AI已具备关键漏洞复现能力，安全边界面临重构

非私有路径下的漏洞再现尝试

多源漏洞验证结果呈现差异性表现

单次扫描成本低于30美元，研究门槛显著降低

自动化工作流实现端到端复现

分块策略由算法生成，人工干预极少

从发现到利用仍存本质差距

护城河正从模型转向验证环节

相关推荐