币圈界报道:

Anthropic公开Claude Mythos Fable 5:安全护栏能否抵御AI驱动攻击潮?

Anthropic以Fable 5代号正式发布其Claude Mythos系列首个面向公众的高级版本。该模型在具备深度分析能力的同时,内置了针对敏感议题(如网络安全)的定向引导机制,将相关请求转至独立的Claude Opus 4.8模型进行处理。此举旨在平衡技术开放性与潜在滥用风险,但已在加密领域激起涟漪式反应。

强大模型与防护机制并行,但风险仍存于细节之中

尽管公司声明Fable 5已通过“通用用途安全验证”,并承诺在无护栏情况下可能被用于恶意目的,但实际部署中仍存在不确定性。此前披露显示,Mythos系列在关键系统中识别出超万项高危漏洞,这一背景使得公众对其广泛可用性的担忧加剧。尤其当此类工具可自动化执行代码审查、路径探索甚至利用生成时,其双刃剑属性愈发凸显。

加密生态面临双重挑战:防御升级还是攻击门槛降低?

随着人工智能辅助渗透测试日益普及,2025年4月加密黑客攻击总损失达6.297亿美元,创下年度新高。行业分析师指出,部分攻击行为极可能得益于AI对合约逻辑的快速推理能力。在此背景下,是否应允许通用型大模型直接接触核心金融协议代码,成为争议核心。支持者认为可加速缺陷修复,反对者则警告,低门槛的漏洞探测工具正悄然重塑攻防格局。

从业者观点分化:从警钟长鸣到理性评估

Moonrock Capital创始人Simon Dedic警示称,当前模型已使智能合约漏洞发现成本趋近于零,小型项目或成首要目标,未审计协议或将陷入持续重演的脆弱循环。而Curve Finance联合创始人Michael Egorov则持保留态度,强调现有智能合约代码体量远小于传统软件,人类与常规AI已能高效覆盖,因此过度夸大其威胁可能适得其反。他同时提醒,多签密钥泄露与前端依赖供应链等非代码层面风险,反而更易受AI助力放大。

开源生态中的漏洞发现:从广度到深度的映射困境

Anthropic于5月公布的Project Glasswing成果揭示,其模型在逾千个开源项目中检测出约6200个严重级漏洞,涵盖大量支撑加密基础设施的组件。这暴露出开放协作模式下安全性与开发效率之间的深层张力。若漏洞发现速度远超修复周期,整个生态系统的韧性将面临严峻考验。

权限分级与治理博弈:谁有资格接触强模型?

为控制风险,Anthropic仅向少数经认证的网络安全与基础设施机构提供无护栏版Mythos 5访问权限。这种分层策略意在推动前沿研究,同时维持公众版本的安全边界。然而,这也引发了关于权力集中、透明度和责任归属的持续讨论。未来监管如何界定“合法使用”边界,将成为决定技术走向的关键变量。

应对之道:强化运营实践而非依赖单一工具

面对不可逆的技术演进,行业共识逐渐转向务实防御:包括撤销冗余钱包授权、减少实验链上资金暴露、采用硬件钱包与冷存储等措施。长远来看,企业需重构审计流程、提升依赖项管理标准,并建立动态响应机制。观察者将持续追踪权限分配变化、护栏策略演化及监管指导动向,以判断这场人机共治的安全革命将走向何方。