币圈界报道:

Anthropic发布新一代AI模型:Mythos 5限控开放,Fable 5全面赋能

周二,Anthropic正式发布两款全新大模型——Claude Mythos 5与Claude Fable 5。前者为受限访问的高阶网络安全模型,后者则以更强的安全隔离机制面向更广泛用户群体,标志着公司在模型能力与风险控制之间的再平衡。

高危模型分阶段开放,信任机制成核心

Anthropic披露,Mythos 5初始仅向经认证的网络安全组织、关键基础设施运营方、政府协作单位及部分生命科学研究员提供。公司强调,此类模型已触及“临界风险阈值”,必须通过严格准入机制管理其潜在滥用风险。

从预览到正式版:玻璃翼计划持续推进

该版本承袭4月启动的“玻璃翼计划”框架,当时首次释放了Claude Mythos预览版,旨在验证其在无外部干预下完成复杂网络攻防演练的能力。英国AI安全研究所报告称,该预览版已实现32步企业级入侵自动化;Mozilla后续发现其在Firefox中识别出逾270个漏洞,凸显其深度分析潜力。

扩展访问路径:信任申请机制逐步落地

在持续评估风险的基础上,Anthropic宣布将通过“更广泛的信任访问计划”逐步扩大对Mythos 5的授权范围,重点支持网络安全防御与生物医学研究领域。同时,现有预览版用户可无缝升级至正式版。

军事合作缓和,部署进展透明化

此次发布之际,此前因涉及军事用途引发争议的矛盾趋于平息。据透露,Anthropic已在国家安全局派驻工程师,协助推进其Mythos模型在国家级网络安全行动中的部署。公司表示,未来将定期引入新合作伙伴,并建立系统化申请流程。

公众版模型性能跃升,多领域领先

Claude Fable 5采用与Mythos 5相同的底层架构,但在公开环境中集成多重防护策略。该公司宣称,该模型在软件工程、知识处理、视觉理解、科研推理等维度均达到当前公开模型最高水平,尤其在复杂任务延续性方面显著优于以往版本。

实测表现亮眼,安全防线同步强化

在ExploitBench漏洞挖掘测试中,模型取得78%得分;在Terminal-Bench编码基准上达88%。这些数据表明其具备处理长周期、高复杂度任务的能力。为防范敏感领域滥用,涉及网络安全、生物化学或模型复制的请求将由Claude Opus 4.8接管,触发率低于5%。

风险共担:技术突破伴随责任重压

Anthropic坦言,如此强大模型的发布必然伴随严峻挑战。若缺乏有效防护,其在网络安全领域的应用可能被恶意利用,造成不可逆损害。公司主张,此类能力应优先服务于防御者,以对抗攻击者的潜在威胁。

行业争议未止:能力与营销之争持续发酵

面对外界质疑,包括OpenAI CEO Sam Altman在内的多位观察者批评其“以恐惧驱动市场”。然而,Anthropic坚持认为,通过分层访问与透明治理,可在推动技术进步的同时守住安全底线,回应日益紧迫的数字生态防御需求。