摘要:Anthropic正式推出Claude Mythos 5与Claude Fable 5,前者限于网络安全机构使用,后者面向公众并强化防护机制。两大模型在多项基准测试中表现卓越,引发关于AI能力边界与滥用风险的广泛讨论。

币圈界报道:
Anthropic发布新一代AI模型:Mythos 5限控开放,Fable 5全面赋能
周二,Anthropic正式发布两款全新大模型——Claude Mythos 5与Claude Fable 5。前者为受限访问的高阶网络安全模型,后者则以更强的安全隔离机制面向更广泛用户群体,标志着公司在模型能力与风险控制之间的再平衡。
高危模型分阶段开放,信任机制成核心
Anthropic披露,Mythos 5初始仅向经认证的网络安全组织、关键基础设施运营方、政府协作单位及部分生命科学研究员提供。公司强调,此类模型已触及“临界风险阈值”,必须通过严格准入机制管理其潜在滥用风险。
从预览到正式版:玻璃翼计划持续推进
该版本承袭4月启动的“玻璃翼计划”框架,当时首次释放了Claude Mythos预览版,旨在验证其在无外部干预下完成复杂网络攻防演练的能力。英国AI安全研究所报告称,该预览版已实现32步企业级入侵自动化;Mozilla后续发现其在Firefox中识别出逾270个漏洞,凸显其深度分析潜力。
扩展访问路径:信任申请机制逐步落地
在持续评估风险的基础上,Anthropic宣布将通过“更广泛的信任访问计划”逐步扩大对Mythos 5的授权范围,重点支持网络安全防御与生物医学研究领域。同时,现有预览版用户可无缝升级至正式版。
军事合作缓和,部署进展透明化
此次发布之际,此前因涉及军事用途引发争议的矛盾趋于平息。据透露,Anthropic已在国家安全局派驻工程师,协助推进其Mythos模型在国家级网络安全行动中的部署。公司表示,未来将定期引入新合作伙伴,并建立系统化申请流程。
公众版模型性能跃升,多领域领先
Claude Fable 5采用与Mythos 5相同的底层架构,但在公开环境中集成多重防护策略。该公司宣称,该模型在软件工程、知识处理、视觉理解、科研推理等维度均达到当前公开模型最高水平,尤其在复杂任务延续性方面显著优于以往版本。
实测表现亮眼,安全防线同步强化
在ExploitBench漏洞挖掘测试中,模型取得78%得分;在Terminal-Bench编码基准上达88%。这些数据表明其具备处理长周期、高复杂度任务的能力。为防范敏感领域滥用,涉及网络安全、生物化学或模型复制的请求将由Claude Opus 4.8接管,触发率低于5%。
风险共担:技术突破伴随责任重压
Anthropic坦言,如此强大模型的发布必然伴随严峻挑战。若缺乏有效防护,其在网络安全领域的应用可能被恶意利用,造成不可逆损害。公司主张,此类能力应优先服务于防御者,以对抗攻击者的潜在威胁。
行业争议未止:能力与营销之争持续发酵
面对外界质疑,包括OpenAI CEO Sam Altman在内的多位观察者批评其“以恐惧驱动市场”。然而,Anthropic坚持认为,通过分层访问与透明治理,可在推动技术进步的同时守住安全底线,回应日益紧迫的数字生态防御需求。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
