币圈界报道:

Anthropic发布新一代通用与受限AI模型,性能全面跃升

人工智能公司Anthropic周一正式推出其最新一代模型——Claude Fable 5,作为Mythos系列的通用版本,该模型被宣称在多项公开基准中达到当前最高水平。与此同时,专为特定机构设计的受限版本Claude Mythos 5也将通过Project Glasswing项目交付给美国政府网络安全人员。

通用模型融合高阶能力与安全控制机制

Claude Fable 5基于与Mythos相同的底层架构,但新增了主动式安全分类系统,可将涉及敏感内容的请求自动引导至更受控的Claude Opus 4.8处理。尽管该机制设置较为谨慎,可能导致极少数无害请求被拦截,但官方数据显示,此类误判平均占比低于5%。

受限版模型聚焦专业场景,强化任务适配性

Mythos 5版本则针对特定领域优化,其分类策略仅对特定类型查询生效。此版本被视为对早期Glasswing预览版的一次重大升级,未来将逐步扩展至更多通过合规审查的客户群体。

多领域实测验证卓越表现

Anthropic强调,Fable 5在长序列任务和复杂推理场景中具备显著优势。多家企业参与的初步评估显示,其在多个关键维度上居于前列。

Stripe反馈,该模型在单日内完成了一项涵盖5000万行Ruby代码的迁移工程,相当于原计划需团队协作两个月的工作量。Cognition的FrontierCode测试表明,Fable 5在中等开发投入下已达成最接近生产标准的代码输出质量。

金融分析方面,Hebbia的高级推理测试将Fable 5列为首位,尤其在文档理解与图表解析能力上实现突破。交易机构IMC内部评估指出,其在期望值建模、事实核验及抽象概念推演中展现出极强适应力。

此外,该模型仅依赖原始游戏截图与基础Vision工具,便成功通关《宝可梦 火红》,相较以往需额外辅助工具才能尝试此类任务,体现更强的自主感知与规划能力。

网络安全能力获自评认证,尚待第三方验证

Anthropic声称,Mythos 5拥有“全球现有模型中最强大的网络安全防护能力”,但此结论仍基于内部评估,尚未经过独立公开基准检验。

上线时间与访问路径明确,定价大幅下调

两款模型将于2026年6月9日(周二)同步上线,公共版定价为每百万输入标记10美元,输出端为每百万标记50美元,价格不足前代预览版的一半。

开发者可通过Claude API、Amazon Bedrock、Google Cloud Vertex AI及Microsoft Foundry接入Fable 5;而Mythos 5仅限经审批的Project Glasswing成员使用。

两款模型均支持高达100万标记的上下文窗口,单次请求最大输出可达12.8万标记。

构建分层安全框架应对高能模型风险

面对高能力模型可能带来的滥用隐患,Anthropic坦承其采取了主动干预策略。新引入的安全分类器作为第一道防线,一旦识别出潜在高危请求,即触发返回来自Claude Opus 4.8的响应。

API会返回明确的“stop_reason: 'refusal'”信号,帮助开发者识别并处理拒绝事件。文档同时提供回退机制配置选项:可通过服务器端的“fallbacks”参数或客户端SDK中间件,自动切换至备用模型。对于在生成前即被拦截的请求,不计费并提供信用额度用于补偿后续重试开销。

公司表示,随着后续更强模型的迭代,正致力于降低安全触发的误报率,以提升用户体验与系统效率。