币圈界报道:

Anthropic就模型性能隐藏限制致歉并全面撤销相关措施

面对来自学术界与产业界的广泛质疑,Anthropic正式宣布取消针对Claude Fable 5的非透明性能约束机制,并对由此引发的信任危机公开致歉。该政策原计划在未告知用户的情况下,对涉及前沿人工智能领域的查询自动降低输出质量,被指严重阻碍外部研究者的验证与创新活动。

系统卡揭示隐形性能干预,触发条件不透明

在6月9日发布的Claude Fable 5版本中,Anthropic引入了四类防护机制,分别覆盖网络安全、生物化学及人工智能研究领域。其中前三项措施明确标注,一旦检测到敏感内容,将直接拒绝响应或引导至高阶产品Claude Opus 4.8,并附带提示信息。

但第四类机制存在显著差异:当识别出与新兴AI技术相关的提问时,系统会在后台悄然削弱生成质量,且全程无任何用户提示。据《财富》披露,此类干预策略详述于一份长达319页的系统卡文档中,却未向公众或开发者提前说明。

尽管官方称实际触发概率仅为0.03%,但其背后所反映的治理逻辑远超数字本身。公司承认:“我们未能在安全与开放之间找到平衡点,对此深感遗憾。”

多方人士批评为科研设障,动摇开放研究根基

这场争议迅速获得跨阵营共鸣。从开源倡导者到曾参与该公司核心项目的前员工,均对这一做法表示强烈反对。

Prime Intellect首席研究员Will Brown指出,此举如同“悄悄收回支撑攀登的梯子”,使外部研究团队难以独立评估模型的真实能力边界。

前艾伦人工智能研究所成员Nathan Lambert则在社交平台直言,该政策“清晰地勾勒出一个反科学、反进步、反安全的机构形象”。

AnswerDotAI联合创始人Jeremy Howard将其定性为一场权力博弈。他强调,内部研究人员仍可访问未受限版本,而外部开发者却被置于信息差之下。“技术前沿持续演进,但获取机会却日益固化。”

曾任公司AI科学家项目负责人之一的Behnam Neyshabur亦发声,认为此类限制“从根本上抑制科技进步,对全人类构成净损失”。

IPO前夕遭遇信任挑战,多重争议叠加风险

此次事件恰逢Anthropic提交秘密IPO申请的关键节点。据披露,该公司拟募集650亿美元,估值逼近9650亿美元,市场信心成为成败关键。

除性能限制外,Fable 5还因过度强化生物学过滤器受到质疑——它无法回答关于细胞膜、线粒体等基础生命结构的问题,甚至无法解释mRNA疫苗作用原理,却能自由讨论炸药与密码学内容。

微软也已暂停其员工使用该模型,主要顾虑源于“Mythos级保留策略”带来的数据留存隐患。根据设定,用户输入与输出记录最长保存两年,而部分敏感内容的保留期更长,引发隐私与合规担忧。

未来走向:可见化监管能否重建信任?

随着政策修正,Anthropic承诺将完全公开其安全防护机制。若系统识别到前沿研究请求,将主动拒绝或切换至其他模型,并即时通知用户。

公司承认,透明化意味着必须扩大拦截范围,导致更多常规查询被误伤。目前正致力于优化分类精度,以减少误判。

这一事件暴露了一个深层矛盾:随着模型能力提升与训练成本激增,企业越来越倾向于通过隐性壁垒保护竞争优势。Anthropic的快速退让是否构成行业先例,还是仅推迟了下一次类似尝试,将取决于整个生态如何定义“负责任的开放”标准。