Anthropic推新模型与设计工具,市场反应剧烈

Anthropic正筹备发布Claude Opus 4.7以及一款支持自然语言指令生成网页与演示文稿的AI设计工具,这一动向于本周一迅速传导至资本市场,引发Adobe、Wix及Figma等企业的股价异动。

新设计工具定位广泛,直面主流平台竞争

据内部消息,该设计产品或将于本周期内正式上线。其核心特性在于能理解简明英文指令,兼顾技术人员与无编程背景用户的使用需求,从而与Gamma、Google Stitch等新兴厂商形成直接对垒。

最高级模型仍属保密,未对外公开可用

值得注意的是,Opus 4.7并非Anthropic目前技术层级最高的系统。该公司当前最前沿的模型为专攻网络安全领域的Claude Mythos,该系统仅限特定合作项目中向受控机构提供,尚未进入公众视野。

基准测试遭质疑,模型真实能力面临验证挑战

近期OpenAI指出,部分前沿模型在训练阶段意外存留了领先编程基准的解题方案,致使相关测试结果可信度受损。然而,业内仍普遍沿用此类指标进行模型对比。

一项独立人类推理对照实验揭示显著差距:Gemini得分仅为0.37%,GPT-5.4为0.26%,而人类参与者达成100%正确率。由于Anthropic未披露Opus 4.7的完整技术文档,其宣称的性能跃升尚缺乏第三方验证支撑。

Mythos预览版展现惊人攻击模拟能力

英国人工智能安全研究所对Claude Mythos预览版本开展评估后发现,该系统可自主完成复杂网络入侵流程,速度远超现有其他模型。其成功执行了一项包含32个步骤的企业级攻击模拟——传统人工红队需耗时约20小时方能完成,标志着其成为首个通过“终极考验”的人工智能系统。