摘要:英伟达首款定制CPU Vera正式进入量产阶段,已交付Anthropic、OpenAI、甲骨文云及SpaceXAI等机构。该芯片专为智能体工作负载设计,具备1.2TB/s内存带宽与50%核心性能提升,将助力超大规模AI系统升级。

币圈界报道:
英伟达定制CPU Vera启动量产,首批交付多家头部AI企业
英伟达旗下首款专为智能体人工智能设计的Vera处理器已完成开发,正式迈入大规模生产阶段。首批产品已陆续送达Anthropic、OpenAI、甲骨文云基础设施部门以及SpaceXAI等前沿人工智能组织。
马斯克现场验证强化学习处理能力
在完成对Anthropic与OpenAI的交付后,英伟达超大规模计算副总裁伊恩·巴克抵达SpaceXAI位于帕洛阿尔托的基地,向埃隆·马斯克展示了Vera系统的完整架构。马斯克就核心配置、内存布局与散热策略提出多项技术细节问题,并对芯片在复杂模拟环境中的表现表示高度关注。
甲骨文宣布2026年起部署数十万台
甲骨文云基础设施(OCI)团队在圣克拉拉客户卓越中心完成开箱验收,正式确认将自2026年起启动大规模部署计划,目标覆盖数十万台Vera处理器。此举标志着该芯片首次被超大规模云服务商纳入长期战略规划,也使甲骨文成为首家承诺全面采用Vera的云平台。
聚焦智能体场景下的算力重构需求
Vera是英伟达面向下一代智能体工作负载打造的首款定制化中央处理器,其核心使命在于应对模型需自主执行代码、调用工具、维持长时上下文并进行多步推理的复杂任务。尽管GPU承担主要计算负载,但协调机制如沙箱管理、数据传输与工具调用仍依赖高效能CPU支持。
该芯片集成88个定制Olympus核心,提供高达1.2 TB/s的内存带宽,单核峰值性能相较传统架构提升50%。英伟达强调,当前大模型正从“问答式响应”转向“生成解决方案”的动态模式,尤其在需要编写Python脚本以达成目标的场景中,对高性能异构计算的需求呈指数级增长。
Vera还将作为英伟达Vera Rubin NVL72系统中的主控处理器,通过第二代NVLink-C2C实现与Rubin GPU的统一内存连接,整体能效较传统方案提升一倍。黄仁勋在2024年三月的GTC大会上首次披露该产品,称其将成为公司未来数十年收入增长的核心引擎之一。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
