NVIDIA 首款代理型 AI 专用 CPU Vera 正式交付,Anthropic、OpenAI 等头部实验室率先部署
2026/05/19 05:48阅读量 74
NVIDIA 于 3 月 GTC 发布的 Vera CPU 已于 5 月 18 日交付至 Anthropic、OpenAI、SpaceXAI 及 Oracle Cloud Infrastructure。Vera 配备 88 个自研 Olympus 核心、1.2 TB/s 内存带宽,专为代理型 AI 的编排、工具调用等实时任务设计,标志着该产品从发布进入生产阶段。
事件概述
NVIDIA 首款专为代理型 AI(Agentic AI)设计的独立 CPU——Vera,已从实验室进入客户手中。5 月 18 日,NVIDIA 副总裁 Ian Buck 亲自将首批 Vera CPU 系统交付给 Anthropic(旧金山)、OpenAI(Mission Bay)、SpaceXAI(帕洛阿尔托),并于 5 月 20 日交付给 Oracle Cloud Infrastructure(圣克拉拉)。
核心信息
- 设计理念:代理型 AI 要求基础设施同时处理沙盒、工具调用、编排、长上下文检索等大量 CPU 任务,传统核心密度型 CPU 无法胜任。Vera 为此类并发实时工作负载从头设计。
- 规格:88 个 NVIDIA 自研 Olympus 核心,1.2 TB/s 内存带宽,满负载下每核心性能提升 50%,可加速整个 AI 工厂中各类任务的完成速度。
- 交付现场:
- Anthropic:计算负责人 James Bradbury 表示“扩展计算是模型增长的重要加速器,很高兴看到 Vera 成为代理型工作负载生态中有前景的部分”。
- OpenAI:计算基础设施负责人 Sachin Katti 接收了系统,Ian Buck 现场展示了内部结构。
- SpaceXAI:Elon Musk 询问了核心、内存布局和散热细节。SpaceXAI 正评估 Vera 用于强化学习工作负载和基于代理的模拟训练管道。
- Oracle Cloud Infrastructure:OCI 计划从 2026 年起部署数十万个 Vera CPU。OCI 产品管理负责人 Karan Batta 表示“Vera 架构专为高吞吐推理工作负载设计,提供 OCI 所需效率、密度和占用空间”。OCI 是首个大规模部署 Vera 的云提供商。
- 其他说明:Vera 同时也是 Vera Rubin NVL72 的主机处理器,通过第二代 NVLink-C2C 与 Rubin GPU 连接,共享统一内存架构,提供传统基础设施两倍的能效。
值得关注
Vera 的交付标志着代理型 AI 基础设施从概念进入实际生产。NVIDIA 称其为“新的 CPU 时刻”,旨在应对模型从“回答”到“行动”的转变。该 CPU 与 Rubin GPU、BlueField 4 DPU、Spectrum-X 和 MGX 机架架构共同构成 NVIDIA 的极致协同设计体系。
