NVIDIA 首款代理型 AI 专用 CPU Vera 正式交付，Anthropic、OpenAI 等头部实验室率先部署

2026/05/19 05:48阅读量 74

NVIDIA 于 3 月 GTC 发布的 Vera CPU 已于 5 月 18 日交付至 Anthropic、OpenAI、SpaceXAI 及 Oracle Cloud Infrastructure。Vera 配备 88 个自研 Olympus 核心、1.2 TB/s 内存带宽，专为代理型 AI 的编排、工具调用等实时任务设计，标志着该产品从发布进入生产阶段。

事件概述

NVIDIA 首款专为代理型 AI（Agentic AI）设计的独立 CPU——Vera，已从实验室进入客户手中。5 月 18 日，NVIDIA 副总裁 Ian Buck 亲自将首批 Vera CPU 系统交付给 Anthropic（旧金山）、OpenAI（Mission Bay）、SpaceXAI（帕洛阿尔托），并于 5 月 20 日交付给 Oracle Cloud Infrastructure（圣克拉拉）。

核心信息

设计理念：代理型 AI 要求基础设施同时处理沙盒、工具调用、编排、长上下文检索等大量 CPU 任务，传统核心密度型 CPU 无法胜任。Vera 为此类并发实时工作负载从头设计。
规格：88 个 NVIDIA 自研 Olympus 核心，1.2 TB/s 内存带宽，满负载下每核心性能提升 50%，可加速整个 AI 工厂中各类任务的完成速度。
交付现场：
- Anthropic：计算负责人 James Bradbury 表示“扩展计算是模型增长的重要加速器，很高兴看到 Vera 成为代理型工作负载生态中有前景的部分”。
- OpenAI：计算基础设施负责人 Sachin Katti 接收了系统，Ian Buck 现场展示了内部结构。
- SpaceXAI：Elon Musk 询问了核心、内存布局和散热细节。SpaceXAI 正评估 Vera 用于强化学习工作负载和基于代理的模拟训练管道。
- Oracle Cloud Infrastructure：OCI 计划从 2026 年起部署数十万个 Vera CPU。OCI 产品管理负责人 Karan Batta 表示“Vera 架构专为高吞吐推理工作负载设计，提供 OCI 所需效率、密度和占用空间”。OCI 是首个大规模部署 Vera 的云提供商。
其他说明：Vera 同时也是 Vera Rubin NVL72 的主机处理器，通过第二代 NVLink-C2C 与 Rubin GPU 连接，共享统一内存架构，提供传统基础设施两倍的能效。

值得关注

Vera 的交付标志着代理型 AI 基础设施从概念进入实际生产。NVIDIA 称其为“新的 CPU 时刻”，旨在应对模型从“回答”到“行动”的转变。该 CPU 与 Rubin GPU、BlueField 4 DPU、Spectrum-X 和 MGX 机架架构共同构成 NVIDIA 的极致协同设计体系。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？