NVIDIA与Google Cloud深化合作:构建支持代理与物理AI的下一代基础设施
2026/04/22 20:00阅读量 2
NVIDIA与Google Cloud在Google Cloud Next大会上宣布深化合作,推出基于NVIDIA Vera Rubin架构的A5X裸金属实例及Blackwell Ultra GPU预览版,旨在打造可扩展至近百万GPU的AI工厂。双方联合推出的Gemini企业智能体平台集成NVIDIA Nemotron模型与NeMo框架,支持安全、高效的代理AI开发与训练。此外,通过Omniverse和Isaac Sim等工具,该合作正加速工业数字孪生与实体机器人从仿真到生产落地的进程。
事件概述
NVIDIA与Google Cloud在拉斯维加斯举行的Google Cloud Next大会上宣布达成新里程碑,双方将共同扩展Google Cloud AI Hypercomputer,以支持下一代代理AI(Agentic AI)和物理AI(Physical AI)的生产化部署。此次合作涵盖了从底层硬件到上层应用的全栈技术整合,旨在帮助开发者和企业将复杂的AI工作流从实验室推向实际生产环境。
核心信息
1. 下一代基础设施:从Blackwell到Vera Rubin
- A5X裸金属实例:基于NVIDIA Vera Rubin NVL72机架系统,通过芯片、系统和软件的深度协同设计,实现每令牌推理成本降低10倍,每兆瓦令牌吞吐量提升10倍。
- 超大规模扩展能力:单站点集群可容纳高达80,000个NVIDIA Rubin GPU,多站点集群可扩展至近960,000个Rubin GPU。系统将采用NVIDIA ConnectX-9 SuperNIC与新一代Google Virgo网络互联。
- 现有Blackwell产品组合:包括A4 VM(搭载HGX B200)、A4X VM(搭载GB200 NVL72及GB300 NVL72)以及G4 VM(搭载RTX PRO 6000 Blackwell Server Edition)。客户可根据需求灵活选择从单个GPU八分之一算力到数万GPU互联的多种配置。
2. 安全AI:主权与机密计算
- Google Distributed Cloud预览:Google Gemini模型可在运行NVIDIA Blackwell和Blackwell Ultra GPU的Google Distributed Cloud上进行预览,支持将前沿模型部署在敏感数据所在地。
- 机密计算:利用NVIDIA Blackwell平台的机密计算功能,确保提示词(Prompts)和微调数据在受保护环境中加密,防止包括基础设施运营商在内的未授权方查看或篡改。
- 公共云安全:推出了搭载NVIDIA RTX PRO 6000 Blackwell GPU的Confidential G4 VM预览版,为多租户环境提供同等的安全防护,满足受监管行业的需求。
3. 代理AI:开源模型与API优化
- Gemini Enterprise Agent Platform:集成NVIDIA Nemotron开源模型(如Nemotron 3 Super)和NeMo框架,为开发者提供发现、定制和部署代理工作流的直接路径。
- 强化学习(RL)训练:引入基于NVIDIA NeMo RL的新管理强化学习API,自动化集群规模调整、故障恢复和作业执行,加速大规模RL训练。
- 行业案例:网络安全公司CrowdStrike利用NVIDIA NeMo库生成合成数据并微调Nemotron模型,用于特定领域的威胁检测与响应。
4. 工业与物理AI的未来
- 工业软件集成:Cadence和Siemens Digital Industries Software等厂商的解决方案已在Google Cloud上可用,并针对NVIDIA AI基础设施进行了加速。
- 数字孪生与机器人仿真:通过Google Cloud Marketplace提供的NVIDIA Omniverse库和开源NVIDIA Isaac Sim框架,开发者可构建高保真数字孪生体,并在部署前对机器人进行训练、模拟和验证。
- 边缘与云端部署:NVIDIA NIM微服务(如Cosmos Reason 2)可部署至Google Vertex AI和Google Kubernetes Engine,使机器人和视觉AI代理具备类似人类的感知、推理和行动能力。
值得关注
- 生态影响力:超过90,000名开发者在一年内加入了NVIDIA与Google Cloud的联合开发者社区。Snap、Schrödinger、Salesforce等企业已利用该平台缩短药物研发周期、降低测试成本并优化数据管道。
- 合作伙伴荣誉:NVIDIA凭借深厚的技术专长和市场协同,在Google Cloud Next上荣获“年度AI全球技术合作伙伴”和“年度基础设施现代化计算合作伙伴”两项大奖。
- 未来愿景:双方致力于构建云级平台,将实验性的代理和模拟转化为能够审查代码、保障车队安全、优化工厂的实际生产系统。
