英伟达GTC 2026：从芯片到太空，构建万亿级AI基础设施版图

2026/03/17 12:02阅读量 48

在GTC 2026 keynote上，黄仁勋宣布英伟达目标是在2025至2027年间实现超1万亿美元的AI芯片营收，将业务从单一硬件销售扩展至全栈AI基础设施。公司发布了由七颗核心芯片组成的Vera Rubin超级计算平台，并收购Groq以强化推理能力，同时推出NemoClaw、Nemotron联盟及DSX Air数字孪生系统覆盖智能体与数据中心运营。此外，英伟达还宣布进军太空计算领域，发布Space-1 Vera Rubin Module，旨在将高性能AI算力部署至轨道环境。

事件概述

在GTC 2026大会上，英伟达（NVIDIA）展示了其从芯片制造商向全栈AI基础设施提供商转型的战略蓝图。CEO黄仁勋提出，AI时代“token是新的货币”，AI工厂是生产基础，并设定了2025年至2027年AI芯片营收超过1万亿美元的目标。此次发布会涵盖了训练、推理、智能体、自动驾驶、机器人及太空计算等全场景解决方案。

核心信息

1. 硬件架构升级：Vera Rubin与Groq融合

Vera Rubin平台：由七颗芯片组成协同工作的超级计算机，包括Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换芯片以及新整合的Groq 3 LPU。
NVL72机架：集成72颗Rubin GPU和36颗Vera CPU。相比上一代Blackwell平台，训练大型混合专家模型所需的GPU数量减少至四分之一，推理吞吐量每瓦提升10倍，每token成本降至十分之一。
Groq LPU登场：英伟达于2025年底以200亿美元收购Groq核心资产。Groq 3 LPU专为推理中的decode（解码）阶段设计，内置500MB SRAM，带宽达150TB/s（约为Rubin GPU HBM带宽的7倍）。
组合优势：Rubin GPU负责prefill（预填充/读题），Groq LPU负责decode（写答案）。该组合在万亿参数模型上可实现每兆瓦推理吞吐量提升35倍。
未来规划：预告下一代Kyber架构，将搭载于2027年出货的Vera Rubin Ultra上。

2. 智能体与开源生态：NemoClaw与Nemotron联盟

NemoClaw：基于OpenClaw优化的英伟达智能体框架，通过OpenShell提供安全沙箱和策略护栏。采用混合架构，本地运行Nemotron处理隐私任务，云端调用前沿模型处理复杂请求，支持GeForce RTX电脑、工作站及DGX系列超级计算机。
Nemotron联盟：联合Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity等机构，共同训练开源基础模型。首个项目由Mistral AI与英伟达联合开发，将在DGX Cloud上训练并开源，作为Nemotron 4模型家族的基础。

3. 行业应用拓展

自动驾驶：比亚迪、吉利、日产、五十铃接入DRIVE Hyperion平台开发L4级车辆；Uber计划2028年前在28个城市部署全栈英伟达自动驾驶车队。发布Alpamayo 1.5模型，支持通过自然语言提示调整驾驶行为。
AI工厂数字孪生：推出DSX Air SaaS平台，允许客户在硬件到货前模拟完整AI工厂。配合CoreWeave等合作伙伴，可将部署时间从数月缩短至数小时。发布DSX Max-Q技术，可在固定电力下多部署30%设施；DSX Flex软件可释放100吉瓦闲置电网容量。
存储革新：发布BlueField-4 STX架构及CMX上下文记忆存储平台，解决Agent跨步骤记忆需求。相比传统存储，CMX提供5倍每秒token吞吐量、4倍能效提升和2倍数据摄取速度。

4. 图形与游戏：DLSS 5

技术突破：引入实时神经渲染模型，不仅提升帧率，更注入照片级真实的光照和材质效果（如头发、布料、半透明皮肤及复杂光照）。
支持厂商：Bethesda、CAPCOM、育碧、腾讯、网易等已确认支持，预计今年秋季推出。

5. 太空计算：最后的边疆

Space-1 Vera Rubin Module：面向轨道数据中心的计算模块，采用紧凑CPU-GPU架构，专为太空SWaP（尺寸、重量、功耗）限制设计。相比H100，在太空推理场景下提供25倍算力提升，可直接运行大语言模型。
配套平台：IGX Thor（工业级边缘环境）和Jetson Orin（卫星视觉与导航）已投入使用；RTX PRO 6000 Blackwell Server Edition用于地面地理空间情报处理，分析速度是传统CPU系统的100倍。

阅读原文详情