英伟达GTC 2026:从芯片到太空,构建万亿级AI基础设施版图
在GTC 2026 keynote上,黄仁勋宣布英伟达目标是在2025至2027年间实现超1万亿美元的AI芯片营收,将业务从单一硬件销售扩展至全栈AI基础设施。公司发布了由七颗核心芯片组成的Vera Rubin超级计算平台,并收购Groq以强化推理能力,同时推出NemoClaw、Nemotron联盟及DSX Air数字孪生系统覆盖智能体与数据中心运营。此外,英伟达还宣布进军太空计算领域,发布Space-1 Vera Rubin Module,旨在将高性能AI算力部署至轨道环境。
事件概述
在GTC 2026大会上,英伟达(NVIDIA)展示了其从芯片制造商向全栈AI基础设施提供商转型的战略蓝图。CEO黄仁勋提出,AI时代“token是新的货币”,AI工厂是生产基础,并设定了2025年至2027年AI芯片营收超过1万亿美元的目标。此次发布会涵盖了训练、推理、智能体、自动驾驶、机器人及太空计算等全场景解决方案。
核心信息
1. 硬件架构升级:Vera Rubin与Groq融合
- Vera Rubin平台:由七颗芯片组成协同工作的超级计算机,包括Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换芯片以及新整合的Groq 3 LPU。
- NVL72机架:集成72颗Rubin GPU和36颗Vera CPU。相比上一代Blackwell平台,训练大型混合专家模型所需的GPU数量减少至四分之一,推理吞吐量每瓦提升10倍,每token成本降至十分之一。
- Groq LPU登场:英伟达于2025年底以200亿美元收购Groq核心资产。Groq 3 LPU专为推理中的decode(解码)阶段设计,内置500MB SRAM,带宽达150TB/s(约为Rubin GPU HBM带宽的7倍)。
- 组合优势:Rubin GPU负责prefill(预填充/读题),Groq LPU负责decode(写答案)。该组合在万亿参数模型上可实现每兆瓦推理吞吐量提升35倍。
- 未来规划:预告下一代Kyber架构,将搭载于2027年出货的Vera Rubin Ultra上。
2. 智能体与开源生态:NemoClaw与Nemotron联盟
- NemoClaw:基于OpenClaw优化的英伟达智能体框架,通过OpenShell提供安全沙箱和策略护栏。采用混合架构,本地运行Nemotron处理隐私任务,云端调用前沿模型处理复杂请求,支持GeForce RTX电脑、工作站及DGX系列超级计算机。
- Nemotron联盟:联合Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity等机构,共同训练开源基础模型。首个项目由Mistral AI与英伟达联合开发,将在DGX Cloud上训练并开源,作为Nemotron 4模型家族的基础。
3. 行业应用拓展
- 自动驾驶:比亚迪、吉利、日产、五十铃接入DRIVE Hyperion平台开发L4级车辆;Uber计划2028年前在28个城市部署全栈英伟达自动驾驶车队。发布Alpamayo 1.5模型,支持通过自然语言提示调整驾驶行为。
- AI工厂数字孪生:推出DSX Air SaaS平台,允许客户在硬件到货前模拟完整AI工厂。配合CoreWeave等合作伙伴,可将部署时间从数月缩短至数小时。发布DSX Max-Q技术,可在固定电力下多部署30%设施;DSX Flex软件可释放100吉瓦闲置电网容量。
- 存储革新:发布BlueField-4 STX架构及CMX上下文记忆存储平台,解决Agent跨步骤记忆需求。相比传统存储,CMX提供5倍每秒token吞吐量、4倍能效提升和2倍数据摄取速度。
4. 图形与游戏:DLSS 5
- 技术突破:引入实时神经渲染模型,不仅提升帧率,更注入照片级真实的光照和材质效果(如头发、布料、半透明皮肤及复杂光照)。
- 支持厂商:Bethesda、CAPCOM、育碧、腾讯、网易等已确认支持,预计今年秋季推出。
5. 太空计算:最后的边疆
- Space-1 Vera Rubin Module:面向轨道数据中心的计算模块,采用紧凑CPU-GPU架构,专为太空SWaP(尺寸、重量、功耗)限制设计。相比H100,在太空推理场景下提供25倍算力提升,可直接运行大语言模型。
- 配套平台:IGX Thor(工业级边缘环境)和Jetson Orin(卫星视觉与导航)已投入使用;RTX PRO 6000 Blackwell Server Edition用于地面地理空间情报处理,分析速度是传统CPU系统的100倍。
