黄仁勋GTC 2026演讲:定义未来十年计算模式,英伟达发布AI PC、Vera Rubin、开源模型等
2026/06/01 17:41阅读量 3
黄仁勋在GTC 2026上提出“计算即收入”,核心发布包括与微软联合设计的AI PC笔记本RTX Spark、专为Agent时代设计的Vera Rubin超级计算机系统、开源模型Nemotron 3 Ultra以及物理AI Cosmos 3和参考人形机器人Isaac GR00T。这些产品共同勾勒出从传统PC到AI Agent和AI工厂的未来十年计算转型方向。
事件概述
英伟达CEO黄仁勋在GTC 2026上发表主题演讲,系统阐述了对未来十年计算模式的判断,并发布四大核心产品:RTX Spark AI PC、Vera Rubin AI超级计算机、Nemotron 3 Ultra开源大模型、Cosmos 3物理AI及Isaac GR00T人形机器人参考平台。他强调“计算就是收入,瓦特就是收入,每一个token都是收入”,认为AI已进入可盈利阶段,数据中心正从传统架构转向AI工厂模式。
核心信息
1. AI PC:RTX Spark
- 英伟达与微软、联发科合作推出RTX Spark笔记本,搭载N1X芯片(Blackwell RTX GPU + 20核Grace CPU)、128GB统一内存、台积电3nm工艺。
- 可在本地运行Agent(AI助手),无需依赖云端;支持CUDA、RTX应用,以及Windows生态。
- 微软做了深度平台优化,包括工作负载调度、电源管理、统一内存管理。
- 演示中Agent自动完成建筑设计方案(使用Rhino、Blender等工具),全程自主执行。
- 桌面/工作站版本DGX Spark拥有768GB内存、20 petaflops算力、8TB/s带宽。
- 华硕、戴尔、惠普、联想、微软Surface等厂商将在秋季推出相关机型。
2. AI超级计算机:Vera Rubin
- Vera Rubin NVL72是五机架规模的AI系统,专为Agent工作负载设计,包含:
- Vera Rubin NVL72:负责提示理解、推理、规划(“大脑”)。
- Vera CPU机架:256颗Vera CPU,协调模型与工具调用。
- Groq 3 LPX机架:256个Groq 3 LPU,低延迟token生成。
- BlueField-4 STX存储机架:Agent记忆存储。
- Spectrum-X以太网CPO网络机架:共封装光学交换机,能效提升5倍,AI正常运行时间延长5倍。
- 基于台积电3nm、CoWoS-L封装,HBM内存来自美光、SK海力士、三星。
- 与上一代Grace Blackwell相比,Agent吞吐量提升10倍。
- 机架组装时间从2小时缩短至5分钟,全液冷、模块化。
- BlueField-4 DPU实现800Gb/s加密、多租户隔离、机密计算。
- 英伟达DSX平台提供从仿真(DSX Sim)到运营(DSX OS)再到能效优化(DSX Max-Q)的全套工具。
- 生产出货2026年秋季开始。
3. 开源大模型:Nemotron 3 Ultra
- 专门面向Agent工作负载的开源模型,采用SSM(状态空间模型)+ MoE(专家混合)混合架构。
- 速度比同类模型快近5倍,运行成本降低约30%。
- 完全开源:模型、训练脚本和数据。
- 案例:与Cadence合作制作芯片设计AI助手,将验证周期从几周压缩到几小时。
4. 物理AI:Cosmos 3 与 Isaac GR00T
- Cosmos 3是世界模型,可理解视频内容,根据文字/图片生成符合物理规律的新视频,解决机器人训练数据稀缺问题。
- Isaac GR00T是人形机器人参考平台,包含机器人本体、Jetson Thor计算平台、仿真工具(Isaac Lab、Omniverse)、远程操控工具(Isaac Teleop)、训练评估环境、部署工具(Isaac ROS)。
- 机器人身高约6英尺、体重150磅,25个身体自由度、每手31个自由度。
值得关注
- 黄仁勋认为未来十年PC将彻底变革,从“打开应用点击鼠标”变为“直接告诉Agent完成任务”。
- AI工厂投资规模预计每千兆瓦800亿–1000亿美元,英伟达从GPU公司转型为系统公司,再转型为基础设施公司,提供DSX蓝图。
- 开源策略:Nemotron 3 Ultra不仅开源模型,还开源训练数据,鼓励社区在此基础上改进。
- 物理AI和机器人的数据生成是最大难点,Cosmos 3通过计算生成合成数据来弥补真实数据不足。
