NVIDIA与微软联手打造统一加速计算栈,覆盖Windows桌面、云端与本地Agentic AI部署
2026/06/03 03:00阅读量 6
NVIDIA与微软在Microsoft Build大会上宣布多项合作,推出面向Windows的RTX Spark笔记本/DGX Station桌面超算、将NVIDIA加速计算集成至Microsoft Fabric数据仓库、开放模型上架Microsoft Foundry,并整合NVIDIA OpenShell运行时至GitHub Copilot。同时,微软Fairwater AI工厂已提前投产,并验证了NVIDIA Vera Rubin平台,支持更高吞吐和更低token成本。
事件概述
NVIDIA和微软在Microsoft Build 2026上宣布深化合作,为开发者提供从Windows设备到Azure云再到本地部署的统一加速计算栈,用于构建和运行agentic AI与physical AI应用。合作涉及硬件、模型、安全运行时、数据平台与基础设施等多个层面。
核心信息
-
Windows端新硬件:
- RTX Spark:专为个人agent设计的Windows笔记本/小型台式机,AI性能达1 PFLOPS,最高128GB统一内存,全电池续航,不插电仍保持完整AI和图形性能。搭载CUDA、RTX、DLSS、TensorRT等技术。秋季由微软Surface、华硕、戴尔、惠普、联想、微星推出。
- DGX Station for Windows:企业级桌面AI超算,基于NVIDIA GB300 Grace Blackwell Ultra桌面超级芯片,最高748GB一致性内存、20 PFLOPS FP4性能,可运行万亿参数模型。预计Q4由华硕、戴尔、技嘉、惠普、微星、超微推出。
- 两者均运行NVIDIA OpenShell安全运行时。
-
企业级AI工作流:
- NVIDIA开放模型(包括Nemotron 3 Ultra、Nemotron 3.5 ASR、Nemotron 3.5 Content Safety)上架Microsoft Foundry。Nemotron 3 Ultra用于长链推理(编码、研究、企业工作流),本月可用。
- Anthropic Claude模型原生运行在NVIDIA GB300 Blackwell Ultra系统上(Azure),数周内上线。
- NVIDIA Cosmos 3(物理AI全模型)、Earth-2天气模型也通过Foundry或Planetary Computer Pro提供。
- NVIDIA Agent Toolkit和NemoClaw蓝图提供开源平台,CUDA-X库(cuDF、cuOpt、AI-Q、NeMo)作为领域技能供agent调用。
-
数据层加速:
- NVIDIA加速计算集成到Microsoft Fabric Data Warehouse,微软内部基准测试显示SQL执行速度比纯CPU基线快6倍,比三家领先云数据仓库提供商快7倍(高并发场景)。
-
物理AI与自主系统:
- 微软整合NVIDIA开源物理AI技能与工具,通过Cosmos 3的混合变换器架构在Azure上模拟、训练和部署机器人、自动驾驶等系统。Cosmos 3在视觉推理、世界生成和动作生成基准中排名第一。
-
本地与混合部署:
- Microsoft Foundry Local on Azure Local现支持NVIDIA RTX PRO 6000 Blackwell Server Edition平台,配合Nemotron模型,支持多节点部署和vLLM运行时,适用于制造、能源、主权数据中心等场景。
-
GitHub Copilot安全集成:
- NVIDIA OpenShell集成至GitHub Copilot,agent在沙箱容器中运行,每次外部调用需符合策略(代码化策略,可实时更新)。开源Apache 2.0,模型无关。
-
AI工厂与新一代GPU:
- 微软Fairwater Wisconsin AI工厂已提前投产,运行数十万NVIDIA Grace Blackwell系统,与Georgia工厂连接,组成分布式AI系统。采用Spectrum-X以太网和MRC传输协议优化token经济。
- 微软已验证NVIDIA Vera Rubin平台(已全面投产),可无缝替换Blackwell,每百万瓦推理吞吐量提升10倍,每agent token成本降低一个数量级。内置NVIDIA机密计算保护模型和数据。
- NVIDIA Dynamo推理框架扩展至软件层面,通过NVIDIA Grove在AKS上加速模型冷启动,提供Kubernetes原生分布式推理编排。
