NVIDIA与微软联手打造统一加速计算栈，覆盖Windows桌面、云端与本地Agentic AI部署

2026/06/03 03:00阅读量 6

NVIDIA与微软在Microsoft Build大会上宣布多项合作，推出面向Windows的RTX Spark笔记本/DGX Station桌面超算、将NVIDIA加速计算集成至Microsoft Fabric数据仓库、开放模型上架Microsoft Foundry，并整合NVIDIA OpenShell运行时至GitHub Copilot。同时，微软Fairwater AI工厂已提前投产，并验证了NVIDIA Vera Rubin平台，支持更高吞吐和更低token成本。

事件概述

NVIDIA和微软在Microsoft Build 2026上宣布深化合作，为开发者提供从Windows设备到Azure云再到本地部署的统一加速计算栈，用于构建和运行agentic AI与physical AI应用。合作涉及硬件、模型、安全运行时、数据平台与基础设施等多个层面。

核心信息

Windows端新硬件：
- RTX Spark：专为个人agent设计的Windows笔记本/小型台式机，AI性能达1 PFLOPS，最高128GB统一内存，全电池续航，不插电仍保持完整AI和图形性能。搭载CUDA、RTX、DLSS、TensorRT等技术。秋季由微软Surface、华硕、戴尔、惠普、联想、微星推出。
- DGX Station for Windows：企业级桌面AI超算，基于NVIDIA GB300 Grace Blackwell Ultra桌面超级芯片，最高748GB一致性内存、20 PFLOPS FP4性能，可运行万亿参数模型。预计Q4由华硕、戴尔、技嘉、惠普、微星、超微推出。
- 两者均运行NVIDIA OpenShell安全运行时。
企业级AI工作流：
- NVIDIA开放模型（包括Nemotron 3 Ultra、Nemotron 3.5 ASR、Nemotron 3.5 Content Safety）上架Microsoft Foundry。Nemotron 3 Ultra用于长链推理（编码、研究、企业工作流），本月可用。
- Anthropic Claude模型原生运行在NVIDIA GB300 Blackwell Ultra系统上（Azure），数周内上线。
- NVIDIA Cosmos 3（物理AI全模型）、Earth-2天气模型也通过Foundry或Planetary Computer Pro提供。
- NVIDIA Agent Toolkit和NemoClaw蓝图提供开源平台，CUDA-X库（cuDF、cuOpt、AI-Q、NeMo）作为领域技能供agent调用。
数据层加速：
- NVIDIA加速计算集成到Microsoft Fabric Data Warehouse，微软内部基准测试显示SQL执行速度比纯CPU基线快6倍，比三家领先云数据仓库提供商快7倍（高并发场景）。
物理AI与自主系统：
- 微软整合NVIDIA开源物理AI技能与工具，通过Cosmos 3的混合变换器架构在Azure上模拟、训练和部署机器人、自动驾驶等系统。Cosmos 3在视觉推理、世界生成和动作生成基准中排名第一。
本地与混合部署：
- Microsoft Foundry Local on Azure Local现支持NVIDIA RTX PRO 6000 Blackwell Server Edition平台，配合Nemotron模型，支持多节点部署和vLLM运行时，适用于制造、能源、主权数据中心等场景。
GitHub Copilot安全集成：
- NVIDIA OpenShell集成至GitHub Copilot，agent在沙箱容器中运行，每次外部调用需符合策略（代码化策略，可实时更新）。开源Apache 2.0，模型无关。
AI工厂与新一代GPU：
- 微软Fairwater Wisconsin AI工厂已提前投产，运行数十万NVIDIA Grace Blackwell系统，与Georgia工厂连接，组成分布式AI系统。采用Spectrum-X以太网和MRC传输协议优化token经济。
- 微软已验证NVIDIA Vera Rubin平台（已全面投产），可无缝替换Blackwell，每百万瓦推理吞吐量提升10倍，每agent token成本降低一个数量级。内置NVIDIA机密计算保护模型和数据。
- NVIDIA Dynamo推理框架扩展至软件层面，通过NVIDIA Grove在AKS上加速模型冷启动，提供Kubernetes原生分布式推理编排。

阅读原文详情

事件概述

核心信息

准备好启动您的定制项目了吗？