NVIDIA与微软联手打造统一加速计算栈,覆盖Windows桌面、云端与本地Agentic AI部署

2026/06/03 03:00阅读量 6

NVIDIA与微软在Microsoft Build大会上宣布多项合作,推出面向Windows的RTX Spark笔记本/DGX Station桌面超算、将NVIDIA加速计算集成至Microsoft Fabric数据仓库、开放模型上架Microsoft Foundry,并整合NVIDIA OpenShell运行时至GitHub Copilot。同时,微软Fairwater AI工厂已提前投产,并验证了NVIDIA Vera Rubin平台,支持更高吞吐和更低token成本。

事件概述

NVIDIA和微软在Microsoft Build 2026上宣布深化合作,为开发者提供从Windows设备到Azure云再到本地部署的统一加速计算栈,用于构建和运行agentic AI与physical AI应用。合作涉及硬件、模型、安全运行时、数据平台与基础设施等多个层面。

核心信息

  • Windows端新硬件

    • RTX Spark:专为个人agent设计的Windows笔记本/小型台式机,AI性能达1 PFLOPS,最高128GB统一内存,全电池续航,不插电仍保持完整AI和图形性能。搭载CUDA、RTX、DLSS、TensorRT等技术。秋季由微软Surface、华硕、戴尔、惠普、联想、微星推出。
    • DGX Station for Windows:企业级桌面AI超算,基于NVIDIA GB300 Grace Blackwell Ultra桌面超级芯片,最高748GB一致性内存、20 PFLOPS FP4性能,可运行万亿参数模型。预计Q4由华硕、戴尔、技嘉、惠普、微星、超微推出。
    • 两者均运行NVIDIA OpenShell安全运行时。
  • 企业级AI工作流

    • NVIDIA开放模型(包括Nemotron 3 Ultra、Nemotron 3.5 ASR、Nemotron 3.5 Content Safety)上架Microsoft Foundry。Nemotron 3 Ultra用于长链推理(编码、研究、企业工作流),本月可用。
    • Anthropic Claude模型原生运行在NVIDIA GB300 Blackwell Ultra系统上(Azure),数周内上线。
    • NVIDIA Cosmos 3(物理AI全模型)、Earth-2天气模型也通过Foundry或Planetary Computer Pro提供。
    • NVIDIA Agent Toolkit和NemoClaw蓝图提供开源平台,CUDA-X库(cuDF、cuOpt、AI-Q、NeMo)作为领域技能供agent调用。
  • 数据层加速

    • NVIDIA加速计算集成到Microsoft Fabric Data Warehouse,微软内部基准测试显示SQL执行速度比纯CPU基线快6倍,比三家领先云数据仓库提供商快7倍(高并发场景)。
  • 物理AI与自主系统

    • 微软整合NVIDIA开源物理AI技能与工具,通过Cosmos 3的混合变换器架构在Azure上模拟、训练和部署机器人、自动驾驶等系统。Cosmos 3在视觉推理、世界生成和动作生成基准中排名第一。
  • 本地与混合部署

    • Microsoft Foundry Local on Azure Local现支持NVIDIA RTX PRO 6000 Blackwell Server Edition平台,配合Nemotron模型,支持多节点部署和vLLM运行时,适用于制造、能源、主权数据中心等场景。
  • GitHub Copilot安全集成

    • NVIDIA OpenShell集成至GitHub Copilot,agent在沙箱容器中运行,每次外部调用需符合策略(代码化策略,可实时更新)。开源Apache 2.0,模型无关。
  • AI工厂与新一代GPU

    • 微软Fairwater Wisconsin AI工厂已提前投产,运行数十万NVIDIA Grace Blackwell系统,与Georgia工厂连接,组成分布式AI系统。采用Spectrum-X以太网和MRC传输协议优化token经济。
    • 微软已验证NVIDIA Vera Rubin平台(已全面投产),可无缝替换Blackwell,每百万瓦推理吞吐量提升10倍,每agent token成本降低一个数量级。内置NVIDIA机密计算保护模型和数据。
    • NVIDIA Dynamo推理框架扩展至软件层面,通过NVIDIA Grove在AKS上加速模型冷启动,提供Kubernetes原生分布式推理编排。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。