微软在 NVIDIA GTC 发布 Foundry 新方案：强化 AI 代理、推理基础设施与物理智能

2026/03/17 05:21阅读量 22

微软在 NVIDIA GTC 大会上宣布扩展 Microsoft Foundry 能力，支持基于 NVIDIA 加速器和 Nemotron 模型构建生产级 AI 代理。Azure AI 基础设施成为首个部署下一代 NVIDIA Vera Rubin NVL72 系统的超大规模云平台，并推出针对推理密集型工作的优化方案。此外，微软深化了 Fabric 与 NVIDIA Omniverse 的集成，通过 Azure Physical AI Toolchain 推动物理智能从仿真到实地的落地应用。

事件概述

微软在 NVIDIA GTC 大会上展示了其在企业级 AI 领域的最新进展，重点围绕 Microsoft Foundry、Azure AI 基础设施以及**物理智能（Physical AI）**三大方向发布了新解决方案，旨在将加速计算与云规模工程相结合，助力客户实现从原型到生产的规模化 AI 部署。

核心信息

1. Microsoft Foundry 能力升级

Foundry Agent Service 全面可用：新一代 Foundry Agent Service 和 Foundry Control Plane 中的可观测性功能现已正式发布。该服务使团队能够快速开发具备推理、规划和行动能力的 AI 代理，并通过控制平面提供端到端的代理行为可见性，提升开发者效率与企业信任度。
语音交互集成：推出 Voice Live API 公共预览版，支持与 Foundry Agent Service 集成， enabling 开发者构建以语音为首的多模态实时代理体验。
安全与生态扩展：更新了 Microsoft Foundry 门户，并新增对 Palo Alto Networks Prisma AIRS 和 Zenity 的深度集成，覆盖代理全生命周期的运行时安全。
NVIDIA Nemotron 模型接入：NVIDIA Nemotron 模型现可通过 Microsoft Foundry 获取，进一步丰富了云端模型选择。同时，结合与 Fireworks AI 的合作，支持将开源权重模型微调为低延迟资产并分发至边缘端。

2. Azure AI 基础设施创新

Vera Rubin NVL72 首发部署：微软成为首个在实验室中启动 NVIDIA Vera Rubin NVL72 系统的超大规模云平台，并计划在未来数月内将其部署至现代化的液冷 Azure 数据中心。
液冷 GPU 规模化：过去一年内在全球数据中心部署了数十万块液冷 Grace Blackwell GPU，持续优化针对推理密集型和基于推理的工作负载的基础设施。
主权环境支持：推出 Azure Local 对 NVIDIA Vera Rubin 平台的初步支持，结合 Azure Arc 和 Foundry Local，确保在受控环境中也能获得一致的运营、治理和安全保障。

3. 物理智能（Physical AI）推进

工具链与蓝图整合：引入 Azure Physical AI Toolchain GitHub 仓库，集成 NVIDIA Physical AI Data Factory 及核心 Azure 服务，支持构建连接物理资产、仿真与云训练环境的可重复企业级流水线。
Fabric 与 Omniverse 深度集成：深化 Microsoft Fabric 与 NVIDIA Omniverse 库的连接，实现实时运营数据与高保真数字孪生及仿真的对接，帮助组织实时监控物理系统状态并利用 AI 决策下一步行动。
应用场景落地：制造与运营等领域客户正利用该技术超越传统仪表盘与警报模式，实现跨机器、设施和流程的协调化 AI 驱动行动。

值得关注

此次更新标志着微软在企业级 AI 领域从“模型可用性”向“生产级可靠性”的关键跨越。通过硬件（NVIDIA）、平台（Foundry/Fabric）与基础设施（Azure）的深度融合，微软正在构建一套完整的 AI 操作系统，以支撑推理密集型、代理式及物理世界智能应用的规模化落地。

阅读原文详情