微软在 NVIDIA GTC 发布 Foundry 新方案:强化 AI 代理、推理基础设施与物理智能

微软在 NVIDIA GTC 大会上宣布扩展 Microsoft Foundry 能力,支持基于 NVIDIA 加速器和 Nemotron 模型构建生产级 AI 代理。Azure AI 基础设施成为首个部署下一代 NVIDIA Vera Rubin NVL72 系统的超大规模云平台,并推出针对推理密集型工作的优化方案。此外,微软深化了 Fabric 与 NVIDIA Omniverse 的集成,通过 Azure Physical AI Toolchain 推动物理智能从仿真到实地的落地应用。

事件概述

微软在 NVIDIA GTC 大会上展示了其在企业级 AI 领域的最新进展,重点围绕 Microsoft FoundryAzure AI 基础设施以及**物理智能(Physical AI)**三大方向发布了新解决方案,旨在将加速计算与云规模工程相结合,助力客户实现从原型到生产的规模化 AI 部署。

核心信息

1. Microsoft Foundry 能力升级

  • Foundry Agent Service 全面可用:新一代 Foundry Agent Service 和 Foundry Control Plane 中的可观测性功能现已正式发布。该服务使团队能够快速开发具备推理、规划和行动能力的 AI 代理,并通过控制平面提供端到端的代理行为可见性,提升开发者效率与企业信任度。
  • 语音交互集成:推出 Voice Live API 公共预览版,支持与 Foundry Agent Service 集成, enabling 开发者构建以语音为首的多模态实时代理体验。
  • 安全与生态扩展:更新了 Microsoft Foundry 门户,并新增对 Palo Alto Networks Prisma AIRS 和 Zenity 的深度集成,覆盖代理全生命周期的运行时安全。
  • NVIDIA Nemotron 模型接入:NVIDIA Nemotron 模型现可通过 Microsoft Foundry 获取,进一步丰富了云端模型选择。同时,结合与 Fireworks AI 的合作,支持将开源权重模型微调为低延迟资产并分发至边缘端。

2. Azure AI 基础设施创新

  • Vera Rubin NVL72 首发部署:微软成为首个在实验室中启动 NVIDIA Vera Rubin NVL72 系统的超大规模云平台,并计划在未来数月内将其部署至现代化的液冷 Azure 数据中心。
  • 液冷 GPU 规模化:过去一年内在全球数据中心部署了数十万块液冷 Grace Blackwell GPU,持续优化针对推理密集型和基于推理的工作负载的基础设施。
  • 主权环境支持:推出 Azure Local 对 NVIDIA Vera Rubin 平台的初步支持,结合 Azure Arc 和 Foundry Local,确保在受控环境中也能获得一致的运营、治理和安全保障。

3. 物理智能(Physical AI)推进

  • 工具链与蓝图整合:引入 Azure Physical AI Toolchain GitHub 仓库,集成 NVIDIA Physical AI Data Factory 及核心 Azure 服务,支持构建连接物理资产、仿真与云训练环境的可重复企业级流水线。
  • Fabric 与 Omniverse 深度集成:深化 Microsoft Fabric 与 NVIDIA Omniverse 库的连接,实现实时运营数据与高保真数字孪生及仿真的对接,帮助组织实时监控物理系统状态并利用 AI 决策下一步行动。
  • 应用场景落地:制造与运营等领域客户正利用该技术超越传统仪表盘与警报模式,实现跨机器、设施和流程的协调化 AI 驱动行动。

值得关注

此次更新标志着微软在企业级 AI 领域从“模型可用性”向“生产级可靠性”的关键跨越。通过硬件(NVIDIA)、平台(Foundry/Fabric)与基础设施(Azure)的深度融合,微软正在构建一套完整的 AI 操作系统,以支撑推理密集型、代理式及物理世界智能应用的规模化落地。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。