NVIDIA DSX Air:以高保真仿真重塑AI工厂部署,将首Token时间从数月缩短至数天
NVIDIA在GTC 2026上推出DSX Air平台,作为DSX Sim的一部分,允许企业在硬件交付前对AI工厂的计算、网络、存储及编排进行全栈逻辑仿真。该平台通过构建数字孪生环境,帮助CoreWeave、Siam.AI等合作伙伴提前验证架构与集成,显著降低试错成本。这一模式将AI基础设施的首Token生成时间从传统的数周或数月压缩至数天甚至数小时,确立了仿真作为现代AI工厂运营核心的新范式。
事件概述
NVIDIA于2026年3月16日在GTC大会上正式推出NVIDIA DSX Air。作为NVIDIA DSX(AI工厂蓝图)平台中DSX Sim模块的组成部分,DSX Air是一款基于软件即服务(SaaS)的逻辑仿真平台。它旨在为AI工厂提供高保真的数字仿真环境,涵盖GPU、SuperNIC、DPUs和交换机等硬件基础设施,并通过开放的API连接整合存储、路由、安全及编排等第三方合作伙伴解决方案。
该平台的核心理念是“先仿真,后部署”。企业可在服务器开箱前,利用经过验证的参考架构模拟复杂的AI工厂部署场景,从而将集成和故障排查阶段前置到虚拟环境中。
核心功能与价值
- 全栈数字孪生:支持构建包含计算、网络、存储、编排和安全在内的完整AI工厂数字副本。用户可在此环境中配置并验证所有组件的协同工作,确保生产环境行为符合预期。
- 加速首Token时间(Time to Token):通过将集成和调试工作转移至仿真阶段,部署周期从传统的数周或数月大幅缩短至数天甚至数小时。这不仅降低了时间成本,还显著减少了因硬件问题导致的资金浪费。
- 生态系统级验证:服务器制造商、编排供应商、存储提供商及安全厂商均可在统一环境中验证其解决方案与NVIDIA基础设施的兼容性,无需搭建昂贵的物理实验室。
合作伙伴案例与应用场景
多家行业领先企业已率先采用DSX Air进行环境验证与优化:
- CoreWeave:正在使用DSX Air在硬件到达之前模拟和验证其先进AI基础设施环境。
- Siam.AI(泰国最大AI云服务商):利用仿真提前采纳NVIDIA最佳实践,在物理硬件抵达前完成架构验证,确保上线首日即可具备运营能力。
- Hydra Host:用于开发Brokkr操作系统(用于裸金属GPU供应),通过在DSX Air中模拟全栈环境,验证了其在不同网络和硬件配置下的自动化与编排工作流。
关键演示与技术细节
在GTC 2026现场,DSX Air展示了多个复杂场景的仿真运行能力:
- 多租户编排:展示了完全在仿真中运行的多租户RTX PRO Server环境,其中Netris负责网络编排,Rafay负责主机编排,NVIDIA Run:ai优化GPU分配。
- 数据平台验证:演示了在VAST AI操作系统上运行的视频检索增强生成(RAG)工作负载,包括完整的VAST集群、DataEngine节点及前端搜索界面,展示了端到端的数据处理流程。
- 安全策略测试:集成了Check Point分布式防火墙(运行于模拟BlueField DPU上)、TrendAI Vision One威胁检测以及Keysight Cyperf生成的逼真流量,用于在多租户策略和DPU加速隔离方面进行漏洞识别与策略验证。
运营模式变革
DSX Air不仅加速部署,更引入了一种新的AI工厂运维模型:
- 构建期:在仿真中完全构建目标生产环境,精确配置各项参数并早期发现潜在问题。
- 部署期:由于环境已在全链路测试过,部署成功率大幅提升,团队可专注于业务负载而非基础设施排障。
- 运维期:仿真环境成为变更管理的“沙盒”,用于测试升级、维护窗口演练、补丁验证及预测操作影响。仅在仿真验证成功后,变更才会应用到生产环境,从而最大化系统可用性。
随着AI工厂规模与复杂度的增加,这种“仿真优先”的方法已成为定义创新速度的关键因素,使组织能够以最快速度实现首Token生成,并建立更可靠的长期运营体系。
