黄仁勋:AI需求呈抛物线式增长,Dell AI Factory升级Vera Rubin平台
2026/05/19 06:28阅读量 31
NVIDIA CEO黄仁勋在Dell Technologies World上表示,AI需求正经历“彻底的抛物线式增长”。戴尔与NVIDIA联合发布基于Vera Rubin NVL72的新一代AI工厂,包括PowerEdge XE9812服务器、Vera CPU及Dell PowerRack等产品,旨在降低推理成本、加速代理AI部署。多家企业如礼来、三星、霍尼韦尔已大规模部署该平台。
事件概述
Dell Technologies World上,Dell CEO Michael Dell与NVIDIA CEO Jensen Huang共同宣布Dell AI Factory with NVIDIA全面升级。Huang指出,AI已进入“有用AI”时代,需求呈现彻底的抛物线式增长,企业AI正从试点转向代理AI和大规模推理部署。
核心产品与技术更新
- Dell PowerEdge XE9812:基于NVIDIA Vera Rubin NVL72,面向大规模代理AI推理,每token成本较Blackwell降低10倍。
- Vera CPU:专为代理AI设计,单线程性能全球最高,内存带宽1.2 TB/s,处理代理工作负载比x86处理器快50%,企业数据查询(如Starburst)快3倍。
- Dell PowerRack:集成计算、网络与存储的一体化系统,支持100%直接液冷,简化企业级AI与HPC部署。
- 网络升级:Dell PowerSwitch系列搭配NVIDIA Quantum-X800 InfiniBand和Spectrum-6以太网,采用液冷共封装光学。
- Dell AI Data Platform with NVIDIA:集成加速数据引擎(cuDF、cuVS),支持结构化与非结构化数据。
关键数据与市场展望
- Michael Dell预测全球AI基础设施支出到2030年可达3–4万亿美元,同期token消耗量增长3400%。
- 戴尔内部调查显示,67%的AI工作负载运行于云外(本地、设备、边缘或托管),88%的受访者在本地运行至少一项AI工作负载。
- 目前已有5000家企业(如礼来、三星、霍尼韦尔)在Dell AI Factory上运行AI工作负载。
安全与模型部署
- 机密计算:基于NVIDIA Confidential Computing,结合Fortanix、Google、Red Hat等,支持在本地安全部署前沿模型,保护模型权重与企业数据。
- Google Distributed Cloud with Gemini 3.0 预览版已在Dell PowerEdge XE9780上可用,由Blackwell加速并受机密计算保护。
- SpaceXAI 将把最新模型通过机密计算部署至Dell AI Factory。
- 开源模型:NVIDIA Nemotron、Reflection、MiniMax-M2.7、DeepSeek-V4等模型已可在Dell Enterprise Hub上获取。
- OpenAI Codex 将集成Dell AI Data Platform,使Codex更贴近企业内上下文。
合作伙伴生态
- Palantir sovereign AI OS参考架构已在Dell基础设施上运行。
- ServiceNow客户可利用Dell AI Factory实现工作流自动化。
- 新增合作伙伴包括Fogsphere、Ipsotek、Mistral AI、Poolside、Uneeq等,安全方面与CrowdStrike和Fortanix合作。
从桌面到数据中心的代理AI
- Dell Deskside Agentic AI:基于NVIDIA NemoClaw、OpenShell和Nemotron,在Dell Pro Max(GB10/GB300)和Pro Precision(RTX PRO Blackwell)上运行。
- NVIDIA OpenShell 开源运行时现已支持整个Dell AI Factory,提供安全代理开发与部署环境。
- NVIDIA AI-Q Blueprint 提供多代理深度研究工作流参考示例。
后续议程
Dell COO Jeff Clarke将在大会第二日深入展示Vera CPU、Vera Rubin、机密计算及Nemotron的现场演示。这些成果也将为6月1–4日的GTC Taipei @ COMPUTEX铺垫。
