NVIDIA与AWS深化合作:GPU加速推理、向量搜索与训练性能全面升级

2026/06/24 08:05阅读量 2

NVIDIA与AWS联合推出基于RTX PRO 4500 Blackwell GPU的EC2 G7实例,AI推理性能提升达4.6倍;OpenSearch Serverless默认启用NVIDIA cuVS进行GPU加速向量索引,速度提升10倍、成本降低75%;AWS获得NVIDIA GB300 Exemplar Cloud认证,确保大规模训练性能达到参考架构标准。

事件概述

NVIDIA与AWS宣布多项合作,旨在降低企业大规模部署AI的生产门槛。更新涵盖计算层(EC2 G7实例)、检索层(OpenSearch Serverless默认GPU向量索引)以及训练层(AWS获GB300 Exemplar Cloud认证),三项进展协同强化AI基础设施的每一层。

核心信息

1. Amazon EC2 G7实例:搭载NVIDIA RTX PRO 4500 Blackwell Server Edition GPU

  • 性能提升:相较G6实例,AI推理性能提升至4.6倍,图形性能提升2.1倍,并借助NVIDIA cuDF库在Amazon EMR上显著加速Spark工作负载的数据分析。
  • 配置规格:单实例最多支持8颗GPU,总显存256GB,700 Gbps EFA网络,最高7.6TB本地NVMe SSD存储;提供1、2、4、8 GPU及裸金属配置。
  • 适用场景:AI推理、图形渲染、视频处理、模拟/CAD、虚拟桌面、游戏、空间计算,以及GPU加速数据分析与向量数据库工作负载。
  • 集成支持:可通过AWS Deep Learning AMI、Deep Learning Containers、Amazon EMR、EKS、ECS及图形AMI使用,即将支持Amazon SageMaker AI。

2. NVIDIA cuVS让GPU加速向量搜索成为Amazon OpenSearch Serverless默认选项

  • 新一代OpenSearch Serverless以NVIDIA cuVS库驱动的GPU向量索引作为所有向量集合的默认计算方式。
  • 实际收益:向量索引构建速度最高提升10倍,成本仅为纯CPU方案的1/4;可在1小时内构建十亿级向量数据库。
  • 团队构建RAG、语义搜索、推荐系统和智能体AI应用时,无需额外优化即可获得GPU级检索性能,且服务无服务器弹性伸缩,闲置时减少运维开销。

3. AWS获NVIDIA GB300 Exemplar Cloud认证

  • AWS针对GB300训练工作负载通过NVIDIA参考架构的性能基准测试,成为Exemplar Cloud。
  • 该认证基于双方深度联合工程,确保开发者和AI负责人能够使用一致的高性能云基础设施进行大规模训练,帮助团队更可靠地评估云提供商、改善TCO并加速AI项目落地。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。