NVIDIA与AWS深化合作：GPU加速推理、向量搜索与训练性能全面升级

2026/06/24 08:05阅读量 2

NVIDIA与AWS联合推出基于RTX PRO 4500 Blackwell GPU的EC2 G7实例，AI推理性能提升达4.6倍；OpenSearch Serverless默认启用NVIDIA cuVS进行GPU加速向量索引，速度提升10倍、成本降低75%；AWS获得NVIDIA GB300 Exemplar Cloud认证，确保大规模训练性能达到参考架构标准。

事件概述

NVIDIA与AWS宣布多项合作，旨在降低企业大规模部署AI的生产门槛。更新涵盖计算层（EC2 G7实例）、检索层（OpenSearch Serverless默认GPU向量索引）以及训练层（AWS获GB300 Exemplar Cloud认证），三项进展协同强化AI基础设施的每一层。

核心信息

1. Amazon EC2 G7实例：搭载NVIDIA RTX PRO 4500 Blackwell Server Edition GPU

性能提升：相较G6实例，AI推理性能提升至4.6倍，图形性能提升2.1倍，并借助NVIDIA cuDF库在Amazon EMR上显著加速Spark工作负载的数据分析。
配置规格：单实例最多支持8颗GPU，总显存256GB，700 Gbps EFA网络，最高7.6TB本地NVMe SSD存储；提供1、2、4、8 GPU及裸金属配置。
适用场景：AI推理、图形渲染、视频处理、模拟/CAD、虚拟桌面、游戏、空间计算，以及GPU加速数据分析与向量数据库工作负载。
集成支持：可通过AWS Deep Learning AMI、Deep Learning Containers、Amazon EMR、EKS、ECS及图形AMI使用，即将支持Amazon SageMaker AI。

2. NVIDIA cuVS让GPU加速向量搜索成为Amazon OpenSearch Serverless默认选项

新一代OpenSearch Serverless以NVIDIA cuVS库驱动的GPU向量索引作为所有向量集合的默认计算方式。
实际收益：向量索引构建速度最高提升10倍，成本仅为纯CPU方案的1/4；可在1小时内构建十亿级向量数据库。
团队构建RAG、语义搜索、推荐系统和智能体AI应用时，无需额外优化即可获得GPU级检索性能，且服务无服务器弹性伸缩，闲置时减少运维开销。

3. AWS获NVIDIA GB300 Exemplar Cloud认证

AWS针对GB300训练工作负载通过NVIDIA参考架构的性能基准测试，成为Exemplar Cloud。
该认证基于双方深度联合工程，确保开发者和AI负责人能够使用一致的高性能云基础设施进行大规模训练，帮助团队更可靠地评估云提供商、改善TCO并加速AI项目落地。

阅读原文详情

事件概述

核心信息

1. Amazon EC2 G7实例：搭载NVIDIA RTX PRO 4500 Blackwell Server Edition GPU

2. NVIDIA cuVS让GPU加速向量搜索成为Amazon OpenSearch Serverless默认选项

3. AWS获NVIDIA GB300 Exemplar Cloud认证

准备好启动您的定制项目了吗？