Google Cloud Next '26:发布两款专为智能体时代打造的专用TPU芯片
2026/04/22 20:00阅读量 3
Google在Cloud Next '26大会上宣布推出两款新型专用TPU芯片,旨在满足AI智能体(AI agents)对推理、规划和多步骤工作流执行的高性能需求。其中TPU 8i专注于极速推理以优化用户体验,而TPU 8t则针对训练场景优化,支持在单一超大内存池中运行最复杂的模型。这两款芯片将作为全栈基础设施的核心引擎,推动响应式智能体AI的普及。
事件概述
Google在Cloud Next '26大会上正式推出了两款专为“智能体时代”(agentic era)设计的新型TPU芯片,旨在应对日益增长的AI工作负载需求,特别是支持能够自主推理、规划并执行多步骤任务的AI智能体。
核心信息
-
TPU 8i:
- 定位:专为推理(Inference)设计。
- 核心能力:旨在让AI智能体极快地完成推理任务,确保用户获得流畅的体验。
- 应用场景:适用于需要快速响应的智能体工作流。
-
TPU 8t:
- 定位:专为训练(Training)优化。
- 核心能力:能够在单一的超大内存池(massive pool of memory)中运行最复杂的模型。
- 应用场景:支持大规模模型的训练需求。
战略意义
这两款芯片是Google全栈专用基础设施(涵盖网络、数据中心及节能运营)的关键组成部分。它们共同构成了底层引擎,旨在将高响应速度的智能体AI技术推向大众市场,重新定义AI的可能性边界。
