Google I/O 2026：Pichai 宣告 Gemini 进入智能体时代，模型调用量激增 7 倍

2026/05/20 01:45阅读量 13

Google 在 I/O 2026 上发布多项重大更新：旗下 AI 模型月均处理 token 量达到 3.2 千万亿，较去年增长 7 倍；Gemini 应用月活用户超 9 亿，翻倍增长。同时推出新功能 Ask YouTube、语音驱动的 Docs Live，以及全新多模态模型 Gemini Omni Flash，并公布第八代 TPU 及超大规模训练集群。CEO Sundar Pichai 表示 AI 已进入以智能体为核心的 Gemini 时代。

事件概述

Google I/O 2026 主题演讲上，CEO Sundar Pichai 正式提出“智能体 Gemini 时代”的概念，并公布一系列产品、模型和基础设施更新。Pichai 强调，AI 已从概念验证进入用户日常产品价值兑现阶段。

核心数据与规模

模型调用量：Google 各平台每月处理的 token 总量达到 3.2 千万亿（quadrillion），是去年 I/O 时的 7 倍（去年约 480 万亿）。
开发者生态：每月有超过 850 万开发者使用 Google 模型 API，每分钟处理约 190 亿 token。
企业客户：过去 12 个月中，超过 375 个 Google Cloud 客户各自使用超过 1 万亿 token。
产品用户：AI Overviews 月活用户超 25 亿；AI Mode（搜索最大升级）推出一年即拥有超 10 亿月活用户。Gemini 应用月活用户超过 9 亿（去年同期为 4 亿），日请求量增长超 7 倍。至今通过 Nano Banana 图像生成模型已产出超过 500 亿张图片。

新功能与产品更新

Ask YouTube：新功能使用户可以直接用自然语言提问，系统自动定位到视频中最相关的片段。已开始测试，将于今夏在美国全面推出。
Docs Live：语音驱动的文档创建功能。用户只需口述想法，Gemini 即可自动整理成文档。未来还将支持语音直接编辑。该功能今夏对订阅用户开放，随后语音能力将扩展到 Gmail 和 Keep。
Ask Maps：Maps 获得近十年来最大更新，支持用户提出更复杂、更长的询问。

基础设施与模型突破

TPU 第八代：分为训练专用 TPU 8t 和推理专用 TPU 8i。TPU 8t 的原始算力是上一代的近 3 倍；支持通过 JAX 和 Pathways 将训练任务跨多个数据中心分布，实现全球超过 100 万 TPU 联合训练，从而将更大模型训练时间从数月缩短至数周。TPU 8i 针对推理优化，大幅提升速度，且两款芯片每瓦性能比提高 2 倍。
资本支出：2026 年预计年资本支出 1800-1900 亿美元（2022 年为 310 亿美元）。
Gemini Omni Flash：全新的多模态模型，可从任意输入生成任意输出模态（先支持视频输出，后续支持图像和文本）。这是 Gemini 与生成式媒体模型的融合，被称为了解现实世界的飞跃。该模型即日起可用。

值得关注

Pichai 将当前阶段定义为“智能体 Gemini 时代”，标志着 AI 从被动响应转向主动执行任务。
Google 强调“全栈”AI 创新：从定制芯片（TPU）、模型（Gemini Omni）、到拥有数十亿用户的产品（搜索、地图、YouTube），形成闭环迭代。
语音交互成为本次 I/O 的重要升级方向，Docs Live 和 Ask YouTube 均指向更自然的对话式体验。

阅读原文详情

事件概述

核心数据与规模

新功能与产品更新

基础设施与模型突破

值得关注

准备好启动您的定制项目了吗？