Google I/O 2026:Pichai 宣告 Gemini 进入智能体时代,模型调用量激增 7 倍
2026/05/20 01:45阅读量 13
Google 在 I/O 2026 上发布多项重大更新:旗下 AI 模型月均处理 token 量达到 3.2 千万亿,较去年增长 7 倍;Gemini 应用月活用户超 9 亿,翻倍增长。同时推出新功能 Ask YouTube、语音驱动的 Docs Live,以及全新多模态模型 Gemini Omni Flash,并公布第八代 TPU 及超大规模训练集群。CEO Sundar Pichai 表示 AI 已进入以智能体为核心的 Gemini 时代。
事件概述
Google I/O 2026 主题演讲上,CEO Sundar Pichai 正式提出“智能体 Gemini 时代”的概念,并公布一系列产品、模型和基础设施更新。Pichai 强调,AI 已从概念验证进入用户日常产品价值兑现阶段。
核心数据与规模
- 模型调用量:Google 各平台每月处理的 token 总量达到 3.2 千万亿(quadrillion),是去年 I/O 时的 7 倍(去年约 480 万亿)。
- 开发者生态:每月有超过 850 万开发者使用 Google 模型 API,每分钟处理约 190 亿 token。
- 企业客户:过去 12 个月中,超过 375 个 Google Cloud 客户各自使用超过 1 万亿 token。
- 产品用户:AI Overviews 月活用户超 25 亿;AI Mode(搜索最大升级)推出一年即拥有超 10 亿月活用户。Gemini 应用月活用户超过 9 亿(去年同期为 4 亿),日请求量增长超 7 倍。至今通过 Nano Banana 图像生成模型已产出超过 500 亿张图片。
新功能与产品更新
- Ask YouTube:新功能使用户可以直接用自然语言提问,系统自动定位到视频中最相关的片段。已开始测试,将于今夏在美国全面推出。
- Docs Live:语音驱动的文档创建功能。用户只需口述想法,Gemini 即可自动整理成文档。未来还将支持语音直接编辑。该功能今夏对订阅用户开放,随后语音能力将扩展到 Gmail 和 Keep。
- Ask Maps:Maps 获得近十年来最大更新,支持用户提出更复杂、更长的询问。
基础设施与模型突破
- TPU 第八代:分为训练专用 TPU 8t 和推理专用 TPU 8i。TPU 8t 的原始算力是上一代的近 3 倍;支持通过 JAX 和 Pathways 将训练任务跨多个数据中心分布,实现全球超过 100 万 TPU 联合训练,从而将更大模型训练时间从数月缩短至数周。TPU 8i 针对推理优化,大幅提升速度,且两款芯片每瓦性能比提高 2 倍。
- 资本支出:2026 年预计年资本支出 1800-1900 亿美元(2022 年为 310 亿美元)。
- Gemini Omni Flash:全新的多模态模型,可从任意输入生成任意输出模态(先支持视频输出,后续支持图像和文本)。这是 Gemini 与生成式媒体模型的融合,被称为了解现实世界的飞跃。该模型即日起可用。
值得关注
- Pichai 将当前阶段定义为“智能体 Gemini 时代”,标志着 AI 从被动响应转向主动执行任务。
- Google 强调“全栈”AI 创新:从定制芯片(TPU)、模型(Gemini Omni)、到拥有数十亿用户的产品(搜索、地图、YouTube),形成闭环迭代。
- 语音交互成为本次 I/O 的重要升级方向,Docs Live 和 Ask YouTube 均指向更自然的对话式体验。
