谷歌发布Gemini 3.5系列:前沿智能与行动能力结合,3.5 Flash率先上线
谷歌推出Gemini 3.5系列,首发3.5 Flash模型,主打代理(Agent)和编码能力,性能超越前代旗舰,推理速度是其他前沿模型的4倍。该模型已集成至Gemini应用、AI Mode搜索、Antigravity平台等,并用于多个企业合作场景(如Shopify、Macquarie Bank)。同时宣布Gemini Spark个人AI代理开始测试。
事件概述
谷歌于2026年5月19日发布Gemini 3.5系列模型,首发3.5 Flash版本,强调将“前沿智能”与“行动能力”结合,旨在构建更强大的智能代理(Agent)。该模型已在Gemini应用、Google搜索的AI Mode、开发者平台Google Antigravity、Gemini API等渠道面向全球用户和企业开放。
关键能力与性能
-
代理与编码性能领先:3.5 Flash在多种基准测试中超越前代旗舰模型Gemini 3.1 Pro,包括:
- Terminal-Bench 2.1(76.2%)
- GDPval-AA(1656 Elo)
- MCP Atlas(83.6%)
- 多模态理解CharXiv Reasoning(84.2%)
-
速度优势:每秒输出token数是其他前沿模型的4倍,在“智能-速度”象限中处于顶级区域。
-
多模态与图形能力:基于Gemini 3的多模态基础,3.5 Flash能生成更丰富、交互性更强的Web UI和图形,例如在AI Studio中创建交互式动画、将文本描述转化为交互式硬件等。
应用与企业合作案例
3.5 Flash已在多个行业伙伴中产生实际效益:
- Shopify:并行运行子代理(子Agent)分析复杂数据,实现长期准确的商家增长预测。
- Macquarie Bank:试点用于加速客户入职,推理100页以上的复杂文档,低延迟检索信息并提供可靠建议。
- Salesforce:集成至Agentforce,通过多子代理协同保留上下文并执行复杂多轮工具调用。
- Ramp:结合多模态理解和历史推理,实现更智能、更可靠的OCR(发票识别)。
- Xero:部署代理自动管理多周工作流,如识别供应商、收集1099税表所需信息。
- Databricks:利用代理工作流实时监控、检索信息,推理大规模数据集以诊断问题、提出解决方案。
个人AI代理:Gemini Spark
3.5 Flash成为Gemini应用和AI Mode搜索的默认模型。同时推出基于3.5 Flash的Gemini Spark个人AI代理(24/7运行,在用户指令下执行操作),已向受信任测试者开放,下周起将向美国Google AI Ultra订阅用户提供Beta版。
安全措施
Gemini 3.5按照“前沿安全框架”(Frontier Safety Framework)开发,加强了网络和CBRN(化学、生物、辐射、核)安全防护,降低有害内容生成率和错误拒绝安全查询的概率。新增可解释性工具,可在生成响应前检查AI内部推理。
可用性
3.5 Flash已通过以下渠道全面开放:
- 面向所有人:Gemini应用、Google搜索的AI Mode
- 面向开发者:Google Antigravity(代理优先开发平台)、Gemini API(AI Studio、Android Studio)
- 面向企业:Gemini Enterprise Agent Platform、Gemini Enterprise
3.5 Pro版本正在内部使用,预计下月推出。
